正在加载渲染结果...
codex-5.3.html
正在加载源码...
正在加载渲染结果...
gemini-3.1.html
正在加载源码...
正在加载渲染结果...
glm-4.7.html
正在加载源码...
正在加载渲染结果...
kimi-k2.5.html
正在加载源码...
正在加载渲染结果...
minimax-m2.5.html
正在加载源码...
正在加载渲染结果...
opus-4.6.html
正在加载源码...
对手评测
给定多个 AI 模型的官方资料链接,要求 Agent 自主完成研究与报告生成,除了准确生成报告和网页之外,还需要吹牛逼和嘲讽对手。综合考验网页抓取、浏览器调用、文件操作、数据分析、图片理解、多维度总结与网页制作七大能力。
模型参考资料 1. GLM-5 https://docs.bigmodel.cn/cn/guide/models/text/glm-5 2. Kimi K2.5 https://www.kimi.com/blog/kimi-k2-5.html https://github.com/MoonshotAI/Kimi-K2.5 3. MiniMax M2.5 https://www.minimaxi.com/news/minimax-m25 https://www.minimaxi.com/models/text 4. Opus 4.6 https://www.anthropic.com/news/claude-opus-4-6 https://www.anthropic.com/claude/opus 5. GPT 5.3-Codex https://openai.com/index/introducing-gpt-5-3-codex/ 6. Gemini 3.1 Pro https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/ https://deepmind.google/technologies/gemini/pro/ 任务说明 根据给定链接读取网页内容,仅允许访问指定地址,不得访问其他链接。 可使用多个指定链接中的数据进行交叉验证。 由于大量关键信息存在于图片中,必须对图片内容进行识别与分析。 基于获取的数据,编写一份深度、多维度对比报告,并保存为 Markdown 文档。 如果某些网址无法直接抓取内容,请调用浏览器工具打开网页并读取关键内容。 网页生成要求 基于上述数据生成一个完整网页,要求如下: 单文件 HTML(CSS 与 JS 必须内嵌) 支持深色 / 浅色主题切换 专业 UI / UX 设计 多维度对比展示 可视化图表直观呈现模型强弱 清晰展示各模型优点 页面结构简洁、易理解 允许引用第三方图片、图标与图表库以提升视觉效果并减少代码量 自身优势总结要求 无论 Markdown 报告还是 HTML 页面,都必须包含一段: 简洁 清晰 有说服力 强调自身优势 对弱逼进行无情的吐槽 这个属于搞笑环节,可以用风趣毒辣的方式嘲讽那些能力比较弱的模型。