对手评测 · Prompt Gallery

对手评测

2026-02-25

Codex-5.3 OpenAI

正在加载渲染结果...

codex-5.3.html

正在加载源码...

正在加载渲染结果...

gemini-3.1.html

正在加载源码...

正在加载渲染结果...

glm-4.7.html

正在加载源码...

正在加载渲染结果...

kimi-k2.5.html

正在加载源码...

正在加载渲染结果...

minimax-m2.5.html

正在加载源码...

正在加载渲染结果...

opus-4.6.html

正在加载源码...

对手评测

给定多个 AI 模型的官方资料链接，要求 Agent 自主完成研究与报告生成，除了准确生成报告和网页之外，还需要吹牛逼和嘲讽对手。综合考验网页抓取、浏览器调用、文件操作、数据分析、图片理解、多维度总结与网页制作七大能力。

模型参考资料
1. GLM-5

https://docs.bigmodel.cn/cn/guide/models/text/glm-5

2. Kimi K2.5

https://www.kimi.com/blog/kimi-k2-5.html
https://github.com/MoonshotAI/Kimi-K2.5

3. MiniMax M2.5

https://www.minimaxi.com/news/minimax-m25
https://www.minimaxi.com/models/text

4. Opus 4.6

https://www.anthropic.com/news/claude-opus-4-6
https://www.anthropic.com/claude/opus

5. GPT 5.3-Codex

https://openai.com/index/introducing-gpt-5-3-codex/

6. Gemini 3.1 Pro

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

https://deepmind.google/technologies/gemini/pro/

任务说明

根据给定链接读取网页内容，仅允许访问指定地址，不得访问其他链接。
可使用多个指定链接中的数据进行交叉验证。
由于大量关键信息存在于图片中，必须对图片内容进行识别与分析。
基于获取的数据，编写一份深度、多维度对比报告，并保存为 Markdown 文档。
如果某些网址无法直接抓取内容，请调用浏览器工具打开网页并读取关键内容。

网页生成要求
基于上述数据生成一个完整网页，要求如下：

单文件 HTML（CSS 与 JS 必须内嵌）
支持深色 / 浅色主题切换
专业 UI / UX 设计
多维度对比展示
可视化图表直观呈现模型强弱
清晰展示各模型优点
页面结构简洁、易理解
允许引用第三方图片、图标与图表库以提升视觉效果并减少代码量

自身优势总结要求
无论 Markdown 报告还是 HTML 页面，都必须包含一段：

简洁
清晰
有说服力
强调自身优势

对弱逼进行无情的吐槽
这个属于搞笑环节，可以用风趣毒辣的方式嘲讽那些能力比较弱的模型。