🔥 OpenAI & Anthropic 双王炸:GPT-5.3-Codex 与 Claude Opus 4.6 同日发布(含用户即时评价)

今天是 2026 年 2 月 5 日,AI 界的“超级星期五”。OpenAI 和 Anthropic 不约而同地亮出了底牌。根据 Reddit、Hacker News 上第一波用户的反馈,战况比预想的要复杂,甚至有点“割裂”。


🤖 OpenAI: GPT-5.3-Codex

"想接管你的电脑,而且它真的变强了"

GPT-5.3-Codex 现在的定位是全能 Agent

用户评价:👍 代码与终端操作强: 很多开发者反馈它在 Terminal Bench 上碾压了对手(77.3% vs 64%),是目前最强的 CLI 操作者。有用户直言:“它虽然慢,但写出来的东西是对的,不用我再去擦屁股。”
👍 自我修复: 它不只是写代码,还能自己跑测试、查错、修 bug。
👎 速度慢: 因为要读更多上下文、做更多检查,反应速度明显不如 Claude Code。
👎 甚至有点“啰嗦”: 有人吐槽它太爱聊天了,而 Claude 更直接。


🧠 Anthropic: Claude Opus 4.6

"代码更强了,但...灵魂呢?"

Anthropic 这次让人又爱又恨。

用户评价:👍 编码能力提升: 升级后的 Claude Code 在 SWE-bench 上得分很高(80.8%),写代码确实更利索了。
👎 写作能力“被阉割”: 这是最大的槽点。大量用户(包括 Hack News 和 Reddit)抱怨 Opus 4.6 的写作质量下降,甚至有人用“Lobotomized”(切除脑叶)来形容。它写出来的东西变得干瘪、缺乏灵气,甚至不如上一代 Opus 4.5。
⚠️ 建议: 现在的共识是——写代码用 Opus 4.6,写文章/搞创作请坚守 Opus 4.5


⚡️ Agili 的看法

现在的局面很有趣:

OpenAI 赢在**“干脏活累活”**(OS 操作、终端调试),它想做那个不嫌麻烦的超级实习生。
Anthropic 赢在**“快和灵”(Claude Code 体验依然丝滑),但在通用写作**上似乎为了强化逻辑而牺牲了文采。
给你的建议:
如果你是写代码的,哪怕慢点,GPT-5.3-Codex 值得一试;如果你是写周刊、做内容的,先别急着把 Claude Opus 4.5 换掉,现在的 4.6 可能写不出你要的那种“人味儿”。

#AI #OpenAI #Anthropic #GPT5 #ClaudeOpus #真实评测
 
 
Back to Top