CodeGraph 是一个专为 Claude Code、Cursor、Codex、OpenCode 等 AI 编程 Agent 打造的预索引代码知识图谱工具。
它能让 AI 不再每次都通过 grep、read、explore 盲目扫描代码,而是直接查询一个语义化知识图谱,实现更快、更省、更准的代码理解与开发。
📮投稿 📢频道 💬吹水 🌐网站
这是一款提供全天候免提协助的智能眼镜,将于今秋上市。
新款音频眼镜可让 Gemini 随时为你提供帮助,比如拍照、在新城市导航,或将音频内容进行实时翻译。Audio Glasses支持与 Android 及 iOS 手机配对使用。
• Gemini 月活用户达9 亿
谷歌搜索现在由Gemini 3.5加持、具备大规模执行任务能力
该功能将先向 Google AI Pro 和 Ultra 订阅用户逐步推出
Google 推出CodeMender API,一种代码安全代理,可自动发现并修复关键的软件漏洞。
今天,我们将邀请一小部分精选专家来进行测试,并计划很快更广泛地推出。
面向科学的 Gemini,旨在加速科研进程
Gemini 已经可以帮助解决复杂问题,而我们全新的 GoogleLabs 原型还能进一步简化更多日常科研任务,包括:
• 跟进最新论文
• 把研究目标转化成可直接使用的代码
• 生成新的假设
AI 模拟是面向科学的中另一个强有力的工具,能够帮助我们理解并预测动态系统。
Google 推出Google Pics
Google Workspace 新增一款全新产品,让你获得更强的创作掌控力。
这是一款图像创建与编辑工具,几乎能帮你做出任何想要的作品——比如派对传单和信息图表。它会自动识别并分割照片中的各个对象,理解它们之间的关系,让你只需点击几下就能轻松完成编辑。
Pics 将于今天先向一小部分“可信测试员”开放,随后在今年夏天晚些时候,面向全球的 Google AI Pro 和 Ultra 订阅用户推出。
Stitch by Google现在能够实时生成移动端和 Web 应用的界面(UI)
今天起开始免费向全球用户逐步推出。
你可以让 Stitch 根据你的提示设计一款移动端应用,并通过语音和文字编辑备注对设计进行打磨——就像和设计伙伴协作一样。准备上线时,可将设计导入 Google Antigravity 或 GoogleAIStudio ,并进行发布。
Google Flow多项更新
• 新增Gemini Omni Flash:只需提供简短提示和风格参考,Gemini Omni 就能在保留原始性能的同时,改变现有场景的环境,添加视觉效果及其他元素。
• 新增Google Flow 代理:集成Gemini 的智能代理能力,现在你的智能体可以同时执行多个操作。该代理还能凭借对上下文的精准理解,完成大规模编辑任务。
• 新增Google Flow 工具:现在你可以为任何你想到的创意工具“尽情编写代码”,比如设计视频特效或手绘动画。你还能在Google Flow上直接创建、分享并对这些工具进行再创作(remix)。
• 新增Google Flow Music:还在脑海里挥之不去的旋律?现在你可以在 Google Flow Music 上创作自己的歌曲。你只要把即兴创作录进 Google Flow Music,并用你想要的音乐风格来给它下指令——比如更精致的 R&B。Google Flow Music 会先给你打好基础,之后你就能直接在这个工具里继续微调完善。
新增 Universal Cart(环球购物车),Google 上全新的购物中心
你可以在Google引擎、Gemini App、YouTube或Gmail购物时,将商品添加到购物车。
系统将查找优惠和降价信息,给你带来价格历史的洞察,并在某件商品重新上架时及时提醒你。
它能帮你发现隐藏的优惠。由于它是基于 Google 钱包打造的,你的购物车会识别你的支付方式特权、会员/忠诚度信息以及商家优惠,这样你就不会错过任何优惠或积分。
• 通用商务协议(Universal Commerce Protocol:一项开源标准,它为代理和系统提供共同语言,使所有关键参与者能够携手协作。
• Agent Payments Protocol(AP2):让你的 AI 代理在明确边界与责任的框架下,安全地替你完成支付。
• Android Halo: 为你的代理在 Android 设备上提供的全新空间。今年晚些时候,它将让你一眼掌握各个代理的状态,从屏幕顶部就能直接看到他们的进展。Halo 将支持与 Gemini Spark 及其他兼容的智能代理协同工作。
▎Codex 登陆 ChatGPT 移动端:可在 iOS 和 Android 上查看、审批和控制编程任务
OpenAI 将 Codex 接入 ChatGPT 移动端。用户现在可以直接在 iOS 和 Android 的 ChatGPT App 中查看和控制 Codex 任务,不必一直守在电脑前。OpenAI 称,移动端 Codex 会连接到正在运行 Codex 的设备或远程环境,包括笔记本、Mac mini 或托管远程环境,并同步当前线程、审批、插件和项目上下文。
这次更新的重点在“远程接管开发流程”。用户可以在手机上查看 Codex 的实时工作状态,检查代码输出、批准操作、切换模型、继续已有线程,也可以启动新的编程任务。The Verge 报道称,本地文件、凭据和环境仍保留在用户机器上,手机端主要接收实时状态、截图和测试结果等信息。
Codex 的使用场景从“坐在电脑前写代码”已经进一步扩展到“让电脑或远程环境继续跑任务,人在手机上审批和跟进”。对于经常使用 AI coding agent 的开发者来说,移动端的接入极大程度上方便了处理长时间构建、测试、修复和代码审查流程。
频道 @AppDoDo 官推 APPDOTG
Multica 的核心理念是把各种编码 AI Agent变成真正的团队队友。
不再需要手动复制提示词,而是像分配任务给同事一样,把 Issue 指派给 Agent,让它们自主执行、汇报进度、积累技能。
➡️ Agent 即队友:每个 Agent 有独立档案、出现在看板上、能发表评论、创建 Issue、主动报告阻塞,像人类同事一样协作。➡️ 完整任务生命周期管理:自主认领、执行、实时进度推送(WebSocket)、完成/失败处理。➡️ 可复用技能系统:Agent 每次解决的问题都会变成团队共享的“技能”,让团队能力随时间持续增长。➡️ 多 Agent 多 Runtime 支持:兼容 Claude Code、OpenAI Codex、GitHub Copilot CLI、OpenClaw、OpenCode、Hermes、Gemini、Pi、Cursor Agent、Kimi、Kiro CLI 等,几乎覆盖主流编码 Agent。
📮投稿 📢频道 💬吹水 🌐网站
GPT-5.5 今天已在 ChatGPT 和 Codex 上向 Plus、Pro、Business 与Enterprise用户开放推出。
我们还在 ChatGPT 中向 Pro、Business 和 Enterprise 用户提供了 GPT-5.5 Pro。
一种面向实际工作的全新智能类型,为智能代理赋能——能理解复杂目标、使用工具、核验结果,并把更多任务彻底完成。它代表着完成计算机工作的全新方式。
GPT-5.5 在编写和调试代码、在线研究、分析数据、创建文档和电子表格、操作软件以及在工具间切换直到任务完成方面表现出色。
在真实应用场景中,GPT-5.5 的每token延迟与 GPT-5.4 相当,但在我们所做的几乎所有评测中都表现更优。
在完成相同 Codex 任务时,它使用的 token 明显更少,因此不仅更高效,表现也更出色。
在 ChatGPT 中的全栈推理改进让模型在更快的速度下具备更强的能力。
▎OpenAI 推出 GPT‑5.5,迄今为止最强的代理编码模型
OpenAI 于 2026 年 4 月 23 日正式发布 GPT-5.5,并将其定位为“面向真实工作的新一类智能”。官方表示,GPT-5.5 在理解复杂任务意图、跨工具持续执行、检查结果以及完成多步骤工作方面更强,重点能力覆盖写代码、在线研究、数据分析、生成文档与表格、操作软件等场景。
在编程能力方面,OpenAI 给出的数据称,GPT-5.5 在 Terminal-Bench 2.0 上达到 82.7%,在 SWE-Bench Pro 上达到 58.6%,并在其内部用于长周期编程任务评估的 Expert-SWE 上继续领先 GPT-5.4。官方认为,这意味着它在复杂命令行流程、真实 GitHub issue 修复、跨大规模代码库保持上下文、处理模糊故障和调用工具验证假设等方面更强。
在知识工作场景中,OpenAI 表示 GPT-5.5 在 Codex 里生成文档、表格和幻灯片的表现优于 GPT-5.4。公司内部团队已将其用于演讲请求分析、税务材料审阅和业务周报自动化等任务。官方还称,目前 OpenAI 内部已有超过 85% 的员工每周使用 Codex,涉及软件工程、财务、传播、市场、数据科学和产品管理等岗位。
GPT-5.5 已开始向 ChatGPT 和 Codex 的 Plus、Pro、Business、Enterprise 用户推出,GPT-5.5 Pro 则面向 Pro、Business、Enterprise 用户开放。OpenAI 同时表示,API 部署需要额外安全措施,正在与合作伙伴推进,GPT-5.5 和 GPT-5.5 Pro “很快”也会进入 API。
频道 @AppDoDo 官推 APPDOTG
Huashu Design - 一个专为 Claude Code / Cursor / Codex 等 AI 编码代理设计的 HTML 原生设计 Skill
开发者(小猫补光灯作者)声称逆向了「Claude Design」,并做成了一个 Skill。
这是一个内置了 20 条设计哲学 + 5 维专家评审 + 品牌资产协议 + 动效引擎的完整设计工作流。
看效果倒是非常不错,所以推荐之。实际体验不知道(暂时没token了),毕竟自媒体很多时候是噱头大于实际价值的。
📮投稿 📢频道 💬吹水 🌐网站
Karpathy 最近在 X 上分享了他用 LLM 来管理个人知识库的方法[Link],这个帖子很快爆火,核心思路是把 LLM 当成知识编译器,而不是单纯的问答工具或代码生成器。
MindOS 就是把 Karpathy 的思路完全产品化,核心理念是人类负责思考、审视和演化想法,AI Agents 负责执行任务、反思并提炼标准操作流程(SOP)
直接将这句话发给 Agent 就可以开始了:
帮我从 https://github.com/GeminiLight/MindOS 安装 MindOS,包含 MCP 和 Skills,使用中文模板。📮投稿 📢频道 💬吹水 🌐网站
Claude Sonnet 4.6 是我们目前最强大的 Sonnet 模型,对编码、电脑操作、长上下文推理、智能体规划、知识类工作和设计能力都进行了全面升级。Sonnet 4.6 还在测试阶段支持 100 万token的上下文窗口。
价格与 Sonnet 4.5 相同,起价为每百万token $3 输出/ $15 输出。
对于我们的免费和Pro计划用户,Claude Sonnet 4.6 现已在 claude.ai 和 Claude Cowork 中设为默认模型。
🔥 OpenAI & Anthropic 双王炸:GPT-5.3-Codex 与 Claude Opus 4.6 同日发布(含用户即时评价)
今天是 2026 年 2 月 5 日,AI 界的“超级星期五”。OpenAI 和 Anthropic 不约而同地亮出了底牌。根据 Reddit、Hacker News 上第一波用户的反馈,战况比预想的要复杂,甚至有点“割裂”。
🤖 OpenAI: GPT-5.3-Codex
"想接管你的电脑,而且它真的变强了"
GPT-5.3-Codex 现在的定位是全能 Agent。
• 用户评价: • 👍 代码与终端操作强: 很多开发者反馈它在 Terminal Bench 上碾压了对手(77.3% vs 64%),是目前最强的 CLI 操作者。有用户直言:“它虽然慢,但写出来的东西是对的,不用我再去擦屁股。”
• 👍 自我修复: 它不只是写代码,还能自己跑测试、查错、修 bug。
• 👎 速度慢: 因为要读更多上下文、做更多检查,反应速度明显不如 Claude Code。
• 👎 甚至有点“啰嗦”: 有人吐槽它太爱聊天了,而 Claude 更直接。
🧠 Anthropic: Claude Opus 4.6
"代码更强了,但...灵魂呢?"
Anthropic 这次让人又爱又恨。
• 用户评价: • 👍 编码能力提升: 升级后的 Claude Code 在 SWE-bench 上得分很高(80.8%),写代码确实更利索了。
• 👎 写作能力“被阉割”: 这是最大的槽点。大量用户(包括 Hack News 和 Reddit)抱怨 Opus 4.6 的写作质量下降,甚至有人用“Lobotomized”(切除脑叶)来形容。它写出来的东西变得干瘪、缺乏灵气,甚至不如上一代 Opus 4.5。
• ⚠️ 建议: 现在的共识是——写代码用 Opus 4.6,写文章/搞创作请坚守 Opus 4.5。
⚡️ Agili 的看法
现在的局面很有趣:
• OpenAI 赢在**“干脏活累活”**(OS 操作、终端调试),它想做那个不嫌麻烦的超级实习生。
• Anthropic 赢在**“快和灵”(Claude Code 体验依然丝滑),但在通用写作**上似乎为了强化逻辑而牺牲了文采。
给你的建议:
如果你是写代码的,哪怕慢点,GPT-5.3-Codex 值得一试;如果你是写周刊、做内容的,先别急着把 Claude Opus 4.5 换掉,现在的 4.6 可能写不出你要的那种“人味儿”。
#AI #OpenAI #Anthropic #GPT5 #ClaudeOpus #真实评测
今天是 2026 年 2 月 5 日,AI 界的“超级星期五”。OpenAI 和 Anthropic 不约而同地亮出了底牌。根据 Reddit、Hacker News 上第一波用户的反馈,战况比预想的要复杂,甚至有点“割裂”。
🤖 OpenAI: GPT-5.3-Codex
"想接管你的电脑,而且它真的变强了"
GPT-5.3-Codex 现在的定位是全能 Agent。
• 用户评价: • 👍 代码与终端操作强: 很多开发者反馈它在 Terminal Bench 上碾压了对手(77.3% vs 64%),是目前最强的 CLI 操作者。有用户直言:“它虽然慢,但写出来的东西是对的,不用我再去擦屁股。”
• 👍 自我修复: 它不只是写代码,还能自己跑测试、查错、修 bug。
• 👎 速度慢: 因为要读更多上下文、做更多检查,反应速度明显不如 Claude Code。
• 👎 甚至有点“啰嗦”: 有人吐槽它太爱聊天了,而 Claude 更直接。
🧠 Anthropic: Claude Opus 4.6
"代码更强了,但...灵魂呢?"
Anthropic 这次让人又爱又恨。
• 用户评价: • 👍 编码能力提升: 升级后的 Claude Code 在 SWE-bench 上得分很高(80.8%),写代码确实更利索了。
• 👎 写作能力“被阉割”: 这是最大的槽点。大量用户(包括 Hack News 和 Reddit)抱怨 Opus 4.6 的写作质量下降,甚至有人用“Lobotomized”(切除脑叶)来形容。它写出来的东西变得干瘪、缺乏灵气,甚至不如上一代 Opus 4.5。
• ⚠️ 建议: 现在的共识是——写代码用 Opus 4.6,写文章/搞创作请坚守 Opus 4.5。
⚡️ Agili 的看法
现在的局面很有趣:
• OpenAI 赢在**“干脏活累活”**(OS 操作、终端调试),它想做那个不嫌麻烦的超级实习生。
• Anthropic 赢在**“快和灵”(Claude Code 体验依然丝滑),但在通用写作**上似乎为了强化逻辑而牺牲了文采。
给你的建议:
如果你是写代码的,哪怕慢点,GPT-5.3-Codex 值得一试;如果你是写周刊、做内容的,先别急着把 Claude Opus 4.5 换掉,现在的 4.6 可能写不出你要的那种“人味儿”。
#AI #OpenAI #Anthropic #GPT5 #ClaudeOpus #真实评测
Manus 的联合创始人兼首席执行官肖弘,将向 Meta 的首席运营官哈维尔·奥利万汇报。
据《WSJ》报道,Meta 平台同意收购新加坡的 AI 创业公司 Manus,这是一家由中国创始人创立、进行深度研究并为付费用户提供各种服务的公司。
据知情人士透露,Meta 以超过 20 亿美元的价格完成了这笔交易。有些人说,当 Meta 接触这家公司时,Manus 正寻求进行新一轮融资,估值为 20 亿美元。
Meta 表示,他们打算继续运营和销售 Manus 的服务,还会把这个 AI 助手整合到自己社交媒体产品的阵容中。此前,Meta 曾宣传过一些所谓的开源模型,这些模型大多是免费开放的,用户可以随意使用、修改或者分发。
Manus 自春季推出以来,已经吸引了数百万用户,其中一些用户通过订阅付费,使用它的模型进行分析、编码等各种任务。
OpenAI发布了GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代Agentic编码模型。
相较于之前的模型,GPT‑5.1-Codex-Max采用了“压缩(compaction)”技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的Token。OpenAI表示,该模型不仅性能提升,还实现了更快、更高效的Token利用率。
OpenAI在此前发布GPT-5-Codex模型时表示,计划很快在API中提供GPT-5-Codex,现在OpenAI已经更新博客文章,用户可以通过API使用GPT-5 Codex,GPT‑5 Codex的价格与GPT‑5相同。
此外,OpenRouter已上架GPT-5 Codex,价格为:输入1.25美元/每百万tokens,输出10美元/每百万tokens。
模型介绍:
GPT-5-Codex是GPT-5的一个专门版本,针对软件工程和编码工作流程进行了优化。它既适用于交互式开发会话,也适用于长时间独立执行复杂的工程任务。该模型支持从头构建项目、功能开发、调试、大规模重构和代码审查。与GPT-5相比,GPT-5-Codex更具可操作性,能够严格遵循开发者的指令,并生成更清晰、更高质量的代码。推理工作量可以通过参数进行调整。
GPT-5-Codex可以集成到各种开发者环境中,包括CLI、IDE扩展、GitHub和云任务。它可以动态调整推理工作量,为小型任务提供快速响应,同时为大型项目维持长达数小时的运行。该模型经过训练,可以执行结构化代码审查,通过推理并根据测试验证行为来发现代码的关键缺陷。它还支持用于UI开发的多模态输入(例如图像或屏幕截图),并集成了用于搜索、依赖项安装和环境设置的工具。专为Agent编码应用程序设计。
via 匿名
「迄今为止最先进的 AI 系统。GPT-5 在编码、数学、写作、健康、视觉感知等方面都超越了我们所有的前代模型,展现了最顶尖的性能。」官方如是说。
▫️统一的系统:GPT-5 不再区分传统意义上的推理模型、多模态模型和 Agent 模型,而是将这些能力集成在一个统一架构下。实时路由器会根据对话类型、复杂性、工具需求以及意图判断调用什么模型。
▫️幻觉降低 :与 GPT-4o 相比,事实错误率降低了 45%;在深度思考模式下,错误率更比 o3 下降了 80%。
▫️编码能力提升:通过一轮提示即可生成完整、美观、响应式的网站/应用/游戏,对排版、留白、层次结构等设计原则的理解能力显著增强。
▫️写作能力提升:能理解并创作具有文学深度和韵律的作品,比如写出结构自然的自由诗。
▫️AI 健康:在健康问题上,它不再只是给答案,而是像一个思维伙伴,会主动提问、标记潜在风险,帮你更好地与医生沟通。
GPT-5:对所有用户免费开放( https://chatgpt.com/ )
GPT-5 Pro: Pro 版拥有「扩展推理」能力,会花更长时间进行并行计算,提供最全面、最精准的答案。200 美元/月即可解锁!
#AI #agent #开源
🐋 AgenticSeek - 一款开源、完全本地运行的 ManusAI 替代品
Manus 替代品层出不穷,不过能上榜的寥寥无几,AgenticSeek 目前已经斩获 12k Star!
AgenticSeek 完全在本地运行,注重隐私安全。核心功能方面与 Manus 差别不大,支持智能网页浏览、自主编码、智能选择代理、规划与执行复杂任务等功能
⭐️ Features
📮投稿 📢频道 💬群聊 🔎索引
🐋 AgenticSeek - 一款开源、完全本地运行的 ManusAI 替代品
Manus 替代品层出不穷,不过能上榜的寥寥无几,AgenticSeek 目前已经斩获 12k Star!
AgenticSeek 完全在本地运行,注重隐私安全。核心功能方面与 Manus 差别不大,支持智能网页浏览、自主编码、智能选择代理、规划与执行复杂任务等功能
⭐️ Features
▫️网页代理:使用 Selenium 进行自主的网页搜索和浏览
▫️代码代理:半自主的编码能力,支持自动尝试和重试
▫️文件代理:bash 执行和文件系统交互
▫️路由系统:根据用户提示选择最佳代理
▫️会话管理:保存和加载之前的对话
▫️API 工具:集成 API 工具,暂时只有网页和航班搜索
▫️记忆系统:个体代理记忆和压缩
▫️文字转语音 & 语音转文字
▫️.....
📮投稿 📢频道 💬群聊 🔎索引
#AI #Claude #大模型
⭐️ Anthropic 发布「全球最强的」编程大模型:Claude Opus 4 和 Claude Sonnet 4
体验(Sonnet免费): claude.ai/new
Anthropic 称,Opus 4 是目前全球最强的编程大模型,能够稳定胜任复杂且持续时间长的任务和 Agent 工作流。
而 Sonnet 4 则着重强化了编程和推理能力,能更精准地响应用户的指令。
此外,Anthropic 还同步推出了以下新功能:
📮投稿 📢频道 💬群聊 🔎索引
⭐️ Anthropic 发布「全球最强的」编程大模型:Claude Opus 4 和 Claude Sonnet 4
体验(Sonnet免费): claude.ai/new
Anthropic 称,Opus 4 是目前全球最强的编程大模型,能够稳定胜任复杂且持续时间长的任务和 Agent 工作流。
而 Sonnet 4 则着重强化了编程和推理能力,能更精准地响应用户的指令。
此外,Anthropic 还同步推出了以下新功能:
▫️工具辅助的延伸思考:Claude 模型在进行深入思考时,能够交替使用工具(如网页搜索),以优化推理过程和回复质量。
▫️新增模型能力:两款模型可并行使用工具,执行更精确的指令,并在开发者授权下,提升记忆能力,能提取并保存关键信息,保持上下文连贯。
▫️Claude Code 正式发布:Claude Code 现已支持 GitHub Actions、VS Code 和 JetBrains。
▫️新的 API 功能:Anthropic API 新增四项功能,包括代码执行工具、MCP 连接器、文件 API 和最长可缓存 1 小时的提示缓存功能。
📮投稿 📢频道 💬群聊 🔎索引