Multica 的核心理念是把各种编码 AI Agent变成真正的团队队友。
不再需要手动复制提示词,而是像分配任务给同事一样,把 Issue 指派给 Agent,让它们自主执行、汇报进度、积累技能。
➡️ Agent 即队友:每个 Agent 有独立档案、出现在看板上、能发表评论、创建 Issue、主动报告阻塞,像人类同事一样协作。➡️ 完整任务生命周期管理:自主认领、执行、实时进度推送(WebSocket)、完成/失败处理。➡️ 可复用技能系统:Agent 每次解决的问题都会变成团队共享的“技能”,让团队能力随时间持续增长。➡️ 多 Agent 多 Runtime 支持:兼容 Claude Code、OpenAI Codex、GitHub Copilot CLI、OpenClaw、OpenCode、Hermes、Gemini、Pi、Cursor Agent、Kimi、Kiro CLI 等,几乎覆盖主流编码 Agent。
📮投稿 📢频道 💬吹水 🌐网站
▎OpenAI 推出 GPT‑5.5,迄今为止最强的代理编码模型
OpenAI 于 2026 年 4 月 23 日正式发布 GPT-5.5,并将其定位为“面向真实工作的新一类智能”。官方表示,GPT-5.5 在理解复杂任务意图、跨工具持续执行、检查结果以及完成多步骤工作方面更强,重点能力覆盖写代码、在线研究、数据分析、生成文档与表格、操作软件等场景。
在编程能力方面,OpenAI 给出的数据称,GPT-5.5 在 Terminal-Bench 2.0 上达到 82.7%,在 SWE-Bench Pro 上达到 58.6%,并在其内部用于长周期编程任务评估的 Expert-SWE 上继续领先 GPT-5.4。官方认为,这意味着它在复杂命令行流程、真实 GitHub issue 修复、跨大规模代码库保持上下文、处理模糊故障和调用工具验证假设等方面更强。
在知识工作场景中,OpenAI 表示 GPT-5.5 在 Codex 里生成文档、表格和幻灯片的表现优于 GPT-5.4。公司内部团队已将其用于演讲请求分析、税务材料审阅和业务周报自动化等任务。官方还称,目前 OpenAI 内部已有超过 85% 的员工每周使用 Codex,涉及软件工程、财务、传播、市场、数据科学和产品管理等岗位。
GPT-5.5 已开始向 ChatGPT 和 Codex 的 Plus、Pro、Business、Enterprise 用户推出,GPT-5.5 Pro 则面向 Pro、Business、Enterprise 用户开放。OpenAI 同时表示,API 部署需要额外安全措施,正在与合作伙伴推进,GPT-5.5 和 GPT-5.5 Pro “很快”也会进入 API。
频道 @AppDoDo 官推 APPDOTG
在 Cloud Next 2026大会上,Google推出了“Workspace Intelligence”(工作区智能),旨在为每个应用提供“高度准确、个性化的上下文”。
该系统“理解复杂的语义关系”,涵盖 Gmail、Docs 及其他 Workspace 应用中的数据、你正在进行的项目、协作者以及其他公司特定的信息。Workspace Intelligence 利用 Google 的搜索能力和先进的 Gemini 推理来实现
• 信息收集:Workspace Intelligence 负责繁重的工作,为你收集正确的信息。它打破上下文壁垒,确保你在需要采取行动的瞬间就拥有所需的一切。
• 情境感知:借助高级的 Gemini 推理能力,Workspace Intelligence 能知道此刻对你最重要的是什么——确保你永远不会错过任何待办事项。
• 真正的个性化:通过理解你过去的工作和沟通模式,Workspace Intelligence 学会你的独特工作风格、语气和格式偏好,确保每一份输出都听起来像真正的你。
通过利用贯穿会议记录、电子邮件、文件等数字工作流的深层语义上下文,它创建了一个以你独特背景为基础的智能层,能够从根本上改变你的工作方式。
使用场景
你可以在Google Chat中向 Gemini 提问可以完成你交代的复杂任务,包括生成文档和幻灯片、根据描述搜索文件,以及在考虑所有人日程的情况下找出合适的会议时间。它还可以创建每日简报并与第三方工具集成,如 Asana、Jira 和 Salesforce。
在 Google Docs中,Gemini 可以使用 Workspace Intelligence 根据“你的业务数据”创建信息图。它可以同时编辑多张图片,“以在你的文档中创建视觉一致性”。另一项功能可以“对文档中的评论进行分类和回复,甚至根据评论反馈编辑你的文档”。
在 Google Slides 中,Gemini 利用 Workspace Intelligence 提供上下文信息,并严格遵循“贵公司的模板和视觉风格”,一次性生成幻灯片。在 Google Sheets 中,它用于以对话方式创建和编辑电子表格。
Workspace Intelligence 可从网络上检索您的相关电子邮件、聊天记录、文件和信息,将您的想法转化为专业格式的草稿,完美地模仿您的声音、品牌、风格和公司模板。
Google还发布了第八代TPU(张量处理单元)。今年的一个亮点是推出了“两种专为训练和推理设计的不同架构”。
TPU 8t(图左侧)用于训练,目标是将前沿模型的开发周期从几个月缩短到几周。与上一代相比,它在性价比上提高了 2.8 倍。其主要特性包括:
• 大规模扩展:单个 TPU 8t superpod 现在可扩展至 9,600 块芯片,配备 2 PB 共享高带宽内存,且芯片间带宽是上一代的两倍。该架构可提供 121 ExaFlops 的计算能力,让最复杂的模型能够使用一个巨大的统一内存池。
• 最大化利用率:通过将存储访问速度提升 10 倍,并使用 TPUDirect 将数据直接传入 TPU,TPU 8t 可确保端到端系统得到充分利用。
• 近乎线性扩展:借助我们新的 Virgo 网络、JAX 和 Pathways 软件,TPU 8t 能在单个逻辑集群内实现对多达一百万块芯片的近乎线性扩展。
TPU 8i(图右侧)用于推理或运行模型。它的每美元性能比之前提升了 80%,Google称这意味着公司可以“用相同的成本服务几乎两倍的客户量。”
• 打破“内存瓶颈”:为避免处理器闲置,TPU 8i 将 288 GB 高带宽内存与 384 MB 片上 SRAM 配合使用——比上一代增加了 3 倍——可以把模型的活跃工作集完全保存在芯片上。
• Axion 驱动的高效能:我们把每台服务器上的物理 CPU 主机数量翻了一番,采用了我们定制的基于 Arm 的 Axion 处理器。为实现隔离并提升性能,我们采用了非统一内存架构(NUMA),并对整个平台进行了全面优化。
• 针对现代的混合专家(MoE)模型,我们把互连(ICI)带宽提升到 19.2 Tb/s。新的 Boardfly 架构将最大网络直径缩小了一半以上,保证整套系统作为一个统一且低延迟的整体运行。
• 消除卡顿:我们的新型片上“集合加速引擎”(CAE)负责处理全局操作,可将片上延迟最多降低 5 倍,从而显著减少卡顿。
用户可以将常用的 AI 提示保存为“Skills”,并在不同网页上直接调用,无需每次重复输入。
Gemini 已经可以让用户对网页提问、总结页面内容或完成各种操作。Skills(技能)则更进一步,让用户把常用的 AI 提示保存为可重复使用的工作流,只需点击一次就能调用。
例如,Google表示,如果用户在浏览食谱网站时常常让 Gemini 提供素食替代方案,现在可以将该提示保存下来,并在其他网页上重复使用。
要使用此功能,需在聊天记录中将 AI 提示保存为“Skill”。后续在 Chrome 的 Gemini 中,只需输入斜杠 (/) 或点击加号 (+) 按钮即可调用该技能。该技能会在当前打开的网页上运行,并同时作用于你选中的其他标签页。
Google表示,这些Skills可以随时进行编辑。同时还推出了一个面向常见任务和工作流程的现成技能库,供你直接使用。
Karpathy 最近在 X 上分享了他用 LLM 来管理个人知识库的方法[Link],这个帖子很快爆火,核心思路是把 LLM 当成知识编译器,而不是单纯的问答工具或代码生成器。
MindOS 就是把 Karpathy 的思路完全产品化,核心理念是人类负责思考、审视和演化想法,AI Agents 负责执行任务、反思并提炼标准操作流程(SOP)
直接将这句话发给 Agent 就可以开始了:
帮我从 https://github.com/GeminiLight/MindOS 安装 MindOS,包含 MCP 和 Skills,使用中文模板。📮投稿 📢频道 💬吹水 🌐网站
AI编程工具Cursor高调发布自研模型Composer 2,宣称性能超越Claude Opus 4.6且价格大幅压低。
却在不到3小时内遭开发者揭穿——其底层基座正是中国月之暗面的开源模型Kimi K2.5,引发马斯克及网友“套壳”群嘲。
Cursor创始人随后致歉承认未标明基座,但强调进行了大量强化学习;月之暗面则回应确认系合规授权合作并表祝贺。
UI 设计从提示词出图的传统模式转变为「Vibe Design」(氛围设计)
📮投稿 📢频道 💬吹水 🌐网站
Opus 系列模型中首次推出了处于测试阶段的 100 万 token 上下文窗口。
Claude Opus 4.6 在编程能力上超过了前一代。Opus 4.6 的增强能力也可用于各种日常工作:做财务分析、开展研究,以及使用和制作文档、电子表格和演示文稿。
在 Cowork 平台上,Claude 可自主处理多项任务,Opus 4.6 能代您把这些能力切实运用到工作中。
在 Claude Code 中,现在可以组建代理团队协同处理任务。通过 API,Claude 可以通过“压缩”技术总结自身上下文,从而执行更长时间的任务而不触及限制。
我们还推出了“自适应思维”,模型能根据上下文线索决定何时及多少使用延展思考能力,并新增了“努力”控制,帮助开发者在智能、速度与成本之间做出更精细的权衡。
Claude Opus 4.6 已在 claude.ai、claude API (每百万tokens $5/$25)以及各大云平台上线。
发现用户明确提出实施自杀、自残等极端情境时,由人工接管!就AI拟人化互动服务,网信办公开征求意见
12月27日,网信中国微信公众号发布国家互联网信息办公室关于《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见的通知。
节选:
提供者应当具备心理健康保护、情感边界引导、依赖风险预警等安全能力,不得将替代社会交往、控制用户心理、诱导沉迷依赖等作为设计目标。
第十一条 提供者应当具备用户状态识别能力,在保护用户个人隐私前提下,评估用户情绪及对产品和服务的依赖程度,发现用户存在极端情绪和沉迷的,采取必要措施予以干预。
提供者应当建立应急响应机制,发现用户明确提出实施自杀、自残等极端情境时,由人工接管对话,并及时采取措施联络用户监护人、紧急联系人。针对未成年人、老年人用户,提供者应当在注册环节要求填写用户监护人、紧急联系人等信息。
第十二条 提供者应当建立未成年人模式,向用户提供未成年人模式切换、定期现实提醒、使用时长限制等个性化安全设置选项。
提供者不得提供模拟老年人用户亲属、特定关系人的服务。
提供者应当向用户提供删除交互数据的选项,用户可以选择对聊天记录等历史交互数据进行删除。监护人可以要求提供者删除未成年人历史交互数据。
提供者识别出用户出现过度依赖、沉迷倾向时,或者在用户初次使用、重新登录时,应当以弹窗等方式动态提醒用户交互内容为人工智能生成。
🗒 标签: #网信办 #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
12月27日,网信中国微信公众号发布国家互联网信息办公室关于《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见的通知。
公众可通过以下途径和方式提出反馈意见:
1.通过电子邮件方式发送至:nirenhua@cac.gov.cn。
2.通过信函方式将意见寄至:北京市西城区车公庄大街11号国家互联网信息办公室网络管理技术局,邮编100044,并在信封上注明“人工智能拟人化互动服务管理暂行办法征求意见”。
意见反馈截止时间为2026年1月25日。
节选:
提供者应当具备心理健康保护、情感边界引导、依赖风险预警等安全能力,不得将替代社会交往、控制用户心理、诱导沉迷依赖等作为设计目标。
第十一条 提供者应当具备用户状态识别能力,在保护用户个人隐私前提下,评估用户情绪及对产品和服务的依赖程度,发现用户存在极端情绪和沉迷的,采取必要措施予以干预。
提供者应当建立应急响应机制,发现用户明确提出实施自杀、自残等极端情境时,由人工接管对话,并及时采取措施联络用户监护人、紧急联系人。针对未成年人、老年人用户,提供者应当在注册环节要求填写用户监护人、紧急联系人等信息。
第十二条 提供者应当建立未成年人模式,向用户提供未成年人模式切换、定期现实提醒、使用时长限制等个性化安全设置选项。
提供者不得提供模拟老年人用户亲属、特定关系人的服务。
提供者应当向用户提供删除交互数据的选项,用户可以选择对聊天记录等历史交互数据进行删除。监护人可以要求提供者删除未成年人历史交互数据。
提供者识别出用户出现过度依赖、沉迷倾向时,或者在用户初次使用、重新登录时,应当以弹窗等方式动态提醒用户交互内容为人工智能生成。
官方正式名称为「Gemini 3 Pro Image」。它最高可输出 4K 分辨率图像、支持多轮编辑、搜索增强等功能,应该是目前全球最先进的 AI 绘画模型了![博客][直达][提示词大全]
新增全新购物助手功能,用户只需输入购物需求,ChatGPT 就会开始为用户筛选合适的产品;取消了独立的「ChatGPT Voice」入口,现在用户可以直接在聊天中使用语音功能。
可智能修复bug、永不遗忘对话,对标 GPT-5.1 和 Gemini Pro。
FLUX.2 有 4 个不同规模和用途的模型包括 Pro、Flex、Dev、Klein,并在技术上实现了显著提升,包括引入多参考条件、更高保真度的输出以及改进的文本渲染。[开源地址][官方博客][FLUX.1介绍]
TRAE SOLO 是一种高度自动化的开发方式,以 AI 为主导,可理解目标、承接上下文并调度工具,独立推进各阶段开发任务。且完全免费使用。(TRAE 是字节跳动旗下的 AI 编程工具)[直达]
*题图由 Nano Banana Pro 免费生成
📮投稿 📢频道 💬群聊
OpenAI发布了GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代Agentic编码模型。
相较于之前的模型,GPT‑5.1-Codex-Max采用了“压缩(compaction)”技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的Token。OpenAI表示,该模型不仅性能提升,还实现了更快、更高效的Token利用率。
OpenAI在此前发布GPT-5-Codex模型时表示,计划很快在API中提供GPT-5-Codex,现在OpenAI已经更新博客文章,用户可以通过API使用GPT-5 Codex,GPT‑5 Codex的价格与GPT‑5相同。
此外,OpenRouter已上架GPT-5 Codex,价格为:输入1.25美元/每百万tokens,输出10美元/每百万tokens。
模型介绍:
GPT-5-Codex是GPT-5的一个专门版本,针对软件工程和编码工作流程进行了优化。它既适用于交互式开发会话,也适用于长时间独立执行复杂的工程任务。该模型支持从头构建项目、功能开发、调试、大规模重构和代码审查。与GPT-5相比,GPT-5-Codex更具可操作性,能够严格遵循开发者的指令,并生成更清晰、更高质量的代码。推理工作量可以通过参数进行调整。
GPT-5-Codex可以集成到各种开发者环境中,包括CLI、IDE扩展、GitHub和云任务。它可以动态调整推理工作量,为小型任务提供快速响应,同时为大型项目维持长达数小时的运行。该模型经过训练,可以执行结构化代码审查,通过推理并根据测试验证行为来发现代码的关键缺陷。它还支持用于UI开发的多模态输入(例如图像或屏幕截图),并集成了用于搜索、依赖项安装和环境设置的工具。专为Agent编码应用程序设计。
via 匿名
nano banana 的正式名称是 Gemini 2.5 Flash Image,主要特点包括下面几点:
▫️充分保持角色的一致性:可轻松地将同一个角色置于不同的环境中,或者从多个角度展示同一款产品,同时完美地保持其核心主体不变。
▫️基于提示的图片编辑:允许用户通过简单的自然语言指令,对图片进行精准的局部修改 。
▫️利用 Gemini 的现实世界知识:模型可借助 Gemini 强大的世界知识库,让图像生成变得更加「智能」。
▫️多幅图像融合:可以将一张图片中的物体「放」进另一张图片的场景里,整个过程只需一条提示指令就能完成。
Gemini 2.5 Flash Image 目前已经
可以通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 进行访问。
📮投稿 📢频道 💬群聊
nano banana 的正式名称是 Gemini 2.5 Flash Image,主要特点包括下面几点:
▫️充分保持角色的一致性:可轻松地将同一个角色置于不同的环境中,或者从多个角度展示同一款产品,同时完美地保持其核心主体不变。
▫️基于提示的图片编辑:允许用户通过简单的自然语言指令,对图片进行精准的局部修改 。
▫️利用 Gemini 的现实世界知识:模型可借助 Gemini 强大的世界知识库,让图像生成变得更加「智能」。
▫️多幅图像融合:可以将一张图片中的物体「放」进另一张图片的场景里,整个过程只需一条提示指令就能完成。
Gemini 2.5 Flash Image 目前已经
可以通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 进行访问。
📮投稿 📢频道 💬群聊
LINUXDO 网友发帖发现 DeepSeek V3.1 模型在输出中会随机出现 “极” 字,最开始在第三方 API 上出现了这个问题,火山、chutes 等第三方都可能出现这个问题。作者表示此 bug 严重影响到编程或日常使用。
作者经测试后,官网同样存在这个问题。作者表示一旦出现问题,后续会更加频繁。
作者认为,是数据集没有清理干净的问题,这也和 “极速” 等词并列出现合理。通过查看分词,作者发现 “极” 对应的 token 2577 和省略号 2576 相邻,这可能是导致该 bug 的原因。也有可能和模型偷懒有关系。但也存在部分情况无法解释。
目前结论,官网出现 “极” 字概率最低,但不是没有。第三方概率显著增加,可能和第三方量化、部署配置、设备差异相关。
via 匿名
#AI #Claude #大模型
⭐️ Anthropic 发布「全球最强的」编程大模型:Claude Opus 4 和 Claude Sonnet 4
体验(Sonnet免费): claude.ai/new
Anthropic 称,Opus 4 是目前全球最强的编程大模型,能够稳定胜任复杂且持续时间长的任务和 Agent 工作流。
而 Sonnet 4 则着重强化了编程和推理能力,能更精准地响应用户的指令。
此外,Anthropic 还同步推出了以下新功能:
📮投稿 📢频道 💬群聊 🔎索引
⭐️ Anthropic 发布「全球最强的」编程大模型:Claude Opus 4 和 Claude Sonnet 4
体验(Sonnet免费): claude.ai/new
Anthropic 称,Opus 4 是目前全球最强的编程大模型,能够稳定胜任复杂且持续时间长的任务和 Agent 工作流。
而 Sonnet 4 则着重强化了编程和推理能力,能更精准地响应用户的指令。
此外,Anthropic 还同步推出了以下新功能:
▫️工具辅助的延伸思考:Claude 模型在进行深入思考时,能够交替使用工具(如网页搜索),以优化推理过程和回复质量。
▫️新增模型能力:两款模型可并行使用工具,执行更精确的指令,并在开发者授权下,提升记忆能力,能提取并保存关键信息,保持上下文连贯。
▫️Claude Code 正式发布:Claude Code 现已支持 GitHub Actions、VS Code 和 JetBrains。
▫️新的 API 功能:Anthropic API 新增四项功能,包括代码执行工具、MCP 连接器、文件 API 和最长可缓存 1 小时的提示缓存功能。
📮投稿 📢频道 💬群聊 🔎索引
#AI #agent
🤡 没有邀请码,没有营销号震惊,就这样悄咪咪上线了...
直达: agent.minimax.io
海螺 AI 上线了 Agent 平台,官网的示例基本是研究、规划、编码。
我输入了「帮我写一个网站,要求实时获取新浪微博热榜并展示」,系统直接 DailyHotApi 这一开源项目做了一个网站,效果还算可以🤣
现在就可以免费使用!
📑相关阅读
▫️全球首款通用型号 AI Agent:中国 AI 产品 Manus 一夜刷屏
▫️时隔 2 个多月,Manus 终于开放注册
📮投稿 📢频道 💬群聊 🔎索引
🤡 没有邀请码,没有营销号震惊,就这样悄咪咪上线了...
直达: agent.minimax.io
海螺 AI 上线了 Agent 平台,官网的示例基本是研究、规划、编码。
我输入了「帮我写一个网站,要求实时获取新浪微博热榜并展示」,系统直接 DailyHotApi 这一开源项目做了一个网站,效果还算可以🤣
现在就可以免费使用!
📑相关阅读
▫️全球首款通用型号 AI Agent:中国 AI 产品 Manus 一夜刷屏
▫️时隔 2 个多月,Manus 终于开放注册
📮投稿 📢频道 💬群聊 🔎索引