在 Cloud Next 2026大会上,Google推出了“Workspace Intelligence”(工作区智能),旨在为每个应用提供“高度准确、个性化的上下文”。
该系统“理解复杂的语义关系”,涵盖 Gmail、Docs 及其他 Workspace 应用中的数据、你正在进行的项目、协作者以及其他公司特定的信息。Workspace Intelligence 利用 Google 的搜索能力和先进的 Gemini 推理来实现
• 信息收集:Workspace Intelligence 负责繁重的工作,为你收集正确的信息。它打破上下文壁垒,确保你在需要采取行动的瞬间就拥有所需的一切。
• 情境感知:借助高级的 Gemini 推理能力,Workspace Intelligence 能知道此刻对你最重要的是什么——确保你永远不会错过任何待办事项。
• 真正的个性化:通过理解你过去的工作和沟通模式,Workspace Intelligence 学会你的独特工作风格、语气和格式偏好,确保每一份输出都听起来像真正的你。
通过利用贯穿会议记录、电子邮件、文件等数字工作流的深层语义上下文,它创建了一个以你独特背景为基础的智能层,能够从根本上改变你的工作方式。
使用场景
你可以在Google Chat中向 Gemini 提问可以完成你交代的复杂任务,包括生成文档和幻灯片、根据描述搜索文件,以及在考虑所有人日程的情况下找出合适的会议时间。它还可以创建每日简报并与第三方工具集成,如 Asana、Jira 和 Salesforce。
在 Google Docs中,Gemini 可以使用 Workspace Intelligence 根据“你的业务数据”创建信息图。它可以同时编辑多张图片,“以在你的文档中创建视觉一致性”。另一项功能可以“对文档中的评论进行分类和回复,甚至根据评论反馈编辑你的文档”。
在 Google Slides 中,Gemini 利用 Workspace Intelligence 提供上下文信息,并严格遵循“贵公司的模板和视觉风格”,一次性生成幻灯片。在 Google Sheets 中,它用于以对话方式创建和编辑电子表格。
Workspace Intelligence 可从网络上检索您的相关电子邮件、聊天记录、文件和信息,将您的想法转化为专业格式的草稿,完美地模仿您的声音、品牌、风格和公司模板。
Google还发布了第八代TPU(张量处理单元)。今年的一个亮点是推出了“两种专为训练和推理设计的不同架构”。
TPU 8t(图左侧)用于训练,目标是将前沿模型的开发周期从几个月缩短到几周。与上一代相比,它在性价比上提高了 2.8 倍。其主要特性包括:
• 大规模扩展:单个 TPU 8t superpod 现在可扩展至 9,600 块芯片,配备 2 PB 共享高带宽内存,且芯片间带宽是上一代的两倍。该架构可提供 121 ExaFlops 的计算能力,让最复杂的模型能够使用一个巨大的统一内存池。
• 最大化利用率:通过将存储访问速度提升 10 倍,并使用 TPUDirect 将数据直接传入 TPU,TPU 8t 可确保端到端系统得到充分利用。
• 近乎线性扩展:借助我们新的 Virgo 网络、JAX 和 Pathways 软件,TPU 8t 能在单个逻辑集群内实现对多达一百万块芯片的近乎线性扩展。
TPU 8i(图右侧)用于推理或运行模型。它的每美元性能比之前提升了 80%,Google称这意味着公司可以“用相同的成本服务几乎两倍的客户量。”
• 打破“内存瓶颈”:为避免处理器闲置,TPU 8i 将 288 GB 高带宽内存与 384 MB 片上 SRAM 配合使用——比上一代增加了 3 倍——可以把模型的活跃工作集完全保存在芯片上。
• Axion 驱动的高效能:我们把每台服务器上的物理 CPU 主机数量翻了一番,采用了我们定制的基于 Arm 的 Axion 处理器。为实现隔离并提升性能,我们采用了非统一内存架构(NUMA),并对整个平台进行了全面优化。
• 针对现代的混合专家(MoE)模型,我们把互连(ICI)带宽提升到 19.2 Tb/s。新的 Boardfly 架构将最大网络直径缩小了一半以上,保证整套系统作为一个统一且低延迟的整体运行。
• 消除卡顿:我们的新型片上“集合加速引擎”(CAE)负责处理全局操作,可将片上延迟最多降低 5 倍,从而显著减少卡顿。
具备“思考”的图像功能已向 ChatGPT Plus、Pro 和 Business 用户开放(企业版即将推出),底层模型 gpt-image-2 已在 API 中可用。
ChatGPT Images 2.0是OpenAI首个具备“思考”能力的图像模型。无需参考图、仅凭简短提示词,即可生成以假乱真的TikTok截图、论文海报、商品广告。
Thinking能力的加入,使得模型可以处理更复杂的任务,在准确性、时效性、一致性和视觉连贯性上有更加强大的表现。
在API中,ChatGPT Images 2.0最高支持生成2K分辨率的图像。
它还具备更强的多语言理解能力、支持最宽3:1、最窄1:3的图片比例、一次提示最多可生成8个输出,并且图中的角色和物体能保持连续性。
ChatGPT Images 2.0 的知识库已更新至 2025 年 12 月,具备能够端到端完成各类复杂任务的智能——无论是撰写文案、进行分析,还是进行设计构图,都能胜任并交付专业成果。
在大模型竞技场上,ChatGPT Images 2.0已登顶第一,并且在文本到图像任务中,断层领先第二名Nano Banana 2 240分。
官方简介页面也是简单明了,全是炫技图,哈哈!
Images 2.0 除了默认的 Instant 模式,最大亮点便是的突破在于引入了 Thinking 模式(仅付费用户可用)
生成的图片也不再有 AI 塑料感,可生成包豪斯风格海报、现代主义排版、Art Deco 书签、电影级自然人像、复古法国新浪潮海报等更具审美价值的图片
📮投稿 📢频道 💬吹水 🌐网站
▎GPT-Image-2 横扫 Image Arena 榜单,OpenAI 拿下图像生成三项第一
Arena 官方账号公布,OpenAI 的 GPT-Image-2 已登顶全部 Image Arena 图像榜单,在文生图、单图编辑和多图编辑三项评测中全部拿到第一。
其中,文生图分项得分 1512,领先第二名 242 分;单图编辑得分 1513,领先第二名 125 分;多图编辑得分 1464,领先第二名 90 分。Arena 将这次表现称为目前为止罕见的大幅领先。
Arena 还表示,没有其他模型曾以这么大的优势统治 Image Arena。
OpenAI 社区同日发布的介绍帖也引用了这一成绩,称 GPT-Image-2 在发布后数小时内就拿下全部 Image Arena 榜单第一,并强调文生图 242 分的领先幅度刷新了该竞技场的纪录。
目前GPT-Image-2 模型已经全量推送,免费和付费用户均可以使用该模型。频道主测试后发现该模型对中文支持非常优秀,推荐大家尝试。
频道 @AppDoDo 官推 APPDOTG
Huashu Design - 一个专为 Claude Code / Cursor / Codex 等 AI 编码代理设计的 HTML 原生设计 Skill
开发者(小猫补光灯作者)声称逆向了「Claude Design」,并做成了一个 Skill。
这是一个内置了 20 条设计哲学 + 5 维专家评审 + 品牌资产协议 + 动效引擎的完整设计工作流。
看效果倒是非常不错,所以推荐之。实际体验不知道(暂时没token了),毕竟自媒体很多时候是噱头大于实际价值的。
📮投稿 📢频道 💬吹水 🌐网站
免费可用 GLM、Nemotron(NVIDIA 自家)、Kimi、Meta Llama、DeepSeek、Mistral、Gemma、Qwen、MiniMax M2.5 等大模型
注册登录之后直接生成就行了,OpenCode 上用选择 Nvidia 提供商即可。API Keys 限制每分钟 40 次调用,速度尚可。
实测新西兰 One 卡是可以接到验证码的,GV 包不行,+86未测试。
📮投稿 📢频道 💬吹水 🌐网站
不同于传统的语言 App 如 多邻国,Little Language Lessons(LLL) 强调小块化、个性化和贴近真实生活的练习,让语言学习更有趣、更实用、更个性化。
➡️ Tiny Lesson(小课):选择目标语言,然后输入一个具体场景或主题(如在日本打车),LLL 会生成一套包括相关词汇、实用短语等的课程。➡️ Slang Hang(俚语对话):选择目标语言和方言/地区,LLL 会生成两个母语者之间的真实对话,教你地道的表达、习语、俚语和口语用法。➡️ Word Cam(单词相机):拍一张照片,AI 会识别照片内容,并教你如何用目标语言描述看到的物品、场景和相关表达。
📮投稿 📢频道 💬吹水 🌐网站
用户可以将常用的 AI 提示保存为“Skills”,并在不同网页上直接调用,无需每次重复输入。
Gemini 已经可以让用户对网页提问、总结页面内容或完成各种操作。Skills(技能)则更进一步,让用户把常用的 AI 提示保存为可重复使用的工作流,只需点击一次就能调用。
例如,Google表示,如果用户在浏览食谱网站时常常让 Gemini 提供素食替代方案,现在可以将该提示保存下来,并在其他网页上重复使用。
要使用此功能,需在聊天记录中将 AI 提示保存为“Skill”。后续在 Chrome 的 Gemini 中,只需输入斜杠 (/) 或点击加号 (+) 按钮即可调用该技能。该技能会在当前打开的网页上运行,并同时作用于你选中的其他标签页。
Google表示,这些Skills可以随时进行编辑。同时还推出了一个面向常见任务和工作流程的现成技能库,供你直接使用。
Karpathy 最近在 X 上分享了他用 LLM 来管理个人知识库的方法[Link],这个帖子很快爆火,核心思路是把 LLM 当成知识编译器,而不是单纯的问答工具或代码生成器。
MindOS 就是把 Karpathy 的思路完全产品化,核心理念是人类负责思考、审视和演化想法,AI Agents 负责执行任务、反思并提炼标准操作流程(SOP)
直接将这句话发给 Agent 就可以开始了:
帮我从 https://github.com/GeminiLight/MindOS 安装 MindOS,包含 MCP 和 Skills,使用中文模板。📮投稿 📢频道 💬吹水 🌐网站
在 ChatGPT 中,这一新的 Pro 订阅仍可使用所有 Pro 功能,包括专属 Pro 模型,并且可以不限次数地使用 Instant 和 Thinking 模型。
为庆祝上线,我们将在限定时间内(至 5 月 31 日)提高 Codex 的使用配额。订阅每月 $100 的 Pro 用户在 Codex 上的使用量最多可达 ChatGPT Plus 的 10 倍,便于实现更复杂、更宏大的创意项目。
面向现有 Plus 会员的 Codex 促销活动于今日结束,作为活动的一部分,我们将对 Plus 会员的 Codex 使用情况进行重新调整,以支持他们在一周内使用更多次,而非在单日使用更长时间。
Plus 计划将继续以 $20 的价格为 Codex 的日常稳定使用提供最佳优惠,而新的 $100 Pro 级别则为更频繁的日常使用提供了更易接受的升级途径。
我用 iPhone16Pro 下载了个最小的 E2B ,实际速度还算挺快的,数据截至2025年1月份,但是问周树人问题仍然回答错误。
当然你也可以在 Poe 搜索 gemma4 免费在线体验
📮投稿 📢频道 💬吹水 🌐网站
IOS: https://apps.apple.com/us/app/google-ai-edge-gallery/id6749645337
安卓: https://play.google.com/store/apps/details?id=com.google.ai.edge.gallery&hl=en
🏷 TAG #gemini #gemma #google #Android #iphone #ai
📢 Channel @ednovas2
👥 Group @ednovas4
• MAI-Transcribe-1 在依据行业标准 FLEURS 基准测试得出的前 25 种最常用语言中实现了最先进的语音转文字转录功能
• MAI-Voice-1 是我们最顶级的语音生成模型。今天,我们新增了一项功能,让您只需几秒钟的音频即可安全、可靠地创建自己的专属语音。该模型能够在短短一秒内生成 60 秒的音频,而高效的 GPU 使用则能以经济实惠的方式实现这种高质量和高效率。
• MAI-Image-2 是由摄影师、设计师和视觉叙事者共同打造而成的,他们对自然光线、准确的肤色和纹理以及清晰的图像文字(用于图表、布局和图形)有着严格要求。再次强调,速度和质量并非以更高的成本为代价——MAI-Image-2 提供的是性价比极高的产品。
价格:
· MAI-Transcribe-1 :每小时 $0.36
· MAI-Voice-1 :起价为每 100 万token $22
· MAI-Image-2 :文本输入每 100 万个token收费 $5 ,图像输出每 100 万个token收费 $33
现在,全球范围内所有用户都免费增加了 3 TB。
这些存储可用于 Gmail、Google Drive 存储和 Google Photos 备份。
https://r.jina.ai/ 在该网址后面直接粘贴要读取的网页地址它能把任意网页 URL 转换成干净、结构化、适合喂给大模型(LLM)的 Markdown 文本
好处就是用 AI 的时候想让它读网页会更轻松便捷
📮投稿 📢频道 💬吹水 🌐网站
微软(Microsoft AI / MAI 团队)于 2026 年 3 月 19 日 正式发布第二代文生图大模型「MAI-Image-2」
📮投稿 📢频道 💬吹水 🌐网站