这是一款提供全天候免提协助的智能眼镜,将于今秋上市。
新款音频眼镜可让 Gemini 随时为你提供帮助,比如拍照、在新城市导航,或将音频内容进行实时翻译。Audio Glasses支持与 Android 及 iOS 手机配对使用。
• Gemini 月活用户达9 亿
谷歌搜索现在由Gemini 3.5加持、具备大规模执行任务能力
该功能将先向 Google AI Pro 和 Ultra 订阅用户逐步推出
Google 推出CodeMender API,一种代码安全代理,可自动发现并修复关键的软件漏洞。
今天,我们将邀请一小部分精选专家来进行测试,并计划很快更广泛地推出。
面向科学的 Gemini,旨在加速科研进程
Gemini 已经可以帮助解决复杂问题,而我们全新的 GoogleLabs 原型还能进一步简化更多日常科研任务,包括:
• 跟进最新论文
• 把研究目标转化成可直接使用的代码
• 生成新的假设
AI 模拟是面向科学的中另一个强有力的工具,能够帮助我们理解并预测动态系统。
Google 推出Google Pics
Google Workspace 新增一款全新产品,让你获得更强的创作掌控力。
这是一款图像创建与编辑工具,几乎能帮你做出任何想要的作品——比如派对传单和信息图表。它会自动识别并分割照片中的各个对象,理解它们之间的关系,让你只需点击几下就能轻松完成编辑。
Pics 将于今天先向一小部分“可信测试员”开放,随后在今年夏天晚些时候,面向全球的 Google AI Pro 和 Ultra 订阅用户推出。
Stitch by Google现在能够实时生成移动端和 Web 应用的界面(UI)
今天起开始免费向全球用户逐步推出。
你可以让 Stitch 根据你的提示设计一款移动端应用,并通过语音和文字编辑备注对设计进行打磨——就像和设计伙伴协作一样。准备上线时,可将设计导入 Google Antigravity 或 GoogleAIStudio ,并进行发布。
Google Flow多项更新
• 新增Gemini Omni Flash:只需提供简短提示和风格参考,Gemini Omni 就能在保留原始性能的同时,改变现有场景的环境,添加视觉效果及其他元素。
• 新增Google Flow 代理:集成Gemini 的智能代理能力,现在你的智能体可以同时执行多个操作。该代理还能凭借对上下文的精准理解,完成大规模编辑任务。
• 新增Google Flow 工具:现在你可以为任何你想到的创意工具“尽情编写代码”,比如设计视频特效或手绘动画。你还能在Google Flow上直接创建、分享并对这些工具进行再创作(remix)。
• 新增Google Flow Music:还在脑海里挥之不去的旋律?现在你可以在 Google Flow Music 上创作自己的歌曲。你只要把即兴创作录进 Google Flow Music,并用你想要的音乐风格来给它下指令——比如更精致的 R&B。Google Flow Music 会先给你打好基础,之后你就能直接在这个工具里继续微调完善。
新增 Universal Cart(环球购物车),Google 上全新的购物中心
你可以在Google引擎、Gemini App、YouTube或Gmail购物时,将商品添加到购物车。
系统将查找优惠和降价信息,给你带来价格历史的洞察,并在某件商品重新上架时及时提醒你。
它能帮你发现隐藏的优惠。由于它是基于 Google 钱包打造的,你的购物车会识别你的支付方式特权、会员/忠诚度信息以及商家优惠,这样你就不会错过任何优惠或积分。
• 通用商务协议(Universal Commerce Protocol:一项开源标准,它为代理和系统提供共同语言,使所有关键参与者能够携手协作。
• Agent Payments Protocol(AP2):让你的 AI 代理在明确边界与责任的框架下,安全地替你完成支付。
• Android Halo: 为你的代理在 Android 设备上提供的全新空间。今年晚些时候,它将让你一眼掌握各个代理的状态,从屏幕顶部就能直接看到他们的进展。Halo 将支持与 Gemini Spark 及其他兼容的智能代理协同工作。
Google推出Gemini Spark
它基于 Gemini 3.5 运行,并构建在 Antigravity 之上,因此能够在后台轻松完成长时间运行的任务。
由于它是在 Google Cloud 的专用虚拟机上运行的,你甚至不必一直保持笔记本电脑开机。
Spark 将与 Google 的工具实现无缝集成,并很快也会通过 MCP 与第三方进行集成。
macOS 应用今天起面向所有用户开放下载;Gemini Spark 将在美国逐步推送给 Google AI Ultra 订阅用户;全新的语音体验也将在未来几周内在全球范围内向所有用户上线。
🗒 标签: #Google #Gemini #Spark
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
这是你的 24/7 个人 AI 助理,随时帮你更好地管理数字生活:在你的指挥和指令下代表你采取行动。
它基于 Gemini 3.5 运行,并构建在 Antigravity 之上,因此能够在后台轻松完成长时间运行的任务。
由于它是在 Google Cloud 的专用虚拟机上运行的,你甚至不必一直保持笔记本电脑开机。
Spark 将与 Google 的工具实现无缝集成,并很快也会通过 MCP 与第三方进行集成。
macOS 应用今天起面向所有用户开放下载;Gemini Spark 将在美国逐步推送给 Google AI Ultra 订阅用户;全新的语音体验也将在未来几周内在全球范围内向所有用户上线。
用户可以利用自然语言来编辑视频
今天起,全球范围内的 Google AI Plus、Pro 和 Ultra 订阅用户可在 GeminiApp 和 Google Flow 中使用。
将于本周起免费逐步推出:YouTube Shorts 和 YouTube Create 应用。
接下来几周,将通过 API 方式向开发者和企业客户开放。
我们现已向所有 GeminiApp 用户推出 3.5 Flash,并在 Google 搜索中开放 AI 模式。
Gemini 3.5 Pro将于6月发布。
首个发布的是3.5 Flash,这是我们迄今为止用于智能体与编码的最强模型 。
Gemini 3.5 Flash 以远低于其他领先模型的价格,提供快速且始终稳定的表现。
它能够在超大规模代码库中进行规划与推理,并部署子代理在更长的时间跨度里并行协作。
它在编码与“代理式”基准测试上(如 Terminal-Bench 2.1、GDPval-AA 和 MCP Atlas)表现超过 3.1 Pro。
彻底终结AI“御三家”时代,与OpenAI的“两强对垒”格局落定。
Google将向Anthropic公司投资最高400亿美元,进一步深化这两家公司之间的合作关系。双方在人工智能竞赛中既是伙伴,又是对手。
Anthropic周五表示,Google承诺以3800亿美元的最新估值即刻投入100亿美元现金。Google将在Anthropic达成业绩里程碑后再追加投资300亿美元,同时大力扩充Anthropic的算力规模。
Anthropic是Google芯片和云服务的重要客户,而Google正大力拓展这些业务,以弥补其核心收入来源——搜索广告业务增长趋于成熟的不足。
Google Cloud将在未来五年内为Anthropic提供5吉瓦的算力,从2027年开始陆续上线,后续还可能追加数吉瓦。此次协议是本月早些时候Anthropic、Google与博通公司签署合作协议的进一步扩展。
Google 的TPU是英伟达芯片最具竞争力的替代方案之一,在这个对算力需求极为庞大的行业中,TPU对Anthropic及其他AI开发者而言是稀缺而宝贵的资源。
Gemini 将新增“Notebooks”功能
Google宣布,Gemini 将新增notebooks(笔记本)功能,方便你在使用 AI 聊天机器人时把与某个主题相关的内容集中管理。你可以把文件、以往对话和自定义设置等加入notebooks,Gemini 在与你对话时会把这些内容作为上下文参考。
该功能与 ChatGPT 在 2024 年推出的 Projects类似:都可以把某个主题相关的内容集中保存。
Google称“可以把notebooks当作在Google产品中共享的个人知识库。”
此外,Gemini 的notebooks会与Google的 NotebookLM AI 研究工具同步,在一个应用中添加的资料来源会在另一个应用中同步显示。
🗒 标签: #Google #Gemini #Notebooks
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
该功能在本周通过网页版向 AI Ultra、Pro 和 Plus 订阅用户上线,预计将在“未来几周”扩展到移动端和免费用户。
Google宣布,Gemini 将新增notebooks(笔记本)功能,方便你在使用 AI 聊天机器人时把与某个主题相关的内容集中管理。你可以把文件、以往对话和自定义设置等加入notebooks,Gemini 在与你对话时会把这些内容作为上下文参考。
该功能与 ChatGPT 在 2024 年推出的 Projects类似:都可以把某个主题相关的内容集中保存。
Google称“可以把notebooks当作在Google产品中共享的个人知识库。”
此外,Gemini 的notebooks会与Google的 NotebookLM AI 研究工具同步,在一个应用中添加的资料来源会在另一个应用中同步显示。
IOS: https://apps.apple.com/us/app/google-ai-edge-gallery/id6749645337
安卓: https://play.google.com/store/apps/details?id=com.google.ai.edge.gallery&hl=en
🏷 TAG #gemini #gemma #google #Android #iphone #ai
📢 Channel @ednovas2
👥 Group @ednovas4
Gemini Lossless Watermark Remover
Gemini 无损去水印工具,基于反向 Alpha 混合算法实现,非 AI 模型,拖追图片即可一键处理,可自动识别 48×48 或 96×96 水印尺寸,有网页版和油猴版可供选择,所有处理都在浏览器本地完成,免费使用,无需注册。
频道 @WidgetChannel
复制 Gemini 提供的提示词至其他 AI 平台如 ChatGPT,然后 ChatGPT 就会回复你,把回复的内容复制给 Gemini,导入就完成了。
你可以试着问一句:
请详细描述我的人物画像看看 AI 眼中的你什么样的
📮投稿 📢频道 💬吹水 🌐网站
Google 推出Gemini Embedding 2(其首款原生支持多模态的嵌入模型)
Gemini Embedding 2 是我们首个原生多模态嵌入模型,能把文本、图像、视频、音频和文档映射到同一嵌入空间,从而实现不同媒体间的统一检索和分类功能,并能在 100 多种语言中理解语义意图。
这大大简化了复杂的处理流程,并提升了多种多模态应用的效果——例如用于检索增强生成(RAG)、语义搜索、情感分析和数据聚类等任务。
由于不再局限于单一模态处理,该模型能原生识别交错的多模态输入,因此可在一次请求中同时输入图像和文本等多种数据。由此模型能把握不同媒体类型之间复杂而微妙的关联,更准确地理解真实世界中的复杂信息。
🗒 标签: #Google #Gemini #多模态
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
现已通过 Gemini API 和 Vertex AI 以公测形式向公众开放预览。
Gemini Embedding 2 是我们首个原生多模态嵌入模型,能把文本、图像、视频、音频和文档映射到同一嵌入空间,从而实现不同媒体间的统一检索和分类功能,并能在 100 多种语言中理解语义意图。
这大大简化了复杂的处理流程,并提升了多种多模态应用的效果——例如用于检索增强生成(RAG)、语义搜索、情感分析和数据聚类等任务。
• 文本:支持最多 8192 个输入tokens的广泛上下文环境
• 图像:每次请求最多可处理 6 张,支持 PNG 和 JPEG 格式
• 视频:支持最多 120 秒的 MP4 或 MOV 格式视频输入
• 音频:可以直接接收并生成音频的嵌入向量,无需先把音频转成文本
• 文档:直接嵌入最多 6 页的 PDF 文件
由于不再局限于单一模态处理,该模型能原生识别交错的多模态输入,因此可在一次请求中同时输入图像和文本等多种数据。由此模型能把握不同媒体类型之间复杂而微妙的关联,更准确地理解真实世界中的复杂信息。
Agentic Vision 是 Gemini 3 Flash 的一项新能力,它把视觉推理和代码执行结合起来,能够以视觉证据为依据给出答案,表达更直观可靠。
在 Gemini 3 Flash 中,Agentic Vision 把图像理解从被动的查看变成主动的探究。
模型会生成并运行 Python 代码来主动处理或分析图像,例如裁剪、旋转、添加注释,或执行计算与统计(比如计数边界框)。并以视觉证据为依据给出结论。
Agentic Vision 现已通过 Gemini API 在 Google AI Studio 和 Vertex AI 中提供。它也开始在 Gemini 应用中逐步推出(可在模型下拉菜单中选择“Thinking”访问)。
订阅用户将获得如下权益:
▫️使用 Gemini3 Pro 及 Nano Banana Pro 模型。
▫️Flow AI 电影制作工具使用权限,以及 NotebookLM 的深度研究与写作辅助。
▫️提供 200GB 云存储空间,并支持最多5位家庭成员共享。
▫️现有的 Google One Premium 2TB 用户将在未来几天内自动升级,免费获得所有 AI Plus 权益!
不得不感叹谷歌财大气粗哇,其他厂商还在几十刀的时候,这就直接十刀以内了
📮投稿 📢频道 💬群聊
周四,就在OpenAI端出备受期待的 GPT-5.2(内部代号 Garlic)之日,谷歌同步推出了迄今最强的深度研究型Agent——Gemini Deep Research Agent,并宣称其基于旗下最先进的Gemini 3 Pro模型。
同日,DeepMind还宣布将在英国建立首个自动化研究实验室,利用AI与机器人加速材料科学实验。
这不是“撞车”,更像一场精心策划的阳谋:在竞争对手聚焦全球目光时,谷歌以一款更具战略意味的产品回应——将Agent 推向操作系统级能力。
Deep Research通过迭代方式规划调查——它会制定搜索查询、阅读结果、发现知识缺口,然后重新进行搜索。此次发布大大增强了网络搜索功能,能够深入网页获取特定信息。
新的Gemini Deep Research agent在人类终极考试(HLE)和DeepSearchQA上取得了最先进的成绩,并且我们在BrowseComp上是最好的成绩。
它经过优化,能够以更低成本生成内容丰富、调研充分的报告。深度研究功能比以往任何时候都更实用、更智能,预计很快会在 Google 搜索、NotebookLM、Google Finance 上上线,并在升级后的 Gemini 应用中提供。
功能开启后,地址栏左侧的图标会由谷歌 Lens 相机变成带有 Gemini 标志。弹出的“页面工具”面板中有两个选项:“搜索屏幕”(Lens)和“问 Gemini”。
轻点后会出现一个带有四色光晕的“问 Gemini”窗口,显示你当前页面的 URL,持续几秒钟。点击“x”可以停止分享页面。
此外,还提供一些快捷方式,比如:
• 页面摘要:点击即可获取帮助你理解任何主题的关键要点和洞察。
• 创建关于此主题的常见问题:点击以获取基于本页面及类似网站信息的常见问题。
目前,在 iPhone 和 iPad 上的 Chrome 浏览器中,Gemini 功能仅在美国支持使用,且浏览器的语言需设置为英语。你需要登录 Chrome 账户,此功能在隐身模式下不可用。
Gemini 3 Pro 目前在 LMArena 排行榜上名列前茅
今天,Google推出了 Gemini 3,该公司声称是其“最智能”和“最准确”的 AI 系统新系列模型。
Gemini 3 Pro 从今天开始在 Gemini 应用中向所有用户开放,位于美国的 Google AI Pro 和 Ultra 订阅用户可以在 AI 模式下通过选择“Thinking”在模型菜单中试用 Gemini 3 Pro。Gemini Agent 首先向 AI Ultra 订阅用户推出。
Gemini 3 Pro 具有“原生多模态”能力,这意味着它可以同时处理文本、图片和音频,而不是分别处理。
例如,Google表示,Gemini 3 Pro 可以用来翻译食谱的照片,然后将其转变为一本食谱书,或者根据一系列视频讲座制作互动式学习卡片。
Google也在暗示地批评 OpenAI,称 Gemini 3 Pro 比 ChatGPT 更不容易受到空洞奉承的影响。
Google DeepMind 的高级总监兼产品负责人Tulsee Doshi 表示,你会注意到 Gemini 3 Pro 的回答会有“明显”的改进,Google描述它为“聪明、简洁、直截了当,摒弃陈词滥调和奉承,提供真正的见解——告诉你你需要知道的,而不是你想听的。”公司还提到,它的“谄媚”程度有所降低,这是 OpenAI 在今年早些时候不得不解决的问题。
除了这些改进,Gemini 3 Pro 还具备更强的推理和自主能力,能够完成更复杂的任务,并且“能够在更长的时间跨度内可靠地进行规划。据Google介绍。这个 AI 模型支持一个实验性的 Gemini Agent 功能,可以代表你在 Gemini 应用中执行任务,比如查看和整理电子邮件,或是进行旅行的研究和预订。
Gemini for TV 将在未来几周内陆续推送到 Google TV Streamer 设备上
Gemini for TV 替代了 Google 助理,拥有相同的语音助手功能,但语气更加自然对话。例如,你可以让 Gemini for TV 根据你的喜好推荐电影,或者让它总结你正在看的节目的最后一季。你还可以用 Gemini for TV 来控制智能家居,比如查看摄像头的实时画面。
你可以在 Google TV Streamer 的设置中,进入“账户与个人资料”,选择你的账户,然后点击“语音助手”查看是否有更新。如果你的设备符合条件,就会看到“Gemini for TV”的选项。
今年9月初,Google 宣布Gemini for TV将登陆运行Google TV的智能电视和流媒体盒子。
Google 将Maps 与Gemini打通
开发者可以将 Gemini 的推理能力与超过 2.5 亿个地点的数据连接起来,打造出具有地理空间感知能力的强大 AI 产品。
🗒 标签: #Google #Gemini
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
开发者可以将 Gemini 的推理能力与超过 2.5 亿个地点的数据连接起来,打造出具有地理空间感知能力的强大 AI 产品。
Google Cloud推出Gemini Enterprise(企业版)
https://blog.google/products/google-cloud/gemini-enterprise-sundar-pichai/
🗒 标签: #Google #Gemini
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
https://blog.google/products/google-cloud/gemini-enterprise-sundar-pichai/
今天,Google发布Gemini 2.5 Flash和2.5 Flash-Lite模型的更新版本,可在Google AI Studio和Vertex AI上使用,旨在继续提供更好的质量,同时提高效率。
Gemini 2.5 Flash更新内容:更好地使用Agent工具,更高效,延迟和成本降低。
Gemini 2.5 Flash-Lite更新内容:更好地遵循指令,减少冗余输出,更强大的多模态和翻译能力。
Google表示,为了让用户更轻松地访问我们的最新模型,为每个模型系列引入了一个-latest别名。此别名始终指向最新的模型版本,让你可以体验最新功能,而无需为每个版本模型更新code,可以使用gemini-flash-latest和gemini-flash-lite-latest访问新的预览版模型。
对于需要更高稳定性的应用程序,请继续使用gemini-2.5-flash和gemini-2.5-flash-lite。
根据OpenRouter的模型页面,两款模型均为100万上下文窗口,API价格分别为:
Gemini 2.5 Flash Preview 09-2025
输出:0.3美元/每百万tokens
输入:2.5美元/每百万tokens
Gemini 2.5 Flash Lite Preview 09-2025
输出:0.1美元/每百万tokens
输入:0.4美元/每百万tokens
via 匿名