官方正式名称为「Gemini 3 Pro Image」。它最高可输出 4K 分辨率图像、支持多轮编辑、搜索增强等功能,应该是目前全球最先进的 AI 绘画模型了![博客][直达][提示词大全]
新增全新购物助手功能,用户只需输入购物需求,ChatGPT 就会开始为用户筛选合适的产品;取消了独立的「ChatGPT Voice」入口,现在用户可以直接在聊天中使用语音功能。
可智能修复bug、永不遗忘对话,对标 GPT-5.1 和 Gemini Pro。
FLUX.2 有 4 个不同规模和用途的模型包括 Pro、Flex、Dev、Klein,并在技术上实现了显著提升,包括引入多参考条件、更高保真度的输出以及改进的文本渲染。[开源地址][官方博客][FLUX.1介绍]
TRAE SOLO 是一种高度自动化的开发方式,以 AI 为主导,可理解目标、承接上下文并调度工具,独立推进各阶段开发任务。且完全免费使用。(TRAE 是字节跳动旗下的 AI 编程工具)[直达]
*题图由 Nano Banana Pro 免费生成
📮投稿 📢频道 💬群聊
内容比较多,点开查看
⏺ 马斯克宣布 Grok 语音模式正式上线:支持10种模式,还包括18+选项。仅支持英文,貌似需要升级才能使用。⏺ Anthropic 推出混合推理模型「Claude 3.7 Sonnet」:旨在解决更复杂的问题,并在数学和编码等领域展现出超越以往的性能。[介绍][免费使用]⏺ ChatGPT 新增 Safari 扩展功能:可设置 为Safari 地址栏默认搜索引擎⏺ 今天,OpenAI 免费开放了基于GPT-4o mini 的 ChatGPT 高级语音聊天模式⏺ Perplexity AI 推出新全浏览器 Comet:专注于 “代理搜索” 功能,以「智能体搜索」为核心概念。[加入候补]⏺ Google 推出编程助手「Gemini Code Assist」:每月 18 万次免费代码补全。[直达]⏺ 瑞典公司 lovable 推出无代码构建应用 AI 工具:无需任何编程基础,只需要提示词即可开发一个完整的应用软件。现在该平台每天生成超过25000个新产品。[直达]⏺ Exa 发布 AI 搜索工具「Websets」:用户可以通过 Websets 执行如“美国市值前50的AI创业公司CEO信息”这样的复杂查询,可实现一次性读取并分析超过1000+网页数据并生成结构化的结果表格。[直达]
#AI资讯
⏺️Google 发布 AI 图像创意工具「Whisk」:可以将图片的主体、背景和风格融合生成全新的创意图片。目前仅支持美国(ip)地区[官方Demo][在线使用]
⏺️Google 文生图大模型「Imagen 3」迎来升级:可以生成更明亮、构图更好的图像,还可更准确地渲染更多不同的艺术风格[本频道报道][在线使用]
⏺️Google 发布视频生成大模型「Veo2」:支持文本和图像生成视频,最高可生成 4K 分辨。还可根据提示词完成相机控制,如广角镜头、POV 和无人机拍摄,模拟真实世界的物理效果和多种视觉[官方Demo][加入候补]
⏺️Pika AI 发布了 Pika 2.0 视频生成模型:提升多主体一致性。上传多张图片,Pika 会精准参考图片中的元素并生成视频。比如可以将一个场景、人物、衣服、挂饰等融合成一个完整视频[官方Demo][直达]
⏺️Google 发布 AI 图像创意工具「Whisk」:可以将图片的主体、背景和风格融合生成全新的创意图片。目前仅支持美国(ip)地区[官方Demo][在线使用]
这个超好玩,而且效果很牛逼,你大爷终究是你大爷
⏺️Google 文生图大模型「Imagen 3」迎来升级:可以生成更明亮、构图更好的图像,还可更准确地渲染更多不同的艺术风格[本频道报道][在线使用]
封面图就是此模型生成,感觉比 Flux.1 还略胜一筹
⏺️Google 发布视频生成大模型「Veo2」:支持文本和图像生成视频,最高可生成 4K 分辨。还可根据提示词完成相机控制,如广角镜头、POV 和无人机拍摄,模拟真实世界的物理效果和多种视觉[官方Demo][加入候补]
⏺️Pika AI 发布了 Pika 2.0 视频生成模型:提升多主体一致性。上传多张图片,Pika 会精准参考图片中的元素并生成视频。比如可以将一个场景、人物、衣服、挂饰等融合成一个完整视频[官方Demo][直达]