发现用户明确提出实施自杀、自残等极端情境时,由人工接管!就AI拟人化互动服务,网信办公开征求意见
12月27日,网信中国微信公众号发布国家互联网信息办公室关于《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见的通知。
节选:
提供者应当具备心理健康保护、情感边界引导、依赖风险预警等安全能力,不得将替代社会交往、控制用户心理、诱导沉迷依赖等作为设计目标。
第十一条 提供者应当具备用户状态识别能力,在保护用户个人隐私前提下,评估用户情绪及对产品和服务的依赖程度,发现用户存在极端情绪和沉迷的,采取必要措施予以干预。
提供者应当建立应急响应机制,发现用户明确提出实施自杀、自残等极端情境时,由人工接管对话,并及时采取措施联络用户监护人、紧急联系人。针对未成年人、老年人用户,提供者应当在注册环节要求填写用户监护人、紧急联系人等信息。
第十二条 提供者应当建立未成年人模式,向用户提供未成年人模式切换、定期现实提醒、使用时长限制等个性化安全设置选项。
提供者不得提供模拟老年人用户亲属、特定关系人的服务。
提供者应当向用户提供删除交互数据的选项,用户可以选择对聊天记录等历史交互数据进行删除。监护人可以要求提供者删除未成年人历史交互数据。
提供者识别出用户出现过度依赖、沉迷倾向时,或者在用户初次使用、重新登录时,应当以弹窗等方式动态提醒用户交互内容为人工智能生成。
🗒 标签: #网信办 #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
12月27日,网信中国微信公众号发布国家互联网信息办公室关于《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见的通知。
公众可通过以下途径和方式提出反馈意见:
1.通过电子邮件方式发送至:nirenhua@cac.gov.cn。
2.通过信函方式将意见寄至:北京市西城区车公庄大街11号国家互联网信息办公室网络管理技术局,邮编100044,并在信封上注明“人工智能拟人化互动服务管理暂行办法征求意见”。
意见反馈截止时间为2026年1月25日。
节选:
提供者应当具备心理健康保护、情感边界引导、依赖风险预警等安全能力,不得将替代社会交往、控制用户心理、诱导沉迷依赖等作为设计目标。
第十一条 提供者应当具备用户状态识别能力,在保护用户个人隐私前提下,评估用户情绪及对产品和服务的依赖程度,发现用户存在极端情绪和沉迷的,采取必要措施予以干预。
提供者应当建立应急响应机制,发现用户明确提出实施自杀、自残等极端情境时,由人工接管对话,并及时采取措施联络用户监护人、紧急联系人。针对未成年人、老年人用户,提供者应当在注册环节要求填写用户监护人、紧急联系人等信息。
第十二条 提供者应当建立未成年人模式,向用户提供未成年人模式切换、定期现实提醒、使用时长限制等个性化安全设置选项。
提供者不得提供模拟老年人用户亲属、特定关系人的服务。
提供者应当向用户提供删除交互数据的选项,用户可以选择对聊天记录等历史交互数据进行删除。监护人可以要求提供者删除未成年人历史交互数据。
提供者识别出用户出现过度依赖、沉迷倾向时,或者在用户初次使用、重新登录时,应当以弹窗等方式动态提醒用户交互内容为人工智能生成。
ZImageApp
为 Mac M1 ~ M5 芯片定制的 AI 生图工具,支持最新 Z-Image-Turo 生图模型和 Lora,模型下载在本地,量化后的模型总体小于 8G,在 16G 及以上内存机器上可跑图,软件大小不到10M,现已支持图生文、图片放大、批量生图功能,离线运行,免费使用。
https://www.zimageapp.com
频道 @WidgetChannel
▎Manus AI :创业 8 个月实现 1 亿美元 ARR,刷新全球 AI 初创最快增长纪录
总部位于新加坡的 AI 初创公司 Manus AI 宣布,在成立仅 8 个月后,其年度经常性收入(ARR)已突破 1 亿美元,成为全球范围内从零增长至这一规模最快的企业之一。
据披露,Manus AI 当前的整体收入运行率已超过 1.25 亿美元,其中不仅包含订阅收入,还涵盖基于使用量的计费及其他收入来源。自今年发布 Manus 1.5 版本以来,公司持续保持每月 20% 以上的高速增长,展现出强劲的商业化能力。
在产品层面,Manus AI 今年早些时候推出了被称为“首个通用型 AI Agent”的平台,标志着 AI 应用从工具型向智能代理型演进的重要一步。公司表示,自成立以来,其平台已累计处理超过 147 万亿个 token,并创建了 8000 万台以上的虚拟计算环境。
值得注意的是,Manus AI 的核心创始与早期技术团队之前就撤出中国市场、清空国内社交账号内容,全力转战海外市场。后整体转向海外发展,并将公司总部设立在新加坡。这一“团队整体出海”的路径,也被视为近年来中国 AI 创业者在全球化、资本环境与算力生态变化背景下的一个缩影。
▎新闻来源
https://jp.investing.com/news/company-news/article-93CH-1361058
频道 @AppDoDo 官推 APPDOTG
🎧 Readify是一款 完全免费的AI听书应用,让你轻松把任何电子书变成自然流畅的有声书。无论你在通勤、休息,还是想在夜晚闭眼聆听故事,Readify都能让阅读变得更自由。
✨ 核心功能亮点
📖 多格式文件支持
兼容 TXT、PDF、EPUB、MOBI、AZW3、DOCX 等主流电子书格式,上传即可自动转换为可听内容。
🎙️ AI音色库
内置 100+ 种高保真AI音色,支持 40+ 种语言。我们的AI语音拥有顶级自然效果,语气丰富、有温度,媲美真人朗读。
🔍 AI搜书
支持站内智能搜书,只需挂梯子即可免费下载书籍。
不知道看什么?在搜索栏描述你的喜好类型,AI会为你推荐合适的作品。
💬 AI问答助手
听书不止于听。任何书中人物、概念或情节疑问,都能即时提问,让AI帮你更深度理解书籍。
💻多设备同步
只要相同账号,你的书库将会在多端同步,省去重复上传的无聊过程
其他功能:
- 定时关闭:睡前听书不怕忘记关。
- 自定义书库布局:列表/宫格模式随心切换。
- 高度自定义读书页面,不仅能听,还能读的顺心!
- 纯净体验:无任何广告打扰,只专注于阅读与聆听。
🌍 无障碍优化,为视障用户发声
Readify 正在持续推进 应用无障碍优化。我们已聚集超过 100名视障用户,根据他们的实际反馈进行定向改进。
目前,iOS端的VoiceOver旁白模式已可完整使用包括听书、搜书在内的全部功能。
我们相信——阅读的权利,不应被视觉所限制。
🎁 目前100%免费使用
via Arthur Steinberg
▎Google Translate 迎来 Gemini 加持:翻译更“懂人话”,耳机实时同传开启测试
Google 更新了 Google Translate:文本翻译开始用更强的 Gemini 能力来理解语境,尤其对俚语、习语、地方表达这类“直译就翻车”的句子,会给出更自然、更贴近真实含义的译文;该提升将从美国和印度开始,覆盖“英语 ↔ 近 20 种语言”(含中文、日语、西语、印地语、德语等),并在 Translate(Android / iOS / Web)以及搜索结果中逐步上线。
同时,Google 还推出“戴上任何耳机就能实时听翻译”的 Live translate 测试版:把耳机连到 Android 手机,打开 Translate 点“Live translate”,就能把对话/演讲/节目内容实时翻到你选择的语言,并尽量保留说话者的语气、重音与节奏;该 Beta 目前在美国/墨西哥/印度的 Android 端开始推送,支持 70+ 语言,并计划在 2026 年扩展到 iOS 和更多国家。
此外,Translate 里的语言练习功能也在升级:新增更好的口语反馈与“连续学习天数(streak)”追踪,并把相关能力扩展到包含德国、印度、瑞典、台湾在内的近 20 个新国家/地区。
▎消息来源
https://blog.google/products/search/gemini-capabilities-translation-upgrades/
频道 @AppDoDo 官推 APPDOTG
周四,就在OpenAI端出备受期待的 GPT-5.2(内部代号 Garlic)之日,谷歌同步推出了迄今最强的深度研究型Agent——Gemini Deep Research Agent,并宣称其基于旗下最先进的Gemini 3 Pro模型。
同日,DeepMind还宣布将在英国建立首个自动化研究实验室,利用AI与机器人加速材料科学实验。
这不是“撞车”,更像一场精心策划的阳谋:在竞争对手聚焦全球目光时,谷歌以一款更具战略意味的产品回应——将Agent 推向操作系统级能力。
Deep Research通过迭代方式规划调查——它会制定搜索查询、阅读结果、发现知识缺口,然后重新进行搜索。此次发布大大增强了网络搜索功能,能够深入网页获取特定信息。
新的Gemini Deep Research agent在人类终极考试(HLE)和DeepSearchQA上取得了最先进的成绩,并且我们在BrowseComp上是最好的成绩。
它经过优化,能够以更低成本生成内容丰富、调研充分的报告。深度研究功能比以往任何时候都更实用、更智能,预计很快会在 Google 搜索、NotebookLM、Google Finance 上上线,并在升级后的 Gemini 应用中提供。
▎OpenAI 发布 GPT-5.2:打造迄今最强 AI 助手 提升专业任务执行力
OpenAI 于 12 月 11 日正式发布其最新一代大语言模型 GPT-5.2,这是 GPT-5 系列的重大升级版本,旨在全面提升智能推理、复杂任务处理、视觉理解和长文本把握等能力。
据官方介绍,GPT-5.2 是 OpenAI 迄今最先进的模型系列之一,特别针对专业知识型工作进行了优化,包括创建电子表格、设计演示文稿、生成代码、理解图像内容及解决多步骤逻辑任务等场景。官方声明指出,该模型在各项基准测试中刷新了行业标准表现。
GPT-5.2 将在 ChatGPT 产品中以三个版本推出:
Instant(即时版) — 快速响应用户查询;
Thinking(思考版) — 强化深度推理和复杂任务解析;
Pro(专业版) — 面向企业级与高要求工作流程。
三者将从发布日起逐步向付费用户开放,同时开发者可通过 API 即刻接入。官方数据显示,使用 GPT-5.2 的专业用户每天可以节省大量时间,有的用户反馈在日常工作中可节省 40 至 60 分钟甚至更多。
新版本在处理复杂推理和多步骤工作上比前代模型表现更稳定、更高效。OpenAI 表示,此次发布也回应了行业竞争的加剧,尤其是来自 Google 等公司的先进 AI 竞争者推动了模型性能的快速迭代。尽管如此,OpenAI 仍将多款旧版模型继续保留在 API 平台供开发者使用。
▎新闻来源
https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2/
频道 @AppDoDo 官推 APPDOTG
用户现在可以快速删除和分离对象,并调整图片以适应新的宽高比例。
Figma 正在推出三款全新的 AI 驱动创意工具,帮助用户无需切换平台即可编辑图片。这些工具在 Figma 设计和 Figma 绘图中均可使用,能够快速删除图片中的对象、将对象隔离以便重新调整位置,以及将图片扩展到原有尺寸之外。
Erase object和 Isolate object工具
可配合 Figma 现有的套索工具使用,用户可以用套索工具围绕图片中需要编辑的特定区域进行绘制。随后,可以立即将这些区域内的对象或人物从图片中删除,并自动填充背景,或者将它们与背景层分离,方便进行重新定位或编辑。
扩展图像工具(效果图)
可以在不失真的情况下,将图片的背景扩展以适应新的宽高比。
Figma 还推出了一个新的图像编辑工具栏,将所有编辑功能集中在一个地方,侧边栏还包括像“去除背景”这样的现有功能。
这些新功能目前只对拥有“Full Seat”订阅权限的 Figma 用户开放。Figma 表示,明年计划将这些新编辑工具推广到其平台上的其他应用中。
Readify
基于 AI 实现的电子书转有声书工具,兼容 TXT、PDF、EPUB、MOBI、AZW3、DOCX 等主流电子书格式,内置 100+ 种高保真 AI 音色,支持 40+ 种语言,支持站内智能搜书、多设备同步、定时关闭、自定义书库布局等,且针对无障碍用户进行了优化,目前免费无广告,适用于 iOS 和 Android 系统。
https://readifyai.com
频道 @WidgetChannel
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴nubia工程样机。
与传统App不同,这款直接嵌入操作系统底层的AI,不仅拥有专属物理按键和“屏幕感知”能力,更展现了令互联网巨头战栗的野心:它试图绕过APP的信息孤岛,直接接管操作权。
据介绍,豆包手机助手,是在豆包APP的基础上,和手机厂商在操作系统层面合作的AI助手软件。
在手机助手的落地路径上,豆包明确表示没有自研手机计划,正与多家手机厂商洽谈,以“生态合作”形式将豆包手机助手整合进不同品牌机型中,相关进展将在后续公布。
现阶段,开发者和科技爱好者可以在豆包与中兴合作的工程样机nubia M153 上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价3499元。
一篇题为“使用 LLMs 进行后期多模态传感器融合以进行活动识别”的新论文,揭示了苹果公司可能考虑结合 LLMs 分析与传统传感器数据,以更准确地了解用户的活动。
他们认为,这具有很大的潜力,可以在传感器数据不足的情况下,使活动分析变得更加准确。
传感器数据流为下游应用提供了有关活动和上下文的宝贵信息,不过整合互补信息可能颇具挑战性。
我们的数据表明,大型语言模型(LLMs)可用于对来自音频和运动时间序列数据的活动进行后期融合分类。
我们从 Ego4D 数据集中整理出了一部分数据,用于在不同上下文中(例如家庭活动、体育运动)进行多样化的活动识别。
经过评估的 LLM 实现了显著高于随机水平的 12 类零样本和少样本分类 F1 分数,且无需针对特定任务进行训练。
通过基于 LLM 的融合来自模态特定模型的零样本分类,可以在有限的对齐训练数据用于学习共享嵌入空间的情况下,实现多模态时间应用。
此外,基于 LLM 的融合能够实现模型部署,而无需为特定应用的多模态模型额外占用内存和计算资源。
换句话说,LLMs 实际上非常擅长从基本的音频和运动信号推断用户在做什么,即使他们没有受过专门的训练。此外,当只给出一个例子时,它们的准确性会进一步提高。
在这项研究中,LLM 并没有接收实际的音频录音,而是接收由音频模型和基于 IMU 的运动模型(通过加速度计和陀螺仪数据追踪运动)生成的简短文本描述。
研究人员介绍了他们使用的 Ego4D 数据集,是一个庞大的第一人称视角媒体资料库,涵盖了数千小时的真实环境和场景,包括家庭任务和户外活动。
我们从 Ego4D 数据集中筛选出日常活动,方法是在提供的描述中搜索日常生活中的活动。整理出一个包含 12 个主要活动的 20 秒样本数据集,包括吸尘、做饭、洗衣、吃饭、打篮球、踢足球、与宠物玩耍、读书、使用电脑、洗碗、看电视和锻炼/举重。这些活动的选择旨在涵盖家庭和健身任务的多样性,并且它们在更大数据集中较为常见。
苹果公司在这项研究的同时还发布了补充材料,包括 Ego4D 片段编号、时间戳、提示信息以及用于实验的一次性示例,旨在帮助研究人员复现研究结果。
微软正在为 Windows 11 的 PowerToys 升级其“高级粘贴”工具,允许用户使用本地的 AI 模型来实现部分功能。
在0.96版本的更新中,你可以通过微软的Foundry Local工具或开源的Ollama来路由请求,这两种工具都在你的设备的神经处理单元(NPU)上运行AI模型,而无需连接到云端。
这意味着你无需购买 API 额度即可执行某些操作,比如让 AI 翻译或总结你复制到剪贴板的内容。而且,你可以将数据保存在本地设备上。
除了支持本地 AI 外,现在您还可以将高级粘贴配置为与包括 Azure OpenAI、Gemini 和 Mistral 在内的多个其他在线模型配合使用。此前该工具仅支持 OpenAI。
OpenAI发布了GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代Agentic编码模型。
相较于之前的模型,GPT‑5.1-Codex-Max采用了“压缩(compaction)”技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的Token。OpenAI表示,该模型不仅性能提升,还实现了更快、更高效的Token利用率。
Gemini 3 Pro 目前在 LMArena 排行榜上名列前茅
今天,Google推出了 Gemini 3,该公司声称是其“最智能”和“最准确”的 AI 系统新系列模型。
Gemini 3 Pro 从今天开始在 Gemini 应用中向所有用户开放,位于美国的 Google AI Pro 和 Ultra 订阅用户可以在 AI 模式下通过选择“Thinking”在模型菜单中试用 Gemini 3 Pro。Gemini Agent 首先向 AI Ultra 订阅用户推出。
Gemini 3 Pro 具有“原生多模态”能力,这意味着它可以同时处理文本、图片和音频,而不是分别处理。
例如,Google表示,Gemini 3 Pro 可以用来翻译食谱的照片,然后将其转变为一本食谱书,或者根据一系列视频讲座制作互动式学习卡片。
Google也在暗示地批评 OpenAI,称 Gemini 3 Pro 比 ChatGPT 更不容易受到空洞奉承的影响。
Google DeepMind 的高级总监兼产品负责人Tulsee Doshi 表示,你会注意到 Gemini 3 Pro 的回答会有“明显”的改进,Google描述它为“聪明、简洁、直截了当,摒弃陈词滥调和奉承,提供真正的见解——告诉你你需要知道的,而不是你想听的。”公司还提到,它的“谄媚”程度有所降低,这是 OpenAI 在今年早些时候不得不解决的问题。
除了这些改进,Gemini 3 Pro 还具备更强的推理和自主能力,能够完成更复杂的任务,并且“能够在更长的时间跨度内可靠地进行规划。据Google介绍。这个 AI 模型支持一个实验性的 Gemini Agent 功能,可以代表你在 Gemini 应用中执行任务,比如查看和整理电子邮件,或是进行旅行的研究和预订。
Vave BG
一个 AI 图片素材网站,可将其用于网站、演示、海报或壁纸等多种设计场景,由设计师 Gyo 创建,每日更新约 10 张新作品,图像风格多样,从抽象绘画、城市夜景到极简纹理应有尽有,且每幅作品都有创作提示(prompt),便于用户自行生成,免费可商用,无需注册。
https://vavebg.com
频道 @WidgetChannel