🌐IPLC专线推荐选购指南:
https://iplc.best/

🤝 联系频道主:
@IPLC_BEST_CHATBOT
发现用户明确提出实施自杀、自残等极端情境时,由人工接管!就AI拟人化互动服务,网信办公开征求意见

12月27日,网信中国微信公众号发布国家互联网信息办公室关于《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见的通知。

公众可通过以下途径和方式提出反馈意见:
1.通过电子邮件方式发送至:nirenhua@cac.gov.cn。

2.通过信函方式将意见寄至:北京市西城区车公庄大街11号国家互联网信息办公室网络管理技术局,邮编100044,并在信封上注明“人工智能拟人化互动服务管理暂行办法征求意见”。

意见反馈截止时间为2026年1月25日。


节选:
提供者应当具备心理健康保护、情感边界引导、依赖风险预警等安全能力,不得将替代社会交往、控制用户心理、诱导沉迷依赖等作为设计目标。

第十一条 提供者应当具备用户状态识别能力,在保护用户个人隐私前提下,评估用户情绪及对产品和服务的依赖程度,发现用户存在极端情绪和沉迷的,采取必要措施予以干预。

提供者应当建立应急响应机制,发现用户明确提出实施自杀、自残等极端情境时,由人工接管对话,并及时采取措施联络用户监护人、紧急联系人。针对未成年人、老年人用户,提供者应当在注册环节要求填写用户监护人、紧急联系人等信息。

第十二条 提供者应当建立未成年人模式,向用户提供未成年人模式切换、定期现实提醒、使用时长限制等个性化安全设置选项。

提供者不得提供模拟老年人用户亲属、特定关系人的服务。

提供者应当向用户提供删除交互数据的选项,用户可以选择对聊天记录等历史交互数据进行删除。监护人可以要求提供者删除未成年人历史交互数据。

提供者识别出用户出现过度依赖、沉迷倾向时,或者在用户初次使用、重新登录时,应当以弹窗等方式动态提醒用户交互内容为人工智能生成。

🗒 标签: #网信办 #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#AI #绘画

ZImageApp

为 Mac M1 ~ M5 芯片定制的 AI 生图工具,支持最新 Z-Image-Turo 生图模型和 Lora,模型下载在本地,量化后的模型总体小于 8G,在 16G 及以上内存机器上可跑图,软件大小不到10M,现已支持图生文、图片放大、批量生图功能,离线运行,免费使用。

https://www.zimageapp.com

频道 @WidgetChannel
#互联网观察 #AI

Manus AI :创业 8 个月实现 1 亿美元 ARR,刷新全球 AI 初创最快增长纪录

总部位于新加坡的 AI 初创公司 Manus AI 宣布,在成立仅 8 个月后,其年度经常性收入(ARR)已突破 1 亿美元,成为全球范围内从零增长至这一规模最快的企业之一。

据披露,Manus AI 当前的整体收入运行率已超过 1.25 亿美元,其中不仅包含订阅收入,还涵盖基于使用量的计费及其他收入来源。自今年发布 Manus 1.5 版本以来,公司持续保持每月 20% 以上的高速增长,展现出强劲的商业化能力。

在产品层面,Manus AI 今年早些时候推出了被称为“首个通用型 AI Agent”的平台,标志着 AI 应用从工具型向智能代理型演进的重要一步。公司表示,自成立以来,其平台已累计处理超过 147 万亿个 token,并创建了 8000 万台以上的虚拟计算环境。

值得注意的是,Manus AI 的核心创始与早期技术团队之前就撤出中国市场、清空国内社交账号内容,全力转战海外市场。后整体转向海外发展,并将公司总部设立在新加坡。这一“团队整体出海”的路径,也被视为近年来中国 AI 创业者在全球化、资本环境与算力生态变化背景下的一个缩影。

新闻来源

https://jp.investing.com/news/company-news/article-93CH-1361058

频道 @AppDoDo 官推 APPDOTG
📮 接读者来稿,TA向我们推荐了自己开发AI有声听书软件

🎧 Readify是一款 完全免费的AI听书应用,让你轻松把任何电子书变成自然流畅的有声书。无论你在通勤、休息,还是想在夜晚闭眼聆听故事,Readify都能让阅读变得更自由。

🔗 官网 / App Store / Google Play

核心功能亮点

📖 多格式文件支持
兼容 TXT、PDF、EPUB、MOBI、AZW3、DOCX 等主流电子书格式,上传即可自动转换为可听内容。

🎙️ AI音色库
内置 100+ 种高保真AI音色,支持 40+ 种语言。我们的AI语音拥有顶级自然效果,语气丰富、有温度,媲美真人朗读。

🔍 AI搜书
支持站内智能搜书,只需挂梯子即可免费下载书籍。
不知道看什么?在搜索栏描述你的喜好类型,AI会为你推荐合适的作品。

💬 AI问答助手
听书不止于听。任何书中人物、概念或情节疑问,都能即时提问,让AI帮你更深度理解书籍。

💻多设备同步
只要相同账号,你的书库将会在多端同步,省去重复上传的无聊过程

其他功能:
- 定时关闭:睡前听书不怕忘记关。
- 自定义书库布局:列表/宫格模式随心切换。
- 高度自定义读书页面,不仅能听,还能读的顺心!
- 纯净体验:无任何广告打扰,只专注于阅读与聆听。

🌍 无障碍优化,为视障用户发声
Readify 正在持续推进 应用无障碍优化。我们已聚集超过 100名视障用户,根据他们的实际反馈进行定向改进。

目前,iOS端的VoiceOver旁白模式已可完整使用包括听书、搜书在内的全部功能。
我们相信——阅读的权利,不应被视觉所限制。

🎁 目前100%免费使用

via Arthur Steinberg

🗒 标签: #Readify #有声书 #AI #无障碍
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#互联网观察 #AI

Google Translate 迎来 Gemini 加持:翻译更“懂人话”,耳机实时同传开启测试

Google 更新了 Google Translate:文本翻译开始用更强的 Gemini 能力来理解语境,尤其对俚语、习语、地方表达这类“直译就翻车”的句子,会给出更自然、更贴近真实含义的译文;该提升将从美国和印度开始,覆盖“英语 近 20 种语言”(含中文、日语、西语、印地语、德语等),并在 Translate(Android / iOS / Web)以及搜索结果中逐步上线。

同时,Google 还推出“戴上任何耳机就能实时听翻译”的 Live translate 测试版:把耳机连到 Android 手机,打开 Translate 点“Live translate”,就能把对话/演讲/节目内容实时翻到你选择的语言,并尽量保留说话者的语气、重音与节奏;该 Beta 目前在美国/墨西哥/印度的 Android 端开始推送,支持 70+ 语言,并计划在 2026 年扩展到 iOS 和更多国家。

此外,Translate 里的语言练习功能也在升级:新增更好的口语反馈与“连续学习天数(streak)”追踪,并把相关能力扩展到包含德国、印度、瑞典、台湾在内的近 20 个新国家/地区。

消息来源

https://blog.google/products/search/gemini-capabilities-translation-upgrades/

频道 @AppDoDo 官推 APPDOTG
谷歌的阳谋:在GPT-5.2发布日,推出史上“最深度”研究型Agent

周四,就在OpenAI端出备受期待的 GPT-5.2(内部代号 Garlic)之日,谷歌同步推出了迄今最强的深度研究型Agent——Gemini Deep Research Agent,并宣称其基于旗下最先进的Gemini 3 Pro模型。

同日,DeepMind还宣布将在英国建立首个自动化研究实验室,利用AI与机器人加速材料科学实验。

这不是“撞车”,更像一场精心策划的阳谋:在竞争对手聚焦全球目光时,谷歌以一款更具战略意味的产品回应——将Agent 推向操作系统级能力。

Deep Research通过迭代方式规划调查——它会制定搜索查询、阅读结果、发现知识缺口,然后重新进行搜索。此次发布大大增强了网络搜索功能,能够深入网页获取特定信息。

新的Gemini Deep Research agent在人类终极考试(HLE)和DeepSearchQA上取得了最先进的成绩,并且我们在BrowseComp上是最好的成绩。

它经过优化,能够以更低成本生成内容丰富、调研充分的报告。深度研究功能比以往任何时候都更实用、更智能,预计很快会在 Google 搜索、NotebookLM、Google Finance 上上线,并在升级后的 Gemini 应用中提供。


🗒 标签: #Gemini #Agent #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#互联网观察 #AI

OpenAI 发布 GPT-5.2:打造迄今最强 AI 助手 提升专业任务执行力

OpenAI 于 12 月 11 日正式发布其最新一代大语言模型 GPT-5.2,这是 GPT-5 系列的重大升级版本,旨在全面提升智能推理、复杂任务处理、视觉理解和长文本把握等能力。

据官方介绍,GPT-5.2 是 OpenAI 迄今最先进的模型系列之一,特别针对专业知识型工作进行了优化,包括创建电子表格、设计演示文稿、生成代码、理解图像内容及解决多步骤逻辑任务等场景。官方声明指出,该模型在各项基准测试中刷新了行业标准表现。

GPT-5.2 将在 ChatGPT 产品中以三个版本推出:

Instant(即时版) — 快速响应用户查询;
Thinking(思考版) — 强化深度推理和复杂任务解析;
Pro(专业版) — 面向企业级与高要求工作流程。

三者将从发布日起逐步向付费用户开放,同时开发者可通过 API 即刻接入。官方数据显示,使用 GPT-5.2 的专业用户每天可以节省大量时间,有的用户反馈在日常工作中可节省 40 至 60 分钟甚至更多。

新版本在处理复杂推理和多步骤工作上比前代模型表现更稳定、更高效。OpenAI 表示,此次发布也回应了行业竞争的加剧,尤其是来自 Google 等公司的先进 AI 竞争者推动了模型性能的快速迭代。尽管如此,OpenAI 仍将多款旧版模型继续保留在 API 平台供开发者使用。

新闻来源

https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2/

频道 @AppDoDo 官推 APPDOTG
Figma 增加了更多类似 Photoshop 的 AI 图像编辑工具

用户现在可以快速删除和分离对象,并调整图片以适应新的宽高比例。


Figma 正在推出三款全新的 AI 驱动创意工具,帮助用户无需切换平台即可编辑图片。这些工具在 Figma 设计和 Figma 绘图中均可使用,能够快速删除图片中的对象、将对象隔离以便重新调整位置,以及将图片扩展到原有尺寸之外。

Erase object和 Isolate object工具
配合 Figma 现有的套索工具使用,用户可以用套索工具围绕图片中需要编辑的特定区域进行绘制。随后,可以立即将这些区域内的对象或人物从图片中删除,并自动填充背景,或者将它们与背景层分离,方便进行重新定位或编辑。


扩展图像工具效果图
可以在不失真的情况下,将图片的背景扩展以适应新的宽高比。


Figma 还推出了一个新的图像编辑工具栏,将所有编辑功能集中在一个地方,侧边栏还包括像“去除背景”这样的现有功能。

这些新功能目前只对拥有“Full Seat”订阅权限的 Figma 用户开放。Figma 表示,明年计划将这些新编辑工具推广到其平台上的其他应用中。

🗒 标签: #Figma #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#AI #prompt #跨平台

💡 PromptHub - 一个开源的 AI Prompt 管理工具

⬇️ 下载页面

该工具可以一站式管理 AI 提示词,支持版本控制、变量模板、全文搜索等功能,数据完全存储在本地。

支持Windows、macOS、Linux

📮投稿 📢频道 💬群聊 🔎索引
#听书 #AI #电子书

Readify

基于 AI 实现的电子书转有声书工具,兼容 TXT、PDF、EPUB、MOBI、AZW3、DOCX 等主流电子书格式,内置 100+ 种高保真 AI 音色,支持 40+ 种语言,支持站内智能搜书、多设备同步、定时关闭、自定义书库布局等,且针对无障碍用户进行了优化,目前免费无广告,适用于 iOS 和 Android 系统。

https://readifyai.com

频道 @WidgetChannel
直接嵌入手机系统!豆包AI手机,帮你跨平台比价点外卖、自动回消息

12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴nubia工程样机。

与传统App不同,这款直接嵌入操作系统底层的AI,不仅拥有专属物理按键和“屏幕感知”能力,更展现了令互联网巨头战栗的野心:它试图绕过APP的信息孤岛,直接接管操作权。

据介绍,豆包手机助手,是在豆包APP的基础上,和手机厂商在操作系统层面合作的AI助手软件。

在手机助手的落地路径上,豆包明确表示没有自研手机计划,正与多家手机厂商洽谈,以“生态合作”形式将豆包手机助手整合进不同品牌机型中,相关进展将在后续公布。

现阶段,开发者和科技爱好者可以在豆包与中兴合作的工程样机nubia M153 上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价3499元。

🗒 标签: #字节跳动 #豆包 #中兴 #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#AI #翻译 #视频 #开源

AI Auto Video(Audio) Translation

全自动音视频翻译工具,基于 Whisper 进行高精度语音识别,并可调用多种翻译引擎实现多语言互译,支持多种格式的音视频文件,一键即可生成字幕,同时提供字幕微调、视频预览等辅助功能,还能对内容执行 AI 总结与问答,操作简单流畅,免费开源。

https://github.com/Chenyme/Chenyme-AAVT

频道 @Edgebyte
苹果最新研究表明,LLMs 可以通过音频和运动数据判断你正在做什么

一篇题为“使用 LLMs 进行后期多模态传感器融合以进行活动识别”的新论文,揭示了苹果公司可能考虑结合 LLMs 分析与传统传感器数据,以更准确地了解用户的活动。

他们认为,这具有很大的潜力,可以在传感器数据不足的情况下,使活动分析变得更加准确。
传感器数据流为下游应用提供了有关活动和上下文的宝贵信息,不过整合互补信息可能颇具挑战性。

我们的数据表明,大型语言模型(LLMs)可用于对来自音频和运动时间序列数据的活动进行后期融合分类。

我们从 Ego4D 数据集中整理出了一部分数据,用于在不同上下文中(例如家庭活动、体育运动)进行多样化的活动识别。

经过评估的 LLM 实现了显著高于随机水平的 12 类零样本和少样本分类 F1 分数,且无需针对特定任务进行训练。

通过基于 LLM 的融合来自模态特定模型的零样本分类,可以在有限的对齐训练数据用于学习共享嵌入空间的情况下,实现多模态时间应用。

此外,基于 LLM 的融合能够实现模型部署,而无需为特定应用的多模态模型额外占用内存和计算资源。


换句话说,LLMs 实际上非常擅长从基本的音频和运动信号推断用户在做什么,即使他们没有受过专门的训练。此外,当只给出一个例子时,它们的准确性会进一步提高。

在这项研究中,LLM 并没有接收实际的音频录音,而是接收由音频模型和基于 IMU 的运动模型(通过加速度计和陀螺仪数据追踪运动)生成的简短文本描述。

研究人员介绍了他们使用的 Ego4D 数据集,是一个庞大的第一人称视角媒体资料库,涵盖了数千小时的真实环境和场景,包括家庭任务和户外活动。
我们从 Ego4D 数据集中筛选出日常活动,方法是在提供的描述中搜索日常生活中的活动。整理出一个包含 12 个主要活动的 20 秒样本数据集,包括吸尘、做饭、洗衣、吃饭、打篮球、踢足球、与宠物玩耍、读书、使用电脑、洗碗、看电视和锻炼/举重。这些活动的选择旨在涵盖家庭和健身任务的多样性,并且它们在更大数据集中较为常见。


苹果公司在这项研究的同时还发布了补充材料,包括 Ego4D 片段编号、时间戳、提示信息以及用于实验的一次性示例,旨在帮助研究人员复现研究结果。

🗒 标签: #Apple #LLMs #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
Windows PowerToys 提供本地 AI 驱动的复制粘贴功能

微软正在为 Windows 11 的 PowerToys 升级其“高级粘贴”工具,允许用户使用本地的 AI 模型来实现部分功能。

在0.96版本的更新中,你可以通过微软的Foundry Local工具或开源的Ollama来路由请求,这两种工具都在你的设备的神经处理单元(NPU)上运行AI模型,而无需连接到云端。

这意味着你无需购买 API 额度即可执行某些操作,比如让 AI 翻译或总结你复制到剪贴板的内容。而且,你可以将数据保存在本地设备上。

除了支持本地 AI 外,现在您还可以将高级粘贴配置为与包括 Azure OpenAI、Gemini 和 Mistral 在内的多个其他在线模型配合使用。此前该工具仅支持 OpenAI。

🗒 标签: #微软 #Windows #PowerToys #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
OpenAI推出GPT‑5.1-Codex-Max编程模型,专为长时间运行的任务打造

OpenAI发布了GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代Agentic编码模型。

相较于之前的模型,GPT‑5.1-Codex-Max采用了“压缩(compaction)”技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的Token。OpenAI表示,该模型不仅性能提升,还实现了更快、更高效的Token利用率。

🗒 标签: #OpenAI #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
Google推出 Gemini 3,这是其目前“最智能”的AI模型

Gemini 3 Pro 目前在 LMArena 排行榜上名列前茅


今天,Google推出了 Gemini 3,该公司声称是其“最智能”和“最准确”的 AI 系统新系列模型。

Gemini 3 Pro 从今天开始在 Gemini 应用中向所有用户开放,位于美国的 Google AI Pro 和 Ultra 订阅用户可以在 AI 模式下通过选择“Thinking”在模型菜单中试用 Gemini 3 Pro。Gemini Agent 首先向 AI Ultra 订阅用户推出。

Gemini 3 Pro 具有“原生多模态”能力,这意味着它可以同时处理文本、图片和音频,而不是分别处理。

例如,Google表示,Gemini 3 Pro 可以用来翻译食谱的照片,然后将其转变为一本食谱书,或者根据一系列视频讲座制作互动式学习卡片。

Google也在暗示地批评 OpenAI,称 Gemini 3 Pro 比 ChatGPT 更不容易受到空洞奉承的影响。

Google DeepMind 的高级总监兼产品负责人Tulsee Doshi 表示,你会注意到 Gemini 3 Pro 的回答会有“明显”的改进,Google描述它为“聪明、简洁、直截了当,摒弃陈词滥调和奉承,提供真正的见解——告诉你你需要知道的,而不是你想听的。”公司还提到,它的“谄媚”程度有所降低,这是 OpenAI 在今年早些时候不得不解决的问题。


除了这些改进,Gemini 3 Pro 还具备更强的推理和自主能力,能够完成更复杂的任务,并且“能够在更长的时间跨度内可靠地进行规划。据Google介绍。这个 AI 模型支持一个实验性的 Gemini Agent 功能,可以代表你在 Gemini 应用中执行任务,比如查看和整理电子邮件,或是进行旅行的研究和预订。

🗒 标签: #Google #Gemini #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#素材 #AI #背景

Vave BG

一个 AI 图片素材网站,可将其用于网站、演示、海报或壁纸等多种设计场景,由设计师 Gyo 创建,每日更新约 10 张新作品,图像风格多样,从抽象绘画、城市夜景到极简纹理应有尽有,且每幅作品都有创作提示(prompt),便于用户自行生成,免费可商用,无需注册。

https://vavebg.com

频道 @WidgetChannel
#AI #在线工具 #制图工具

📊 Smart Excalidraw - 用自然语言绘制专业图表

🌐 在线体验

顾名思义,Smart Excalidraw 是 AI 版本的 Excalidraw,通过自然语言便可以生成 Excalidraw 格式的图表。

支持 20+ 种图表类型,包括流程图、架构图、时序图、ER 图、思维导图等。

使用需要大模型 API KEY

➡️ 已收录至「制图工具

📮投稿 📢频道 💬群聊 🔎索引
#wiki #AI #开源 #建站

🐼 PandaWiki - 一款 AI 大模型驱动的开源知识库搭建系统

🐙 开源页面

PandaWiki 可以帮助你快速构建智能化的产品文档、技术文档、FAQ、博客系统等,借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索等能力。

开发团队是中国的,所以本土化做的比较好,并且最低仅需1H2G的配置即可运行

📮投稿 📢频道 💬群聊 🔎索引
#AI #剪辑 #开源

Tailor

基于 AI 的视频智能裁剪与生成优化工具,支持人脸剪辑、语音剪辑、口播生成、字幕生成、背景替换、清晰度优化等功能。只需下载 Tailor 发布版 ,无需环境配置即可直接免费使用。

🐙 项目地址

频道 @Edgebyte
 
 
Back to Top