🌐IPLC专线推荐选购指南:
https://iplc.best/

🤝 联系频道主:
@IPLC_BEST_CHATBOT
OpenAI研究人员解释AI为何会“产生幻觉”

OpenAI的研究人员声称,他们已经攻克了影响大语言模型性能的最大障碍之一:“幻觉”(hallucinations)问题。

当大语言模型生成不准确的信息,并将其作为事实呈现时,就会产生“幻觉”。从OpenAI的GPT-5到Anthropic的Claude,许多热门的的大语言模型都受到这一问题的困扰。

OpenAI在周四发布的一篇文章中公布了其核心发现:大语言模型之所以产生幻觉,是因为它们的训练方法更倾向于奖励“猜测”,而不是“承认不确定性”。

换句话说,大语言模型被告知要“不懂装懂,直到蒙对为止”(fake it till they make it)。研究人员在文章中写道:“幻觉”问题之所以持续存在,与大多数评估的评分方式有关——AI模型被优化成优秀的应试者,在不确定时进行猜测能提高考试成绩。大语言模型基本上一直处于“应试模式”,它们回答问题时,仿佛生活中的一切都是二进制的——非对即错,非黑即白。

在许多方面,它们并未准备好应对现实生活,因为在现实中,不确定性比确定性更常见,而真正的准确性也并非必然。

研究人员表示:人类在学校之外,在艰苦的磨练中学会了表达不确定性的价值。而另一方面,大语言模型主要通过那些惩罚“不确定性”的考试来进行评估。


OpenAI发现,幻觉问题有解决办法,而这与重新设计评估指标有关。

OpenAI表示:根本问题在于大量的评估标准未能与现实目标对齐。必须调整众多主要评估方法,以停止在模型不确定时惩罚其“弃权”行为。

目前广泛使用的、基于准确率的评估方法需要更新,使其评分机制不鼓励猜测。如果主记分牌(main scoreboards)继续奖励侥幸的猜测,模型就会继续学习去猜测。


via 匿名

🗒 标签: #OpenAI #ChatGPT
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
逆天腾讯视频客户端
必不可少的两个 MCP Server


claude mcp add --transport http deepwiki https://mcp.deepwiki.com/mcp

claude mcp add --transport http context7 https://mcp.context7.com/mcp
#AI #自动化 #小红书

🤭 让 Claude Code 自动化运营小红书

基本思路如下:

1. 获取内容或者让 Claude Code 自己调研
2. 让 Claude Code 调用 xiaohongshu-mcp 完成发布

🐶 项目地址:https://github.com/xpzouying/xiaohongshu-mcp
😘 文章介绍:https://www.haha.ai/xiaohongshu-mcp

☀️ 看了作者的文章,整个流程下来是非常简单的,并且效果非常棒。只是感觉长期运营容易被小红书标记为 AI 生成,导致不给流量?

📮投稿 📢频道 💬群聊 🔎索引
#音乐 #下载

Lucida

音乐在线下载服务,支持 Qobuz、Tidal、SoundCloud、Deezer、Amazon Music 和 Yandex Music 等平台的音乐资源,只需输入歌曲名称或链接,即可进行搜索并下载,支持码率选择,最高可下载 Flac 无损音质,免费无广告,无需注册。

测试了一下,支持的歌曲还挺全的,搜不到可以尝试繁体,或者带歌手,只能说一句很牛逼了。

https://lucida.to

频道 @WidgetChannel
#文档 #预览

Office Viewer

在线文档浏览工具,除了 Word、Excel、PowerPoint、PDF 外,还涵盖 CSV、ZIP 与 RAR 文件和文本对比功能,通过拖拽、点击上传和 URL 即可瞬间查看和对比文档内容,完全本地运行,免费使用,无需注册。

没太多使用场景,没安装 Office 软件倒是可以临时应急一下,只能查看,不能编辑。

https://officeviewer.org

频道 @WidgetChannel
#音频 #工具箱 #开源

简易语音工具箱

包含多种自动化音频工具,覆盖音频处理、语音识别、语音转录与语音合成等环节,功能可顺序衔接构成完整工作流,支持中、日、英三种语言,免费且开源。

https://github.com/Spr-Aachen/Easy-Voice-Toolkit

频道 @Edgebyte
如果苦于AI账号,或者IP限制等问题,可以试试GitHub Copilot,基本没啥IP限制,香港IP也能玩GPT-5,当然要花点小钱钱。

https://github.com/copilot
ChatGPT推出分支对话功能

OpenAI在X上宣布,ChatGPT现已推出分支对话功能,你可以提出其他问题不用担心偏离原来的方向,目前在web端登录的用户可以使用此功能。

via 匿名

🗒 标签: #OpenAI #ChatGPT
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
阿里巴巴Qwen系列最强大的模型Qwen3-Max-Preview上线

阿里巴巴Qwen今日在官网和OpenRouter上线了最新的Qwen-3-Max-Preview模型。根据官网描述,该模型是Qwen系列中最强大的模型。

有关地址如下:

● 官网:Qwen Chat

OpenRouter

该模型在OpenRouter上的介绍和价格如下:

Qwen3-Max是基于Qwen3系列的更新,与2025年1月版本相比,在推理、指令跟随、多语言支持和长尾知识覆盖方面提供了重大改进。它在数学、编码、逻辑和科学任务中提供更高的准确性,更可靠地遵循中文和英文的复杂指令,减少幻觉,并为开放式问答、写作和对话生成更高质量的响应。

该模型支持超过100种语言,具有更强的翻译和常识推理能力,并针对检索增强生成(RAG)和工具调用进行了优化,尽管其不包括专门的“思考”模式。


● 输入:1.20 美元(现汇率约合 8.6 元人民币)/每百万 tokens

● 输出:6 美元(现汇率约合 42.8 元人民币)/每百万 tokens

via 匿名

🗒 标签: #阿里巴巴 #Qwen
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
智谱推出GLM Coding Plan开发者套餐,月费20至100元

智谱于9月1日起推出面向开发者的专属套餐“GLM Coding Plan”,月费区间为20至100元(网友实测发现100元开发包有93亿token),适用于其最新旗舰模型GLM-4.5及GLM-4.5-Air。该套餐首期以Claude Code为主,未来将扩展至更多编程工具。

目前GLM-4.5已接入多款主流编程工具,包括Claude Code、Cline、Gemini CLI等。在前端开发、跨文件修改和全栈构建等场景中表现稳定实用,解决实际问题的能力接近Claude Sonnet 4,并在多项评测中展现国际竞争力。

据官方披露,GLM-4.5在WebDev Arena中并列全球第二,在SWE-bench Verified优于Gemini-2.5-Pro和GPT-4.1,并在BFCL v4基准取得全球第一,综合编码性能接近Claude Sonnet 4,价格仅为后者1/7。

via 匿名

🗒 标签: #智谱 #GLM
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
#Windows #工具

PreMonitor - 一个小巧的进程资源看护工具

⬇️ 下载页面

你可以选择一个或多个应用设为「受监控」目标,当其资源占用超过设定的阈值并持续一定时间时,PreMonitor 会自动终止该目标进程。

此工具仅用于自动终止异常进程,无法从根本上修复应用自身的自动启动或资源泄漏等问题(治标不治本)。

📮投稿 📢频道 💬群聊 🔎索引
#网盘 #搜索 #开源

PanSou 盘搜

网盘资源搜索服务,支持 TG 频道和插件搜索,支持多频道多插件并发搜索、结果智能排序和网盘类型分类,覆盖百度、阿里、夸克、天翼、UC、移动、115、PikPak、迅雷、123、磁力、电驴等网盘和资源类型,免费开源。

一个字,猛,能搜的东西还是挺多的,特别是收录了 TG 频道的资源。

🌐演示地址 🐙GitHub

频道 @WidgetChannel
#鼠标 #手势 #插件 #开源

MouseGesture

为 Chrome/Edge 浏览器增加鼠标手势和超级拖拽功能的插件,预设了丰富的手势,包括前进、后退、刷新、关闭/新建标签页、滚动到底部/顶部等常用操作,并可轻松拖拽链接、图片到新标签页打开,支持自定义手势动作、手势轨迹的颜色和宽度,免费开源。

🐙GitHub 🌐Chrome 🌐Edge

频道 @WidgetChannel
#局域网 #异地组网 #开源

Vnt

一个简单、高效、能快速组建局域网的工具,可将不同网络下的设备连接到同一个局域网,可用于联机游戏、远程协作、文件或视频共享等,支持 Mac、Linux、Windows 及 Android 平台,免费开源。

https://github.com/vnt-dev/vnt

频道 @Edgebyte
Back to Top