LINUXDO 网友发帖发现 DeepSeek V3.1 模型在输出中会随机出现 “极” 字,最开始在第三方 API 上出现了这个问题,火山、chutes 等第三方都可能出现这个问题。作者表示此 bug 严重影响到编程或日常使用。
作者经测试后,官网同样存在这个问题。作者表示一旦出现问题,后续会更加频繁。
作者认为,是数据集没有清理干净的问题,这也和 “极速” 等词并列出现合理。通过查看分词,作者发现 “极” 对应的 token 2577 和省略号 2576 相邻,这可能是导致该 bug 的原因。也有可能和模型偷懒有关系。但也存在部分情况无法解释。
目前结论,官网出现 “极” 字概率最低,但不是没有。第三方概率显著增加,可能和第三方量化、部署配置、设备差异相关。
via 匿名
🧠 最近读到一份来自Apple团队的研究,专门分析了当前最前沿的大型推理模型(LRMs)在复杂推理任务中的真实表现。不同于常见的数学或代码基准测试,这项研究采用了可控拼图环境,能细致拆解模型的推理过程和极限
🔍 他们发现,虽然这些AI模型在中等复杂度下表现优异,但一旦问题复杂度超过某个临界点,无论是“链式思考”模型还是普通大模型,准确率都会骤降。更有意思的是,模型在面对极高复杂度时,反而会减少推理步数,即使还有充足的计算资源
🧩 研究还揭示了不同模型在推理路径上的差异,比如在简单任务上“思考型”模型容易陷入“过度思考”,而在复杂任务中则难以自我纠错。这种细致的分析让我们重新审视AI推理能力的边界,以及未来模型设计的方向
📊 如果你关注AI推理、算法与模型极限,这篇报告值得一读。它不仅展示了AI在复杂推理面前的短板,也为我们理解“AI会不会真正思考”这个问题,提供了全新视角
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
PDF Tool
在线 PDF 工具箱,支持裁剪、拆分、合并、删除、旋转、格式转换、权限、签名、密码、水印、提取图像、比较等基础功能,还有按章节拆分、编辑目录、流水线、模拟扫描、显示 Javascript、自动拆分、自动重命名等高级功能,免费使用,无需注册。
https://pdf.hk
频道 @WidgetChannel
EasySpider
一个完全免费(包括商业使用和二次开发)的可视化浏览器自动化测试/数据采集/爬虫软件,可以使用图形化界面,无代码可视化的设计和执行任务。
只需要在网页上选择自己想要操作的内容并根据提示框操作即可完成任务的设计和执行,同时还可以单独以命令行的方式进行执行,从而可以很方便的嵌入到其他系统中。
https://www.easyspider.net
频道 @Edgebyte
现代化的 Markdown 跨平台编辑器应用
https://github.com/drl990114/MarkFlowy
https://github.com/drl990114/MarkFlowy
Lufin——现代自托管文件共享服务,兼容S3
https://github.com/VityaSchel/lufin
https://github.com/VityaSchel/lufin
今年 6 月份,ShinyHunters 黑客组织骗取了一名谷歌员工的信任,借助其登录凭据,通过谷歌在 Salesforce 云平台的数据库窃取了大量包含公司名称和客户联系方式的文件。谷歌当时声称此次入侵并未导致密码被盗。
福布斯报道称,谷歌确认部分黑客正通过已泄露的密码入侵 Gmail 账户,大多数 Gmail 用户需要立即更换密码以确保账户安全。
谷歌表示,密码问题是导致“成功入侵”的主要原因之一。我们此前已经看到多起报告,称在谷歌自有的 Salesforce 数据库遭黑客攻击后,“所有 25 亿 Gmail 用户都可能面临风险”。
与此同时,诈骗分子正冒充谷歌客服人员,通过电子邮件和电话联络用户,甚至还借助谷歌的人工智能工具实施攻击。谷歌已提醒用户升级账户安全措施,包括启用非短信形式的双重身份验证(2FA)、为账户添加“通行密钥”(passkey),并将其设为默认登录方式。
via 匿名
Sync Your Cookie
浏览器 Cookie 云端同步插件,可将 Cookie 同步存储至 Cloudflare,在多台设备之间同步登陆状态,支持为不同域名配置自动合并与自动推送规则,提供设置面板、弹窗式同步界面及侧边栏管理,多端查看、复制和编辑 Cookie 且均在本地进行,免费开源。
频道 @WidgetChannel
Termix 是一个基于 Web 的服务器管理平台,具有 SSH 终端、隧道和文件编辑功能。
https://github.com/LukeGus/Termix
https://github.com/LukeGus/Termix
AudioShare
将 Android 手机变成电脑扬声器,要求 Windows 10 64 和 Android 6.0 以上版本,连接后即可通过手机播放电脑上的音频,适用于电脑没喇叭的情况,或者其他文中提到的场景,挺有意思的一个小工具,完全免费。
https://www.52pojie.cn/thread-2052674-1-1.html
频道 @WidgetChannel
Yfamily
提供完整的 iOS 代理工具(Shadowrocket、小火箭、QuantumultX、QX、QuanX、Loon、Surge、Stash 等)配置、模块、插件、脚本与教程,帮助充分利用代理工具功能。
https://whatshub.top
频道 @Edgebyte
ryOS —— 用 Cursor 做的「个人操作系统」
✏️ Ryo Lu 是 Cursor 的 Head of Design,他在闲暇时间用 Cursor 搭了一个充满个人风格的复古 MacOS,上面有十几个有趣的应用可以把玩
🤔 回忆起搭建的过程,Ryo 说自己先做了一个 Soundboard APP 录制了一些他的声音,因为他希望老东家 Notion 可以在开会时依然听到自己的声音。然后他加了一个菜单栏,又多做了几个 APP,这个 OS 就逐步成型了
⏳ Ryo 问过 ChatGPT:一个普通的工程团队需要多久才能做出来?答案是,可能要几十个人花上一两年时间。但现在他只是一个人,利用业余时间写写代码、实现一些随机想法,就做到了
🤯 这是 AI 加持下设计师的可能性吧
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
✏️ Ryo Lu 是 Cursor 的 Head of Design,他在闲暇时间用 Cursor 搭了一个充满个人风格的复古 MacOS,上面有十几个有趣的应用可以把玩
🤔 回忆起搭建的过程,Ryo 说自己先做了一个 Soundboard APP 录制了一些他的声音,因为他希望老东家 Notion 可以在开会时依然听到自己的声音。然后他加了一个菜单栏,又多做了几个 APP,这个 OS 就逐步成型了
⏳ Ryo 问过 ChatGPT:一个普通的工程团队需要多久才能做出来?答案是,可能要几十个人花上一两年时间。但现在他只是一个人,利用业余时间写写代码、实现一些随机想法,就做到了
🤯 这是 AI 加持下设计师的可能性吧
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
近日,Google 宣布将开始测试全新 Google 财经,它以 AI 为核心,经过重新设计。你可以提出有关金融领域的详细问题,并获得全面的 AI 解答,同时还能轻松访问相关网站。无需逐个查找股票详情,你可以一次性提出复杂的研究问题,获得实用的分析和新颖的见解。
该功能将在未来几周内在美国 google.com/finance 推出,届时将提供新版和经典版两种设计模式。
via 匿名
近日,Apple官方账号正式入驻小红书,账号24小时内粉丝破17万,话题Apple入驻小红书登平台热榜第二。
入驻首条视频采用小红书标志性红色背景,并融入创新互动技术,用户可通过触感反馈体验欢迎效果。
视频在24小时内获11.7万点赞、近2万评论。网友纷纷分享自己首台Apple设备的故事,“我和Apple的故事”话题阅读量近1500万。
这是苹果在国内继微信、抖音后的第三个官方社交账号。小红书数据显示,其用户iOS设备渗透率近50%,居国内社交平台首位。
via 匿名
CodeBuddy IDE 国内特供版开放公测啦!
无需邀请码!即刻免费使用最新 DeepSeek V3.1模型!
专供版:https://copilot.tencent.com/ide/
海外版:https://www.codebuddy.ai/
秒获取海外版的邀请码:
来自频道:智能视界