LINUXDO 网友发帖发现 DeepSeek V3.1 模型在输出中会随机出现 “极” 字,最开始在第三方 API 上出现了这个问题,火山、chutes 等第三方都可能出现这个问题。作者表示此 bug 严重影响到编程或日常使用。
作者经测试后,官网同样存在这个问题。作者表示一旦出现问题,后续会更加频繁。
作者认为,是数据集没有清理干净的问题,这也和 “极速” 等词并列出现合理。通过查看分词,作者发现 “极” 对应的 token 2577 和省略号 2576 相邻,这可能是导致该 bug 的原因。也有可能和模型偷懒有关系。但也存在部分情况无法解释。
目前结论,官网出现 “极” 字概率最低,但不是没有。第三方概率显著增加,可能和第三方量化、部署配置、设备差异相关。
via 匿名