ePN🌐IPLC专线推荐选购指南:
https://iplc.best/

🤝 联系频道主:
@IPLC_BEST_CHATBOT
#AI #开源 #语音转文字

Handy

语音转文字工具,可在任何应用中通过快捷键启动录音、自动检测语音并实时生成文字,随后将转写结果自动粘贴至当前文本框,无需切换窗口,且完全离线运行,集成 Whisper 系列模型及 CPU 优化的 Parakeet V3 模型,既可在 GPU 环境下加速推理,也可在仅依赖 CPU 的通用设备上运行,免费开源,适用于 Windows、macOS 和 Linux 系统。

❤️主页 🐙GitHub

频道 @WidgetChannel
#对话 #语音合成 #开源

FireRedTTS2

长对话语音合成系统,可通过提供文本和可选参考音频生成自然流畅的语音输出,支持长对话场景下的连续发言,确保语气与节奏自然连贯,支持中文、英文、日文、韩文、法文、德文及俄文,具备零样本语音克隆能力,适用于播客、聊天机器人等多发言人场景,免费开源,使用 Python 开发。

🐙 GitHub

频道 @WidgetChannel
#语音 #翻译 #实时

对话翻译器

将耳机变成实时翻译器,可通过耳机实时收听翻译,左右耳分别播放对话双方语言,还支持文本翻译、相机拍照翻译、离线翻译、AI 对话问答翻译记录等功能,适合出国旅游和跨国团队沟通场景,免费无广告,无需注册。

https://www.talk-translator.com

频道 @WidgetChannel
#开源 #语音转文字 #工具

🎙 LazyTyper - 语音打字,解放双手

LazyTyper 基于 Whisper,能高准确率、高速地识别语音并转文字,支持中、英、日等多语言混合输入。

开发者的初衷是觉得 vibe coding 时打字太慢,用嘴输出更快些!遂开发此软件。

同时支持 Windows、macOS,完全免费(我觉得macOS 更好用些)

📮投稿 📢频道 💬群聊 🔎索引
#AI #语音 #输入法

LazyTyper

基于 Whisper 模型的语音输入工具,准确率高达 90% 以上,转写速度极快,支持中英日韩等多语言无缝混合输入,体积仅个位数 MB,且占用内存极低,完全免费,适用于 Windows 和 macOS 系统。

V2EX 原帖 ,看评论区挺牛逼的,感兴趣的可以玩玩。

https://lazytyper.com/zh

频道 @WidgetChannel
#AI #语音 #输入法

Whisper Keyboard

基于 Whisper 模型的语音输入工具,能将语音实时转为文本,可实现“边说边写”,并可通过语音执行换行、删除、撤销、标点、表情、格式、发送等操作,支持多语言识别、上下文理解和实时编辑,纯本地运行,不方便打字或者想解放双手的可以试试,目前免费,后续可能会收费。

🌐 主页 🌐 演示视频

频道 @WidgetChannel
#AI #语音 #对话 #开源

Sesame CSM

一个对话语音模型,可以像语音电话一样与 AI 聊天谈话,特点是语气更加自然连贯,官方有更专业全面的介绍,目前仅支持英语,但后续会支持更多语言,且会在未来 1-2 周内开源。

我简单试了一下,挺牛逼的,第一时间想到的就是用来练习英语口语,不用担心尴尬,也不用担心对方的态度。

🌐演示地址 🐙项目地址

频道 @WidgetChannel GitHub - SesameAILabs/csm: A Conversational Speech Generation Model
#语音识别 #ASR #AI #开源 #web

Insanely Fast Whisper

基于 Whisper Large v3 模型的语音转文字工具,使用了 Transformers、Optimum 和 flash-attn 技术,转换 150 分钟的音频最快仅需 98 秒。

极快的转换速度,加上较高的精确度,算是 AI 落地很实用的一个工具了,转录会议记录之类的很方便,建议收藏。

在线体验GitHub

频道 @WidgetChannel
#语音转文字 #转换 #win #开源

Whisper

开源语音转文字工具,基于 OpenAIWhisper 语音识别模型,支持 GPU、实时语音转换,在英语语音识别方面的稳健性和准确性接近人类水平。

本地服务,仅支持 Win 64 位系统。

频道 @WidgetChannel
 
 
Back to Top