#语音 | //iplc.best 搬运分享

ePN🌐IPLC专线推荐选购指南：
https://iplc.best/

🤝 联系频道主：
@IPLC_BEST_CHATBOT

22:28 · 2026年2月15日 · 周日

#AI #开源 #语音转文字

Handy

语音转文字工具，可在任何应用中通过快捷键启动录音、自动检测语音并实时生成文字，随后将转写结果自动粘贴至当前文本框，无需切换窗口，且完全离线运行，集成 Whisper 系列模型及 CPU 优化的 Parakeet V3 模型，既可在 GPU 环境下加速推理，也可在仅依赖 CPU 的通用设备上运行，免费开源，适用于 Windows、macOS 和 Linux 系统。

❤️

主页

🐙

GitHub

频道 @WidgetChannel

AI 开源语音转文字

20:31 · 2025年10月11日 · 周六

#对话 #语音合成 #开源

FireRedTTS2

长对话语音合成系统，可通过提供文本和可选参考音频生成自然流畅的语音输出，支持长对话场景下的连续发言，确保语气与节奏自然连贯，支持中文、英文、日文、韩文、法文、德文及俄文，具备零样本语音克隆能力，适用于播客、聊天机器人等多发言人场景，免费开源，使用 Python 开发。

🐙

GitHub

频道 @WidgetChannel

对话语音合成开源

21:59 · 2025年9月12日 · 周五

#语音 #翻译 #实时

对话翻译器

将耳机变成实时翻译器，可通过耳机实时收听翻译，左右耳分别播放对话双方语言，还支持文本翻译、相机拍照翻译、离线翻译、AI 对话问答翻译记录等功能，适合出国旅游和跨国团队沟通场景，免费无广告，无需注册。

https://www.talk-translator.com

频道 @WidgetChannel

语音翻译实时

21:29 · 2025年9月2日 · 周二

#开源 #语音转文字 #工具

🎙 LazyTyper - 语音打字，解放双手

LazyTyper 基于 Whisper，能高准确率、高速地识别语音并转文字，支持中、英、日等多语言混合输入。

开发者的初衷是觉得 vibe coding 时打字太慢，用嘴输出更快些！遂开发此软件。

同时支持 Windows、macOS，完全免费（我觉得macOS 更好用些）

📮投稿 📢频道 💬群聊 🔎索引

开源语音转文字工具

22:58 · 2025年8月30日 · 周六

#AI #语音 #输入法

LazyTyper

基于 Whisper 模型的语音输入工具，准确率高达 90% 以上，转写速度极快，支持中英日韩等多语言无缝混合输入，体积仅个位数 MB，且占用内存极低，完全免费，适用于 Windows 和 macOS 系统。

V2EX 原帖，看评论区挺牛逼的，感兴趣的可以玩玩。

https://lazytyper.com/zh

频道 @WidgetChannel

AI 语音输入法

21:07 · 2025年6月26日 · 周四

#AI #语音 #输入法

Whisper Keyboard

基于 Whisper 模型的语音输入工具，能将语音实时转为文本，可实现“边说边写”，并可通过语音执行换行、删除、撤销、标点、表情、格式、发送等操作，支持多语言识别、上下文理解和实时编辑，纯本地运行，不方便打字或者想解放双手的可以试试，目前免费，后续可能会收费。

🌐 主页 🌐 演示视频

频道 @WidgetChannel

whisperkeyboard.app

Whisper Keyboard - Voice Typing 3X Faster with OpenAI Notch

Transform your typing with the Whisper Keyboard—an AI-powered tool by OpenAI! Seamlessly integrated with Mac's Dynamic Island, this innovative voice-to-text solution turns your speech into accurate text in an instant. Elevate your productivity and embrace…

AI 语音输入法

22:04 · 2025年3月5日 · 周三

#AI #语音 #对话 #开源

Sesame CSM

一个对话语音模型，可以像语音电话一样与 AI 聊天谈话，特点是语气更加自然连贯，官方有更专业全面的介绍，目前仅支持英语，但后续会支持更多语言，且会在未来 1-2 周内开源。

我简单试了一下，挺牛逼的，第一时间想到的就是用来练习英语口语，不用担心尴尬，也不用担心对方的态度。

🌐演示地址 🐙项目地址

频道 @WidgetChannel

GitHub

GitHub - SesameAILabs/csm: A Conversational Speech Generation Model

A Conversational Speech Generation Model. Contribute to SesameAILabs/csm development by creating an account on GitHub.

AI 语音对话开源

21:59 · 2023年11月25日 · 周六

#语音识别 #ASR #AI #开源 #web

Insanely Fast Whisper

基于 Whisper Large v3 模型的语音转文字工具，使用了 Transformers、Optimum 和 flash-attn 技术，转换 150 分钟的音频最快仅需 98 秒。

极快的转换速度，加上较高的精确度，算是 AI 落地很实用的一个工具了，转录会议记录之类的很方便，建议收藏。

在线体验丨 GitHub

频道 @WidgetChannel

语音识别 ASR AI 开源 web

15:25 · 2023年10月21日 · 周六

#语音转文字 #转换 #win #开源

Whisper

开源语音转文字工具，基于 OpenAI 的 Whisper 语音识别模型，支持 GPU、实时语音转换，在英语语音识别方面的稳健性和准确性接近人类水平。

本地服务，仅支持 Win 64 位系统。

频道 @WidgetChannel

语音转文字转换 win 开源