ePN🌐IPLC专线推荐选购指南:
https://iplc.best/

🤝 联系频道主:
@IPLC_BEST_CHATBOT
#工具 #开源 #跨平台

📂 AI File Sorter - 一个基于 AI 的文件整理工具

😸 开源地址 | ⬇️ 下载地址

AI File Sorter 是一款开源的本地文件整理工具,基于 AI (可选纯本地+远程模型)实现文件自动分类、重命名和整理。支持Windows、Linux、macOS

其最大亮点是可以读懂图片、文档、媒体文件并自动重命名分类

📮投稿 📢频道 💬群聊 🔎索引
#互联网观察 #开源

小米开源 OmniVoice:一个模型覆盖 600+ 语言的语音克隆 TTS

小米 AI 实验室新一代 Kaldi 团队发布并开源了多语言语音克隆 TTS 模型 OmniVoice。这个模型主打“一个模型覆盖 600+ 语种”,目标是解决现有语音克隆模型多语言覆盖不足、低资源小语种难以合成的问题。官方称,OmniVoice 覆盖 646 种语言,在中英文合成、多语言语音克隆和低资源语种泛化上都达到了较强表现。

OmniVoice 完全基于开源数据训练。团队收集了 50 个开源语音数据集,经过降噪和质量筛选后,构建了覆盖 646 种语言、总时长 58 万小时的多语言训练数据集。为了照顾低资源语言,训练中还使用了动态上采样策略。官方测试显示,在 24 种语言测试中,OmniVoice 的语音相似度和可懂度超过多款商用系统;在 102 种语言测试中,其可懂度接近甚至优于真实语音。

OmniVoice 支持跨语言语音克隆,也就是只提供一种语言的参考音频,就可以生成另一种语言的同音色语音。它还支持文本描述生成音色,例如指定性别、年龄、音调、方言、口音,甚至耳语风格;能处理带噪参考音频,自动提取较清晰的音色特征;还支持笑声、叹气等语气符号,以及对中文多音字、英文专有名词等发音问题进行纠正。

这次开源内容包括训练代码、推理代码和模型权重。项目同时提供论文、GitHub 仓库、语音样本页面、Hugging Face Demo Space 和模型权重。对开发者来说,OmniVoice 的意义在于把多语言语音克隆的门槛进一步降低,尤其是过去很难覆盖的小语种,现在有机会通过一个统一模型获得可用的 TTS 能力。

频道 @AppDoDo 官推 APPDOTG
#AI #输入法 #开源

言泉输入法

本地优先的中文输入法,特点是所有文字处理均在本地完成,包括配置与用户词库也默认保留在本机,另外结合 LLM 本地模型,可持续提升候选词排序质量与词库覆盖,同时保持可检查、可清理、可重置的结构,无捆绑,无后台推送,免费开源,适用于 Windows 10 / 11 系统。

❤️官网 🐙GitHub

频道 @WidgetChannel
#AI #自动化 #开源

Ruto-GLM

Android 自动化与多任务框架,借助 Shizuku 激活的系统级能力,并结合 AI 大模型,可实现真正的后台自动化、多任务并行和智能 UI 操作执行,简单地说,就是可以一边执行任务,一边玩手机,互不耽误,上手应该是有点门槛的,感兴趣的可以试试,免费开源。

🐙 GitHub

频道 @WidgetChannel
#OpenClaw #AI #开源

U-Claw 虾盘

OpenClaw 离线安装 U 盘工具,可将其运行环境和相关依赖完整打包,内置多种 AI 模型配置方案,并预装几十个常用生产力技能,只需插上 U 盘,双击启动脚本即可一键安装,有效避免安装过程中 GitHub 访问缓慢、依赖下载失败或环境冲突等问题,此外还提供备份、修复、还原等维护功能,支持 Windows、macOS、Linux 系统,免费开源。

❤️主页 🐙GitHub

频道 @WidgetChannel
#AI #自动化 #macOS #开源

Openwork

AI 桌面助手与自动化工具,可执行各种文件操作和实际任务,包括浏览器自动化、文件重命名/移动/排序、文件夹整理、内容摘要、文档生成、基于会议笔记创建日历安排等,使用需配置 API 密钥(OpenAI、Anthropic、Google、xAI)或通过 Ollama 运行本地模型,数据完全本地化处理,免费开源,无需注册。

❤️主页 🐙GitHub

频道 @WidgetChannel
#翻译 #开源 #AI

MTranServer

离线翻译模型服务器,可在只有 CPU 和约 1 GB 内存的环境下运行,无需显卡,单条翻译平均耗时 50 毫秒,支持中、英、德、法、俄、韩、日等主流语言互译,整体特点就是离线、响应快以及无限使用,受限于模型大小和优化程度,翻译质量肯定不如大模型翻译的效果,有需要这种轻量级翻译服务的可以试试,免费开源。

🐙 GitHub

频道 @WidgetChannel
#AI #开源 #语音转文字

Handy

语音转文字工具,可在任何应用中通过快捷键启动录音、自动检测语音并实时生成文字,随后将转写结果自动粘贴至当前文本框,无需切换窗口,且完全离线运行,集成 Whisper 系列模型及 CPU 优化的 Parakeet V3 模型,既可在 GPU 环境下加速推理,也可在仅依赖 CPU 的通用设备上运行,免费开源,适用于 Windows、macOS 和 Linux 系统。

❤️主页 🐙GitHub

频道 @WidgetChannel
#AI #插件 #开源

NativeMind

完全本地运行的浏览器 AI 助手插件,支持网页摘要、全文翻译、跨标签对话上下文、在浏览器内检索网页内容并生成答案、与 PDF/图像文件对话问答、写作辅助(改写、润色、生成创意文本)等,无缝集成 gpt-oss、DeepSeek、Qwen、Llama、Gemma、Mistral 等模型,一键加载、切换模型,无需配置,免费开源,无需注册。

❤️主页 🐙GitHub 🌐Chrome

频道 @WidgetChannel
#截图 #AI #开源

Snow Shot

一体化智能截图工具,集成了截图、文字识别(OCR)、翻译及 AI 对话等功能,识别后文字可进行编辑、更正、复制,也可与聊天模型交互生成摘要、注释或相应建议,即便是图像中的文字亦能被识别并转化为可编辑文本,可自定义截图热键、保存默认路径、OCR 语言包、翻译目标语言、对话模型接口等参数,免费开源,适用于 Windows 和 macOS 系统。

❤️主页 🐙GitHub

频道 @WidgetChannel
#wiki #AI #开源 #建站

🐼 PandaWiki - 一款 AI 大模型驱动的开源知识库搭建系统

🐙 开源页面

PandaWiki 可以帮助你快速构建智能化的产品文档、技术文档、FAQ、博客系统等,借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索等能力。

开发团队是中国的,所以本土化做的比较好,并且最低仅需1H2G的配置即可运行

📮投稿 📢频道 💬群聊 🔎索引
#AI #音频 #开源

SpleeterGUI

音源分离工具,可将歌曲或音频文件拆分为鼓点、贝斯、人声等独立轨道,可用于重新混音或去除录音中的背景噪音,如鸟鸣、路声或喇叭声。使用前需下载完整模型(约 1.2GB),免费使用。

https://spleetergui.com/

频道 @Edgebyte
#开源 #网盘 #AI

☁️ Foxel - 一个高度可扩展的私有 AI 云盘

🌐 在线体验(账密 admin

⭐️ Features
▫️统一文件管理:集中管理分布于不同存储后端的文件。
▫️插件化存储后端:采用可扩展的适配器模式,方便集成多种存储类型。
▫️语义搜索:支持自然语言描述搜索图片、文档等非结构化数据内容。
▫️内置文件预览:可直接预览图片、视频、PDF、Office 文档及文本、代码文件,无需下载。
▫️权限与分享:支持公开或私密分享链接,便于文件共享。
▫️任务处理中心:支持异步任务处理,如文件索引和数据备份,不影响主应用运行。


📮投稿 📢频道 💬群聊 🔎索引
#数据库 #SQL #开源

DrawDB

在线数据库设计与 SQL 生成工具,可通过直观的图形界面创建数据库模型,系统会自动生成对应的 SQL 创建脚本,支持 MySQL、MariaDB、PostgreSQL、SQL Server 以及 SQLite 等多种数据库系统,核心功能包括可视化 ER 图设计、表结构定义、字段属性配置、表关系建立和约束设置等,完全免费,无需注册。

https://drawdb.vercel.app

频道 @Edgebyte
#bilibili #开源

Bili2text

一个用于将 Bilibili 视频转换为文本的工具,通过一个简单的流程实现:下载视频、提取音频、分割音频,并使用 whisper 模型将语音转换为文本,整个过程是自动的,只需输入 Bilibili 视频的 av 号即可,整个过程行云流水,一步到位。

https://github.com/lanbinleo/bili2text

频道 @Edgebyte GitHub - lanbinleo/bili2text: Bilibili视频转文字,一步到位,输入链接即可使用
#翻译 #插件 #开源

陪读蛙

浏览器翻译插件,主要功能是沉浸式翻译,会在原文旁边显示翻译内容,方便进行对比且不打乱页面布局,效果还是蛮不错的,另外集成了 AI 功能,可以提取并分析文章内容,支持多种 AI 模型,但需要自行提供 API Key,免费开源,无需注册。

🌐 主页 🐙 项目地址 🌐 Chrome

频道 @WidgetChannel
#AI #转录 #开源

aTrain

语音转录与说话人分离工具,结合 Whisper 与 pyannote.audio 模型,可识别多达 99 种语言的语音内容,并自动进行说话人分离,支持处理长视频,支持导出兼容 MAXQDA、ATLAS.ti 和 nVivo 的转录文本,完全本地运行,免费开源,适用于 Windows、macOS 与 Linux 系统。

🐙 项目地址

频道 @WidgetChannel GitHub - JuergenFleiss/aTrain: A GUI tool for offline transcription of speech recordings, including speaker diarization, utilizing…
#电子书 #听书 #开源

Audiblez

电子书转有声书工具,基于 Kokoro-82M 模型实现,可将 epub 文本转换为 m4b 音频,支持 8 种中文音色,以及中英日法等多种语言,支持选择语音性别和播放速度,支持 CUDA 加速,但 CPU 也可以跑,只是处理速度差异很大,免费开源。

这个有门槛啊,需要自行部署。

🐙 项目地址

频道 @WidgetChannel GitHub - santinic/audiblez: Generate audiobooks from e-books
#开源 #跨平台 #输入法 #脚本

⌨️ 万象拼音 - 又一个 Rime 输入法方案!

🔗 基础班 | 增强版 | 语法模型

万象拼音是一个全面构建 Rime 输入生态的系列方案,涵盖:

▫️拼音输入方案(基础版 / 增强版)Rime 类大厂输入方案,完美的整句输入体验,某种程度更是超越
▫️自定义语言模型(语法模型 / 预测模型),Rime 唯一 200M 规模语法模型,覆盖面广,开源炼制方法,持续更新
▫️高精度多音字处理与整句输入支持,在这里还能找到 pypinyin 最实用数据库和词库注音脚本工具链,全部多音字参与词汇人工持续修订,拥有完整的经语料炼化的向量词库,并为之区分和加注多音字读音,数据量是开源之最
▫️项目融合 AI 精选词库与 32GB 多领域语料训练的模型,极大提升输入效率与准确性


支持 Windows、macOS、Linux、Android、iOS、HarmonyOS

➡️ 已收录至「输入法」

📮投稿 📢频道 💬群聊 🔎索引 GitHub - amzxyz/rime-wanxiang: 「万象拼音」:把算法留在幕后,把纯粹还给指尖,用更现代的数据,接管你的候选。Q群:11033572 / 11631066
 
 
Back to Top