软件介绍
TMSpeech是一个Windows下的中文实时语音字幕,通过WASAPI的CaptureLoopback捕获电脑声音(录内音),将语音实时转文字,并以歌词字幕的形式展示。 即使完全关闭电脑声音也能使用。会议实时转录,自动生成会议纪要,并保存到文件。 默认会将识别结果按日期保存到“我的文档”的文件夹中TMSpeechLogs基于sherpa-onnx项目二次开发。
软件特点
- 多语言支持:TMSpeech不仅支持中文,还可以处理多种其他语言,满足跨语言应用场景的需求
- 实时合成:设计优化使得系统能在较低配置的硬件上运行,实现快速的语音合成,适用于实时应用
- 模型微调:开发者可以根据自己的需求对预训练模型进行微调,定制化生成特定风格的语音
- 易集成:提供清晰的API文档,方便开发者将其集成到现有项目中
- 模块化设计:各部分独立且可扩展,易于维护和升级