Buzz(语音转文字软件)简介
Buzz是一款免费开源的语音转文字软件,能够帮助我们非常方便的将语音转换为文字,支持windows及macOS,该软件基于 OpenAI 的 Whisper 自动语音识别模型,能够准确识别各国语言,支持多种影音格式,包括 MP3、WAV、M4A、OGG 音频和 MP4、WEBM、MOV、OGM 视频,可转换输出为 SRT、TXT 和 VIT 格式的文件,界面简洁易于操作。
可选择 Tiny、Base、Small、Medium、Large 五种模型,执行语音转换处理会先下载 AI 模型,取得模型后可以离线使用,语音转录文字过程都在电脑上运行。转录处理速度会因所选模型而有差异,以 Tiny 模型最为迅速却可能出现偏差,选择 Large 模型的处理时间最久,相对地文字稿的准确度较高。
Buzz(语音转文字软件)下载及使用教程
- 官网:https://buzzcaptions.com/
- Github项目开源主页:https://github.com/chidiwilliams/buzz
- 最新版本点此下载
1、根据自己的系统环境下载对应版本的软件安装;
2、安装完成后启动该软件,如上图所示,我们点击图示标注所示的「+」按钮即可添加需要转文字的视频文件或语音文件;
3、首次使用会弹出上图所示的AI模型下载提示界面,我们根据自己的需要选择和设置AI模型、任务(翻译/转录)、语言和输出格式,翻译功能。
4、等待模型下载完成后,会自动进行语音转文字任务,如上图所示,软件会实时显示处理进度,我们只需要等待处理完成即可。
5、等待处理完成后如上图所示、,软件会根据所选格式在原路径储存文本文件,点击图示标注所示的「Open Transcript」,会打开文本文件预览窗口,可将其转存为其他格式的文本文件。