这次推荐的不是李笑来老师的人人都能用英语,而是他这个repo下面一个叫Enjoy的Electron程序,包含了语音转文本、翻译、视频下载等等商业级的功能,还是开源的。
本地运行了一下,main 分支没跑起来,但是v0.1.0-alpha.12能跑,拿个视频测试了一下,识别的结果不错,另外我才知道Whisper已经原生支持词级的时间戳生成了。所以Enjoy甚至能支持单词跳动。
这是我目前见过的最好的Whisper开源项目。(如果有更好的欢迎推荐)
https://github.com/xiaolai/everyone-can-use-english