阿里巴巴FunASR刚刚发布了一款多语言离线文件转录软件包funasr-runtime-sdk-cpu-0.4.6

支持各种音视频格式输入,可以把几十个小时的长音频与视频识别成带标点的文字,支持上百路请求同时进行转写
支持中文、英文、日文、粤语和韩语等
可自动语音识别(ASR)、口语识别(LID)、语音情感识别(SER)和音频事件检测(AED)
github:https://github.com/modelscope/FunASR/blob/main/runtime/docs/SDK_advanced_guide_offline_zh.md