阿里巴巴FunASR刚刚发布了一款多语言离线文件转录软件包funasr-runtime-sdk-cpu-0.4.6
支持各种音视频格式输入,可以把几十个小时的长音频与视频识别成带标点的文字,支持上百路请求同时进行转写 支持中文 …
阿里巴巴FunASR刚刚发布了一款多语言离线文件转录软件包funasr-runtime-sdk-cpu-0.4.6 查看全文 »
支持各种音视频格式输入,可以把几十个小时的长音频与视频识别成带标点的文字,支持上百路请求同时进行转写 支持中文 …
阿里巴巴FunASR刚刚发布了一款多语言离线文件转录软件包funasr-runtime-sdk-cpu-0.4.6 查看全文 »
可自定义角色设定、更换角色模型 支持文字驱动表情、动作 可中文语音对话,支持Edge、Bert-VITS2语音 …
👉 https://github.com/jaywcjlove/awesome-swift-macos-app …
省去了大量复杂配置,极其适合上手。https://github.com/liumengniu/majiang
视频版抠图,去除每一帧视频的背景图。 在线使用:https://huggingface.co/spaces/i …
支持多线程并发 + 批量处理 支持生成srt和txt字幕文件 github:https://github.co …
所以也许:当你有一个好玩的点子时,想想怎么借力,让它的好玩程度提升10倍。
Try out Ovis 1.6 Gemma2 with Gradio 5 ! Gradio app on @ …
1. 图标生成,两个可行方案 a) 训练好的专门生成图标的小模型,根据文字生成图标 b) 找一堆图标,生成me …
在线使用地址:https://huggingface.co/spaces/mrfakename/E2-F5-T …
F5-TTS 是一款开源的 TTS 模型,可以将文本转换为讲出中文/英文语音,流畅语气与本人相同。而且可以商用。 查看全文 »