复旦大学、百度等开源的音频驱动肖像动画的项目:Hallo2,特点是高分辨率、长时间
支持生成4K高分辨率,最长1小时的音频驱动肖像动画 github:https://github.com/fud …
支持生成4K高分辨率,最长1小时的音频驱动肖像动画 github:https://github.com/fud …
easegen它提供从课程制作、视频管理、智能课件生成到智能出题全套方案 支持ppt课件批量自动生成、数字人克 …
快速启动地址: https://ollama.com/library/nemotron Huggingface …
Nemotron 70B 开源!超越 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet。看来又有低成本的 GPT 方案可以开发 AI 产品了!!! 查看全文 »
可以快速伪原创、翻译成5种语言等,同时具备初步的编程助手能力 可本地化部署快速接入到公司内部OA系统、编程ID …
独立开发者使用这两个工具,会大大提高工作效率,相当于直接雇了一个 UI 设计师和 一个 开发工程师了,一周一个 …
衣服的版型和细节没了 https://virtualtryon.net/zh https://changecl …
可以通过你输入的文字提示,自动生成符合你想象的3D玩具形象。 除了玩具,模型还能生成一些室内的3D渲染图。 模 …
@VikParuchuri 又一力作, 用于检测和提取表格。 使用 surya 在 PDF 中找到所有表格, …
可自定义角色设定、更换角色模型 支持文字驱动表情、动作 可中文语音对话,支持Edge、Bert-VITS2语音 …
Try out Ovis 1.6 Gemma2 with Gradio 5 ! Gradio app on @ …