视觉模型Ovis 1.6 Gemma2
Try out Ovis 1.6 Gemma2 with Gradio 5 ! Gradio app on @ …
Try out Ovis 1.6 Gemma2 with Gradio 5 ! Gradio app on @ …
1. 图标生成,两个可行方案 a) 训练好的专门生成图标的小模型,根据文字生成图标 b) 找一堆图标,生成me …
在线使用地址:https://huggingface.co/spaces/mrfakename/E2-F5-T …
F5-TTS 是一款开源的 TTS 模型,可以将文本转换为讲出中文/英文语音,流畅语气与本人相同。而且可以商用。 查看全文 »
– EasyVideoTrans:开源的AI视频翻译配音工具 https://github.com …
1. RoomGPT – 用 AI 重新设计你的房间 http://github.com/Nutl …
集成了截屏、OCR、搜索、翻译、贴图、以图搜图以及录屏等多项功能,直接开箱即用,且完全开源免费。 GitHub …
原理比较简单:浏览器有一个 API 叫做 MediaSession,它允许对标准媒体行为进行自定义,例如点击 …
把耳机改成摩斯密码发送器,这个 Github 项目看起来十分极客:https://github.com/EtherDream/headphone-morse-transmitter 查看全文 »
@unclecode 10 月份⭐️增长最快的项目, 10 天增长超 10K⭐️ 异步架构实现高性能和可扩展的 …
https://apps.apple.com/us/app/screenbrush/id1233965871? …
基于流匹配的高效自回归视频生成模型,支持文生视频、图生视频 使用公开数据训练,性能可与先进的商业模型媲美 gi …
北大、快手和北邮开源了新的视频生成模型:Pyramid Flow,可生成1280×768分辨率,10秒长度,24fps的视频 查看全文 »