发现一个提供了大量有创意且漂亮可商用的插画网站:vectorCraftr。
涵盖了各种各样的风格,如网站 404、商业、美食、情侣、程序员、可爱动物等等。 地址:https://vect …
涵盖了各种各样的风格,如网站 404、商业、美食、情侣、程序员、可爱动物等等。 地址:https://vect …
基于上能处理文档中的所有内容,布局识别、代码识别、公式识别、图表识别、表格识别、图形分类、标题对应、列表分组等 …
刚出的一款可全文档OCR的多模态视觉语言模型:SmolDocling,256M参数,处理速度每页0.35秒 查看全文 »
它在Mistral Small 3的基础上增强了视觉理解和长文本处理能力,最高支持128k上下文,每秒150个 …
Mistral的Mistral Small 3.1出来了,24B多模态模型,在多项指标上超过了Gemma 3、GPT 4o-mini 查看全文 »
sesame/csm-1b : 语音合成模型, 1B参数 google/gemma-3-27b-it : 多模 …
另外,这个工具+模型是国产的哦,仅仅407M大小的模型,笔记本轻松运行。效果也是非常不错的。有需要的同学可以试 …
才发现 GPT-SoVITS 发布新版本了,GPT-Sovits V3 TTS 407M,这个新模型提升了语音clone的效果。 查看全文 »
这个项目支持语音交互,可以编写代码,内置了Agent路由可以自动选择应该使用哪个Agent来完成任务。并且可以 …
该项目不仅收集了 64+ 款几乎绝版的精品 DOS 游戏,还有 100+ 款上手简单但超级耐玩的 Window …
相信大家都打过移动客服,客服会根据你按的数字键进入下一个对话。这个工具的功能类似,你可以预设用户的提问,然后针 …
支持同步发布到知乎、微博、小红书、抖音等十多个主流平台 免登录,免注册,免API Key。免费! ⚠️ 最主要 …
这个项目可以将音频/视频中的音频转为文字,最大的特点是使用了 Whisper.cpp,所以兼容性非常好,所有平 …