BLIP3-o:原生多模态视觉模型

同时具有图片理解和图片生成的能力,而且效果还可以。对标GPT-4o的图片多模态,比之前DeepSeek开源的Janus强不少。
在线体验:https://blip3o.salesforceresearch.ai
Github:https://github.com/JiuhaiChen/BLIP3o
模型:https://huggingface.co/BLIP3o