由于东南亚(SEA)地区语言多种多样,大多数现有的模型无法满足该地区需求。
Sailor基于Qwen 1.5训练开发,覆盖7种语言(包括印尼语、泰语、越南语、马来语、老挝语、英语和中文)
有4种不同大小的版本(0.5B、1.8B、4B和7B),支持不同的需求。
1、多语言支持:专注于东南亚语言,包括印尼语、泰语、越南语、马来语和老挝语,以及英语和中文,覆盖SEA地区的多样化语言环境。
2、不同模型大小:提供从0.5B到7B不同大小的模型版本,以满足从轻量级到高性能的不同计算和应用需求。
3、高性能:在SEA语言的问答、常识推理、阅读理解等任务上表现出色,通过基准测试展示了其在多种任务上的强大性能。
4、开放使用:模型对研究和商业用途开放,无限制使用,但需遵守Qwen 1.5许可证。
项目: https://sailorllm.github.io
模型: https://hf.co/collections/sail/sailor-language-models-65e19a749f978976f1959825
GitHub: https://github.com/sail-sg/sailor-llm