阿里巴巴达摩院推出开源大语言模型
7月14日,据 Arxiv 页面显示,阿里巴巴达摩院近日发布论文,公布一款开源的多语言大语言模型 PolyLM。
PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种大小可选。研究人员还提出了一种多语言自我指导方法,可以自动生成132.7K个多样化的多语言指令用于模型的微调。
实验证实,PolyLM在多语言任务上的表现超过了其他开源模型。

7月14日,据 Arxiv 页面显示,阿里巴巴达摩院近日发布论文,公布一款开源的多语言大语言模型 PolyLM。
PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种大小可选。研究人员还提出了一种多语言自我指导方法,可以自动生成132.7K个多样化的多语言指令用于模型的微调。
实验证实,PolyLM在多语言任务上的表现超过了其他开源模型。