>首页> IT >

百川智能发布开源中英文大模型|深网

时间:2023-06-16 17:00:50       来源:腾讯网


(资料图片仅供参考)

腾讯新闻作者 | 叶蓁

2023年6月15日,百川智能公司推出了70 亿参数量的中英文预训练大模型——baichuan-7B。

官方消息称,baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。

目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。

百川智能CEO王小川表示:“本次开源模型的发布是百川智能成立2个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B模型,不仅能为中国的AGI事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”

据了解,北京大学和清华大学两所顶尖大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。

清华大学互联网司法研究院院长、计算机系教授刘奕群认为,团队计划基于baichuan-7B模型开展司法人工智能领域的相关研究。北京大学人工智能研究院助理教授杨耀东认为,baichuan-7B模型的开源将对于中文基础语言模型的生态建设及学术研究产生重要推动作用。

4月11日,王小川正式对外宣布开启人工智能大模型领域创业。王小川与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。

据悉,百川智能早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。

“百川智能以前搜狗团队为基础,快速融合来自知名科技公司的核心团队。当然,我还需要吸引更多的人才,包括国外顶尖人才、国内的领军人物、优秀的管理人等等。”王小川表示,预计在4月底公司将打造一只50人规模的AI团队,有信心在年底做出中国最好的大语言模型。

关键词: