(相关资料图)
在第七届世界智能大会上,国家超级计算天津中心近日正式发布打造“天河E级智能计算开放创新平台”,研发训练“天河天元大模型”。
天津超算中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总token数达到350B,训练打造了自己的中文语言大模型——天河天元大模型。
同时大模型还在持续训练和完善中,并在此基础上启动深度训练面向医疗、工业、法律等领域的专业模型。(科技日报)
(相关资料图)
在第七届世界智能大会上,国家超级计算天津中心近日正式发布打造“天河E级智能计算开放创新平台”,研发训练“天河天元大模型”。
天津超算中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总token数达到350B,训练打造了自己的中文语言大模型——天河天元大模型。
同时大模型还在持续训练和完善中,并在此基础上启动深度训练面向医疗、工业、法律等领域的专业模型。(科技日报)