(资料图片)

科罗拉多大学博尔德分校近日联手来自纽约大学的学者推出中文语料库 CLiMP。

据论文显示, CLiMP可以用来研究中文语言学者学习了哪些知识。

CLiMP由1000个最小对组成,涵盖9种主要的普通话语言现象。目前研究团队已经通过 CLiMP评估了11款不同的大模型,包括n-gram、LSTM 和中文 BERT。

实验显示,中文 BERT的测试结果达到平均准确率。

推荐内容