(相关资料图)
微软联合 MPI-SIS 近日发布了一篇论文,对部分生成式大模型产品在编程教育场景中的表现进行比较。
论文结果显示,相比于基于 GPT-3.5的 ChatGPT,GPT-4在大多数场景中都有着出色的表现,其能力甚至接近人类导师。
研究团队设置了六个不同的教育场景,包括修复学生的错误程序、给学生提示帮助解决问题、给学生编写的程序打分,帮助学生编写未完成的程序,解释部分内容的上下文和给学生布置任务等等。
研究表明, 大语言模型可以极大地改善编程教育的现状。而 GPT-4 在多种编程教育场景中也能获得不错的表现,不过它在部分场景(比如布置任务)中的表现比不上人类导师。