[本站讯]4月23日,江苏师范大学语言科学与艺术学院教授杨亦鸣做客文学院第367期“新杏坛”,于知新楼作题为“生成式大语言模型与人类自然语言生成的不同”的学术讲座。讲座由山东大学文学院教授岳立静主持。
讲座伊始,岳立静教授简要介绍杨亦鸣教授的研究方向及主要学术成果。
杨亦鸣教授首先回顾语言研究对象的演变历程。他指出,每一次变革都为大语言模型的诞生与发展奠定坚实基础。随着科技的飞速进步,大语言模型的参数规模实现了显著增长,新技术的不断融入使得语言模型的功能更加强大。同时,技术共享与开放的理念进一步推动大语言模型在实际应用中的广泛落地。杨亦鸣教授系统梳理了大语言模型的发展历程,并将其分为三个阶段进行详细解读,深入剖析大语言模型在处理语言方面的功能与特色。
随后,杨亦鸣教授通过一系列深入的实验研究,详细阐述了大语言模型与人类语言之间的显著差异。他主要从语言习得机制和语言加工机制两个方面进行对比分析。在探讨语言习得机制时,杨亦鸣教授指出,大语言模型的语言学习,也是它的训练过程,是完全依赖于语言数据和语言特征进行的,类似于“鹦鹉学舌”的模仿过程。相对地,人类的语言习得则拥有一种与生俱来的遗传机制,使得我们仅需少量的语言刺激就能掌握并发展出相应的语言能力。而在语言加工层面,大语言模型与人类之间的差异则体现在信息的输入、加工方式、信息理解以及内容输出等多个维度。杨亦鸣教授强调,大语言模型虽然能够模仿人类的语言行为,但由于缺乏人类语言天生的生物学机制,它并不能真正理解语言的深层含义,因此在创新性上与人类语言存在着本质的区别。
讲座最后,杨亦鸣教授虽然肯定大语言模型在文本生成、翻译、编程和创作等领域的强大功能,但也指出其存在的问题,并提出两条改进路径:一是推动以语言处理和语言认知为基础的AI技术的升级换代;二是构建以“预装”概念为基础的“语言脑”。
在互动环节,现场师生就心理过程概念化、婴儿导向语等问题与杨亦鸣教授进行交流。
岳立静教授表示,在珍惜与利用大语言模型带来便利的同时,要保持独立思考的能力和创造力。