分类: 语言学及应用语言学 >> 语言学及应用语言学 分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2024-01-11
摘要: 以GPT系列为代表的大规模预训练语言模型的快速发展,深刻改变了自然语言处理领域的科研与工程范式,对医疗、教育、司法、金融等相关领域产生了深远影响。同时,这也为语言本身的研究带来了一些新的可能性。本文从歧义分析出发,简要评估GPT4、百川2、ChatGLM3等模型对以歧义为代表的复杂语言现象的理解和分析能力。实验结果表明,GPT4可以融合歧义消解和句法分析等方法,有效感知和理解复杂的语言现象。对于百川2,我们可以通过提示词工程引导其对语言现象进行深入思考,在不进行参数优化时,提升其分析能力。此外,通过监测大模型在处理不同语言现象时的内部特征与神经元活动,可以直观展现语言现象与大模型之间的关系。实验结果表明,大语言模型可以辅助人类更好地理解语言的本质,揭示语言现象深层次规律,从而为语言学研究提供新的思路。
分类: 语言学及应用语言学 >> 语言学及应用语言学 提交时间: 2024-01-05
摘要: 以中文母语者为被试开展词汇学习实验,既操控新颖词出现的语境情感(积极、消极、中性),又操控语境的变异性(重复、变化),检验语境情感是否可通过阅读接触,从语境迁移到新颖词以及这种迁移是否影响新颖词习得的效果,从而探索新颖词语义韵的发生机制。196名被试参加了实验,他们在不同的语境情感和语境的变异性条件下一共阅读了45个篇章,然后对9个新颖词进行情感效价评分并参加了三种不同的词汇知识测试。结果显示,只有在重复阅读相同材料的条件下,语境的情感才顺利地迁移到新颖词,表现出明显的双枣树效应,而与此相反的是,只有在变化语境下,语境情感的迁移才对新颖词词形及词义的学习具有显著的预测作用,在越积极的情感语境里,词形和词义的习得效果也越好。双枣树效应有效地解释了新颖词语义韵的发生机制,也为新词学习提供了重要启示。
分类: 语言学及应用语言学 >> 语言学及应用语言学 提交时间: 2023-08-19
摘要: 建国以来,上海、苏州两地的方言调查和研究较为全面。然而昆山作为夹在两大城市中间的城市,方言研究基本还处在起步阶段。有的人将昆山方言简单理解为上海和苏州话的过渡体。本文先分别比较三地吴语方言的音位差异,再根据中古汉语音系框架下的声韵拼合关系,对比差异,得出昆山方言的特点和演变规律。昆方言音位和苏州有严格的对应关系,几乎一样;语音上,受到上海影响,比较新;但是某些音变比上海更超前,不能简单概括为上海方言的保守形式。譬如遇摄、果摄部分字在非帮系声母后合口韵韵母音值为 əʊ ,对应上海的 u 。究竟是帮系合口圆唇化 əʊ 为 u ,还是 u 裂化为 əʊ 、 ɤʊ 等,关系到昆、沪两地语音谁新谁旧的问题。
分类: 语言学及应用语言学 >> 语言学及应用语言学 提交时间: 2022-01-05
摘要: [目的] 本文针对中文出版物中不同字体、不同书写系统的阅读绩效进行客观对比研究。 [方法] 具体地,将汉字渲染成其对应字形的图像,并进一步按照语序把句子中的汉字图像折叠成为三维的句子张量。对于同一段中文文本,用不同的字体或者简体、繁体会得到句子的视觉差异化的张量表达。通过进一步将得到句子张量输入到我们设计的深度语言模型,进行文本分类等任务的测试,可以客观地比较字体和书写系统对阅读绩效的影响。 [结果] 通过在两个中文文本分类数据集上的测试发现,一些特殊不常用字体相较于常用字体的机器识别准确度较低,并且常用字体中不同字体的阅读绩效也有差异。 [结论] 通过假设检验得出使用楷体和黑体的数据集在文本分类任务上的准确度存在显著性差异,楷体相比于黑体来说阅读绩效更高。简体中文和繁体中文的阅读绩效存在显著性差异。