
2024年11月14日下午,华中师范大学语言与语言教育研究中心的沈威副教授莅临人文学院,做客第32期荆楚语学大讲坛,为师生带来以“语言研究中的统计方法”为主题的精彩讲座,深入浅出地探讨了语言学研究中数据处理技术的重要性及应用。
沈威副教授首先详细阐述了语言学研究中数据的多种来源方式,包括语料库(如现成的CCL、BCC、GCC等及自建语料库)、网络资源(通过网络爬虫技术获取)、调查问卷(需经过精心设计与统计分析)以及其他方式(如购买、赠予等)。随后强调了数据的合理性问题,指出研究中所用数据必须满足样本选择正确、数据分布合理、问卷设计科学、统计方法恰当以及结果解读准确等要求,以避免数据使用中的常见错误。
接着,沈威副教授通过生动的案例指出统计思维在语言学研究中的重要性。统计学从功能上分为描述统计学和推断统计学,两者在语言学研究中均发挥着不可或缺的作用。描述统计学帮助我们认识语言现象的数量特征和统计规律,而推断统计学则根据样本数据推断总体的数量特征,为语言研究提供科学的判断依据。沈威副教授还强调,语言生活中的几乎所有内容都是可以度量的,这些数据之间存在着千丝万缕的联系,因此,统计思维对于语言学研究至关重要。
随后,沈威副教授通过多个实际案例,深入剖析了缺乏统计学知识导致的错误,如幸存者偏差、数据挖掘不当等。他特别提到了幸存者偏差这一逻辑谬误,指出在语言学研究中,如果仅根据已有的样本案例去归纳研究某个规律,很容易陷入幸存者偏差的陷阱。因此,在语言学研究中,必须正确认识数据的作用,合理抽样,确保数据的随机性和代表性,以免得出错误的结论。
沈威副教授紧接着展示了语言学研究中常见统计方法的优秀案例,如邢福义老师的《“X以上”格式在现代汉语中的演进》、徐杰和刘彬老师的《不规则语法现象的词汇化处理方案及其意义》等。这些案例充分展示了统计学方法在语言学研究中的广泛应用和深远影响。通过相关性检验、回归分析、聚类分析等统计方法,研究者们能够更深入地揭示语言现象的本质和规律。
最后,沈威副教授详细讲解了常见统计方法的实际操作,包括标度、有序、名义三种数据类型及其对应的统计方法,正态性检验的判断标准,独立样本t检验和单因素方差分析的使用条件和适用情况,以及非参数检验和卡方检验等方法的应用场景。他还强调了效应量在统计分析中的重要性,指出效应量能够提供关于差异大小的直接信息,有助于更全面地理解统计结果。
本次讲座内容丰富,为参会者提供了一次难得的学习机会。通过沈威副教授的精彩讲解,参会者深刻认识到了统计学方法在语言学研究中的重要性及其广泛应用前景。相信在未来的语言学研究中,统计学方法将发挥更加重要的作用,推动语言学研究不断迈向新的高度。
文案|赵赫晗
编辑|赵赫晗
初审|刘星
终审|谢晓明