返回教学研究

语料库技术助力新时代思想政治理论课改革创新
李梁
[摘要]语料库及其技术支持下的思想政治理论课教学,是信息技术与教育教学深度融合的一种尝试。把语料库技术引入思想政治理论课,针对学生在学习过程中产出的词语、句子、段落、语篇的语言描述与表征,采用计算机技术进行主题词检索、词频计算、搭配习惯、同现模式等概率统计分析与研究,为思想政治理论课教学的学情分析、确定教学目标和内容、教学策略选择以及教学顺序再造提供了一种新的思路和方法,有助于在实践中提升思想政治理论课教学质量,深化新时代思想政治理论课改革创新。
[关键词]语料库技术;新时代;思想政治理论课;改革创新
[作者简介]李梁,上海交通大学马克思主义学院教授,博士生导师(上海  200240)。
[原文出处]《思想教育研究》(京),2021.8.125~130
[基金项目]本文为2018国家社会科学基金重点项目“中国特色社会主义进入新时代的规范性力量研究”(项目编号:18AKS009)阶段成果。
现代信息技术与当代教育教学的融合,是我国教育事业的重大发展战略,也是世界教育发展的潮流,高校思想政治理论课(以下简称“思政课”)教学也不例外。近10年来,随着信息技术的发展特别是大数据的兴起,语料库及其技术,作为信息技术与教育教学融合的一种尝试,正日益受到世界各国教育学界的关注。语料库及其技术的理论基础源自于20世纪90年代以来,语言研究者在计算机语料库的开发和研究中,所形成的语料库语言学和计算语言学。语料库研究历史与实践表明,语料库技术不仅是一种基于语料库(实证主义)的教学工具和方法,而且是一种基于规则(理性主义)的科学方法论。党的十八大以来,思政课建设在改进中不断加强,课堂教学状况显著改善,大学生学习思政课的获得感明显增强。同时,传统课堂“满堂灌”和沉默状态的方式方法依然存在;针对学生思想和认知特点的精细研究缺失,“粗放型”教学仍屡见不鲜。当前,在大数据等新技术的全面介入下,如何遵循学生认知特点和规律设计教学内容,借助语料库及其技术,探索行之有效的教学方法,进一步提升课堂教学效果等,无疑是新时代思政课创新发展亟待解决的问题。
一、思政课教学设计与语料库技术的教学逻辑
计算机语料库及其技术的研究具有很强的教育应用属性。自20世纪90年代英国伯明翰大学语言学教授约翰斯(Tim Johns)率先将语料库方法引入课堂教学后,语料库及其技术对教学的推动作用已逐渐为学界所认可。语料库技术最鲜明的特点,在于教师可以利用课前、课中和课后,采集来自学生的真实信息(文本),运用概率统计、词频计算、搭配研究、共现模式等计算机分析技术和手段,获取学生文本的量化数据和可视化统计结果,通过把定量研究和定性研究结合起来,提升课堂教与学的针对性、有效性。
思政课教学语料库是一种能够满足教师教和学生学的实际需要,方便检索和使用的教学资源数据库,其类别可划分为学习者语料库和教材语料库。从汉语信息处理的视角,概念、命题及理论的语料表征方式,通常是词语、句子、段落和语篇等文本。学习者语料库是以学生的真实语言为建库对象的专用语料,语料主要来自于教师布置的为学情分析而收集的学生前测练习(词语)和课堂随堂反馈实录(语句)以及学生课后完成的习题(段落或语篇)。针对学生在学习过程中产出的词语、句子、段落和语篇,采用计算机技术进行关键词检索、词频计算、搭配习惯等概率统计分析与研究,有利于发现学生的言语特征、认知结构、学习特点、倾向性以及态度与价值取向。学习者语料库的技术平台是中成智慧课堂APP——应用于手机端的智慧教学软件平台,通过手机可以实现师生在线实时互动交流和全程大数据记录评价分析。
从教育技术学的视角,思政课教学所指向的是课堂教学设计中的教什么(确定教学目标和内容)、怎么教(教学策略与方法的运用)和如何判断学生的学习成效(对目标的达成作出评价)等三个层面,与此相对应的教学设计程序与步骤可分为学情分析与教学目标的确定和教学内容的设计,教学工具的开发与教学策略(教学模式)的实施,以及评估程序和技术支持体系。语料库及其技术对语言及其意义的研究与探索,对于思政课教学设计,更具有针对性和实效性。概率统计与频率计算是语料库研究的一个主要方法。语料库语言学的一个重要目标是通过语料库呈现的不同来源语料的实际使用状态,解释某种语言现象是否发生或使用状态的概率。[1]10语料库语言学对语言现象发生的可能性大小以及实际使用情况的统计量,并不只是对语料进行简单的计数,而是通过对核心词(关键词、主题词)或句子或段落或语篇,进行概率统计与频率计算后得出的词频而获得的。从思政课教学的针对性和有效性来看,学情是教学的起点,学情分析是开展教学活动的必要前提。思政课教学目标的制定和教学内容的确定应该建立在学生已有的知识、能力和态度以及价值倾向的基础之上,只有把握学生学习的现实起点,才能使教学更有针对性和实效性。从认知心理学的视角,词频在一定程度上可以反映出在学习者认知结构中知识的数量、辨析度和组织结构等认知特点。由于建库的目的不尽相同,频率计算的方法也有多种,但基于词语或语词词频的分析与统计方法,在学情分析这一环节,可以为教师提供学生已有的知识基础及其知识分布的信息,为教学目标和教学内容的设计指明方向。
二、思政课学情分析与教学目标和内容的测量
思政课精准教学,始于学情分析,以及对教学目标和教学内容的测量。从自然语言处理的视角,文本是师生交流和思维的主要工具,词语则是构成文本的最小组词结构形式。思政课学情分析的第一阶段是针对学生在学习过程中产出的词语,运用语料库技术进行统计与分析;第二阶段是对思政课教学目标和内容进行测量。以“中国近现代史纲要”课“第二章对国家出路的早期探索”之“第一节农民群众斗争风暴的起落”教学为例。这一节的教学目的与要求可以表述为:了解太平天国农民起义发生发展的基本史实,认识太平天国农民运动对国家出路探索的历史意义,懂得单纯的农民战争不可能完成争取民族独立和人民解放的历史任务。[2]16
第一阶段,基于学习者语料库的统计、筛选和分析与处理。
首先,获取学生认知结构中与“太平天国”语料相关联的词语,并进行统计和筛选。此次教学班为2018年新进校的大一学生,学生人数为149人,其中以理工科学生为主。教师布置的作业是“词语联想”,即以词语的方式写出与“太平天国”相关联的时间、地点、人物、事件、影响等。从语料库语言学的视角,选择“太平天国”作语料,是因为“第一节”阐述的主要内容是围绕“太平天国”而展开的,“太平天国”是“第一节”整个语篇的中心词,多个段落的关键词和许多句子的核心词。为保证收集到的语料具有真实性和可测量性,教师会宣布一些做题的规则,如要求学生不能查阅任何资料;在规定的3分钟时间内完成;用手机以电子语言形式发送到中成智慧课堂;答案呈现的顺序按答题时间先后排列,并且内容不能重复等。统计结果显示,中成智慧课堂共接受到144份文本,计算机可以识别和处理的文本有140份。经筛选,有效文本135份(符合语词特征),并存储在学习者语料库。
其次,对135份文本进行分析与处理,以可视化方式呈现在大屏幕上。135份文本实测的词频结构和数量,以两种显示方式,分两组依次呈现。第一组,词频数从高到低排列,序次分别为:110,洪秀全;90,起义;70,农民;54,农民起义;41,失败;35,南京;34,上帝;31,清朝;27,反抗;22,侵略;21,太平军……5,金田村、剥削、神权、天朝田亩制度等12个;4,内乱、落后、抗争、资政新篇等16个;3,韦昌辉、西征、局限、内讧等18个;2,洪仁轩、民族英雄、洪天贵、救亡图存等69个;1,内忧外患、可歌可泣、狭隘、乌托邦等357个。第二组,采用词云图方式,形成关键词云层。在云层中心是洪秀全,其他词语,如起义、农民、农民起义等按词频数的高低分布在洪秀全的周围。其中,词频排列较高的一些词语,词云图予以视觉上的突出,构成关键词渲染。
再次,对上述两组词语的词频及其结构进行综合分析。从学情分析的视角,教师可以获知当下学生关于“太平天国”的认知结构、言语特征及学习特点,以及与教学目标和内容的关联程度。统计数据表明,学生在中学阶段,已大致了解了太平天国这一历史事件的相关知识,如起义的性质、背景、原因、领导者与参与者、主要内容、起义的过程以及最后的结局等。在学生认知结构中,呈现出太平天国的知识分布不均匀的状况,但对太平天国核心问题辨识度比较高,如洪秀全领导的太平天国的性质——反抗清王朝和反侵略的农民起义,而且这些词语在文本中出现的位置大多比较靠前。关键词渲染,则进一步呈现出了“太平天国”的性质和特点,并强化了词频统计结果的真实性。
第二阶段,基于教材语料库的统计与分析及其处理。
首先,结合教材语料库“第一节”语篇中词语的频次、位置,与学习者语料库进行对比及分析研究。课前,教师对教材语料库中“第一节”的词频进行了统计,词频数按高低排列顺序如下:42,太平天国;29,农民;25,起义;12,斗争、封建;10,方案;9,太平军、制度等;8,洪秀全、领导、土地、西方等;7,天朝田亩制度、失败、天朝;6,侵略、资本主义、农民战争、农民起义、外国、人民等;5,资政新篇……。对比结果显示,教材语料库中“太平天国”的一些关键性词语出现的位置和频次,与学习者语料库的统计数据基本接近。但《天朝田亩制度》《资政新篇》等,在学习者语料库中的位置靠后、频次较低,与教材语料库产生了较大的偏差。
其次,结合教材及其内容,对上述对比结果的异同进行定性分析。其一,这个教学班的大部分学生是理工科学生,其历史知识的记忆主要来自中学历史课教学(高二之前参加历史科目的会考);文科考生由于要参加文科综合类考试(政治、历史和地理),其历史记忆一直会延续到高考结束,甚至迁移到大学。中学历史教材主要来自人民教育出版社,简称“人教版”。人教版初中历史教材中的“太平天国”内容来自《中国历史》八年级·上册第2课,第二次鸦片战争期间列强侵华罪行之“太平军抗击洋枪队”。课文简要叙述了洪秀全领导太平天国运动发生发展的过程,详细介绍了太平军抗击洋枪队的过程及其细节。[3]9-10高中《历史》1教材则单列了第11课——太平天国运动(三个子目录依次是:从金田起义建国到天京、《天朝田亩制度》的颁布、天国悲剧),在初中教材的基础上,叙述了《天朝田亩制度》和《资政新篇》的内容,并作了简要的分析与评价。[4]54-56“太平天国”属于陈述性知识范畴,即能够直接加以回忆和陈述的知识。从认知心理学的视角,对“太平天国”的“词语联想”属于一种“联想记忆”。因此,通过联想进行记忆的统计结果,或许正是艾宾浩斯(H. Ebbinghaus)遗忘曲线规律的一种反映。由于太平天国的一些基本史实,初中和高中都涉及到了,而《天朝田亩制度》等高中教材新增设的内容,文科学生比理工科学生更容易形成长时记忆。其二,现行的《中国近现代史纲要》教材所阐释的“太平天国”,在历史脉络、基本史实、主要内容方面与高中历史教材既相似,又有不同。相似的有“第一节”之“一、太平天国农民战争”(三个子目录:金田起义和太平天国的建立、《天朝田亩制度》和《资政新篇》、从天京事变到太平天国败亡);不同的是“第一节”之“二、农民斗争的意义和局限”(太平天国农民起义的历史意义、太平天国农民起义失败的原因和教训)。经过比对发现,高中教材第11课《太平天国运动》的课程标准是让学生“了解太平天国运动的主要史实,认识农民起义在民主革命时期的作用和局限性。”[5]但教科书没有直接阐述太平天国的历史作用,只是描述了一些能够反映太平天国运动历史意义和农民阶级局限性的史实。而《中国近现代史纲要》之“农民斗争的意义和局限”则明确阐释了“认识农民起义在民主革命时期的作用和局限性”这一中学的课标要求。
再次,以教材为基本遵循,对教学目标和教学内容进行测量。通过对中学教材的分析并结合语料库统计结果,“中国近现代史纲要”课教学重点应该讲授“农民斗争的意义和局限”这部分内容。由于《天朝田亩制度》是这次农民起义特色的纲领性文件,《资政新篇》是太平天国后期颁布的社会发展方案,这两者共同构成了农民阶级对国家出路早期探索的历程,而数据统计结果表明,部分学生却没有认识到这个问题,因此确定其为教学的重点内容之一也是不言而喻的。
基于语料库技术的学情分析,不仅为当下教学目标和内容的确定,提供了真实、可靠、清晰的语言实证信息,而且可以帮助教师了解学生在“已知”知识的基础上,开展有针对性的教学。当然,对教学目标和内容测量,并不意味着教学设计工作的完成,接下来基于语料库技术的搭配研究和同现模式,可以进一步为教学实践提供有效的帮助。
三、思政课教学方案的选择以及教学顺序再造
从教育语言学的视角,思政课教学活动是师生之间以语言及其意义作为内在环节的交往实践过程。对语言及其意义的探究,不仅是语言哲学和语言学的核心议题,而且是思政课教学研究的中心议题。搭配研究与同现模式,是语料库语言学研究的另一个重要方法。搭配,文本中词语之间的一种“结伴关系”及同现模式,即若干词语同时出现在同一文本中概率和频率。搭配研究的目的在于探究语言现象及其在语境中的意义。搭配研究涉及到词语或语句的语义偏好以及语义韵。[6]4语义偏好,属于一种用语习惯,是人们在语言交往时的偏好用语,常与某些态度和情感的词语共现。语义韵是语义偏好的子范畴或者说是一种特例。语料库语言学研究表明,语义韵大致可分为积极、中性和消极三种类型。在积极语义韵里,与核心词(关键词、主题词)搭配、共同出现的词语几乎都具有强烈或鲜明的积极语义特点,使得文本语境弥漫着一种浓厚的积极氛围。消极的语义韵则正好相反。[7]语义韵常常是语料产出者的搭配习惯,甚至是潜意识的表征,不易为普通阅读者的直觉所能觉察到,但它揭示的是隐含在语言现象背后的语料产出者内心的真实态度和价值取向。从搭配研究的语义韵视角,上述统计与分析结果中的同现模式表明,大部分学生的词语文本不属于消极语义韵,但离积极语义韵还有一段距离。学生提交的语句文本显示,语料中有不少属于语义消极的词语,如狭隘、内讧、内乱、落后、失败等。但也出现了很多诸如反抗、斗争、抗争、反对、英雄、奋起、救亡图存、捍卫等语义积极的词语。统计结果表明,大部分学生肯定了太平天国的作用,认识到在半殖民地半封建的中国,农民具有伟大的革命潜力,同时也指出了农民阶级存在的局限性。为此,基于语料库技术的语义韵研究,同统计数据基本上反映了这个教学班的学生对太平天国农民起义的态度和价值倾向。有鉴于此,在“第一节”教学中,一方面教师的讲授需要营造更具有积极氛围的语义韵,如《天朝田亩制度》是太平天国反封建的革命纲领,它表达了农民阶级要求废除封建地主土地所有制的强烈愿望;又如,太平军通过北伐、西征、东征沉重打击了清政府的统治,充分表现了农民阶级英勇无畏的抗争精神;再如,太平天国有力地打击了西方资本主义侵略者,打破了西方侵略者把中国迅速殖民地化的企图,这有助于学生进一步认识太平天国农民运动对国家出路探索的历史意义。另一方面,如“太平天国后期无法制止和克服领导集团自身腐败现象的滋生,领导集团的一些人在生活上追求享乐,在政治上争权夺利”[8]47等这一类具有消极氛围的语义韵,尽管在统计数据中已有明显的反映,但在实际教学中,不应过多的渲染其情节和过程,应通过分析农民阶级自身所不可克服的狭隘性、保守性、自私性等特点来说明农民阶级的局限性。因此,语料库语言学对语义韵的研究,为思政课教学实现教材体系、教学体系有效转化为学生的知识体系、价值体系提供了真实、可靠的语言实证信息。
基于语料库技术的语句统计与分析,为思政课教学选择实施方案以及教学顺序再造提供语言学的实证信息。此次教学班为2019年新进校的大一学生,学生人数为109人,其中以文科学生为主。以“中国近现代史纲要”课“第二章”之“第一节”教学为例。课中,以随堂反馈的方式,要求学生在“太平天国”词语联想的基础上,遣词造句。词语联想的词频统计结果如下:60,农民起义;41,洪秀全;31,天京;17,天朝、失败;14,农民战争、资政新篇;12,南京、田亩制度;11,清朝;10,清政府;9,反抗、金田起义、镇压、农民、湘军、太平天国运动、资本主义;8,起义、定都;7,拜上帝会;6,中国、鸦片战争、杨秀清、推翻、腐败、事变;5,反封建、侵略、统治、规模、上帝教、曾国藩、运动、金田村……遣词造句的规则如下:在3分钟时间内,向学习者语料库提供三句语句,句子的类型是陈述句和疑问句,其中至少有一句是疑问句。陈述句陈述事实,提出观点;疑问句提出问题,寻求解答。
经计算机统计与分析,有94位学生提交的文本符合随堂反馈的要求。其中,有效的陈述句146句,疑问句109句。数据统计表明,语句文本中的词语搭配以及同现模式,与词语文本的词频结构、频词的相似性极高,而且形成了对太平天国的一些基本判断。如,太平天国(132)是洪秀全(36)领导(37)的推翻(34)清政府(31)统治(31)和反抗(21)外国(4;资本主义3)侵略(6)的农民(44)起义(104)运动(88)。洪秀全创立拜上帝会(3;上帝教3;上帝3),在金田村(3)发动(6)农民起义(57),定都(17)南京(6),后改为天京(12)。太平天国运动(88)最后(9)遭到(6)帝国主义(5)和清朝(18)反动势力(10)的双重镇压(31),最终(13)以失败(85)告终(11)。太平天国起义是中国(23)历史(15)上最大(10)规模(8)的农民战争(8),加速(9)了清王朝(12)的灭亡(6)。太平天国失败的根本原因(3)是农民阶级(5)自身(1)的局限性(3)等。语句文本,与词语文本最大的区别在于,语句中没有出现《资政新篇》,而《天朝田亩制度》只出现了一次。从语料库语言学视角,语句文本是基于语词文本的遣词造句,既是为了进一步确认学生对“太平天国”史实的基本认知,又是为了从语句中找寻学生在“太平天国”问域中产生的疑惑和问题,以便确认教学目标与教学内容,并在此基础上,选择教学实施方案以及教学顺序再造。为此,对疑问句(问句)的统计与分析尤为重要。
思政课的一个重要任务就在于面对问题,设疑引思,给大学生分析问题产生的缘由与发展动态,进一步解释历史问题与现实问题以及理论问题的关联。问题逻辑是一种指向问题提出及其解答的教学方法和工具。这109个问句,按问题域大致可分为四种类型:第一类,为什么会爆发太平天国运动?洪秀全为什么要领导太平天国起义?第二类,为什么要定都在南京?太平天国定都天京是否有什么深刻意义?第三类,太平天国究竟是积极意义大,还是消极意义大呢?怎样评价太平天国?第四类,洪秀全领导的太平天国起义为什么会失败?太平天国运动失败的根源是什么?从问题逻辑的视角,对上述四类问题进行分析。第一类问题,不是“真问题”。关于太平天国运动爆发的原因,中学历史课教材里有明确说明,学生只是遗忘而已。第二类问题,问域非常明确,但问题的应答集与其他三个问题相关,不宜在教学中专门解答。第三类和第四类问题,与“太平天国”的教学目的和要求直接相关,是教学中要解决的真问题。其中,第三类问题,涉及中学历史教学的课标要求,教学中应确定为主要内容之一。经统计与分析,第四类“为什么太平天国会失败?”占了问句总数的一半以上,学生提出这样的疑问,而且占半数以上,应该作为教学的重点。教师解答这个问题,需要结合中学历史教学,并迁移到大学课堂。究其原因之一,高中历史“太平天国运动”有课标要求,但教材在叙述了太平天国运动的主要史实后,没有相关的说明和评价,只是在“探究与总结”栏目中设计了一个“本课测评”的题目——“试分析太平天国运动的历史作用和局限性有哪些?”[4]57有鉴于此,教学方案的实施可以从第四类问题入手,实现教学顺序再造。
教学顺序指教学内容的各组成部分的排列次序,它决定“先教什么,后教什么”或“先学什么,后学什么”。教学活动是教师和学生以理解教材为中心环节而进行的认识活动,传统思政课教学一直是按照教材的逻辑,顺序而教。但通过对上述四类问题的分析,实际的课堂教学顺序应该围绕“太平天国运动为何失败”这一问题,先倒序后顺序教学,即通过串联学生问题以及教材的内容,实行教学顺序再造。为此,教学方案实施如下:首先从农民战争的战略战术视角,以太平天国后期的军事将领忠王李秀成的《自述》中分析太平天国失败原因的“天朝十俣(误)”(由于第六误重出,实际上是“十一误”)为切入点,[9]分析太平天国早期的军事活动,如北伐(一误,二误,三误)、西征(四误)以及从金田起义、永安封王到天京定都的过程,包括定都南京的缘由。其次,从洪秀全领导农民起义和治理太平天国的指导思想视角,分析农民平等思想、早期基督教思想在太平天国前期的表现和作用,并指出基督教思想(拜上帝教,《劝世良言》等)是流,而不是源(解答太平天国运动爆发的原因),重点讲清楚这些思想怎么会与农民起义联系在一起,尤其是宗教思想(引用恩格斯《论早期基督教的历史》一文的观点),以及太平天国的诉求和理想(《天朝田亩制度》及太平天国的制度)。再次,分析定都南京后太平天国的思想基础(儒家思想)及其行为方式,包括天京事变(五误)和石达开出走(六误)对太平天国的影响以及太平天国对待西方列强的态度(反侵略、《资政新篇》)等。最后,在李秀成“天朝十悮(误)”的基础上,借鉴年鉴学派的“总体史观”,结合史学界历年来研究太平天国的成果,包括历史上的梁启超、孙中山、钱穆等对太平天国的论述,尤其是马克思的《路易·波拿巴的雾月十八日》以及列宁对农民及其局限性的理论阐述,分析太平天国失败的原因、总结其历史意义及经验教训。最终阐明:太平天国起义及其失败表明,在半殖民地半封建的中国,农民具有伟大的革命潜力;但它自身不能担负起领导反帝反封建斗争取得胜利的重任。单纯的农民战争不可能完成争取民族独立和人民解放的历史任务。[8]48因此,思政课教学实践活动表明,一方面,计算机语料库及其技术不仅改变了传统教学的方法和手段,而且丰富了教学资源,拓展了教学平台,也极大地改善了教与学环境和氛围;另一面,由于坚持问题导向和目标导向相结合,增强了思政课的针对性和实效性教学。
随着高等教育信息化的发展,本文对语料库及其技术支持下的思政课教学的一些思考与实践,是探索一种结合教学环境、教学方式、教学对象等发生的变化,围绕教学理念、教学目标、教学内容等方面,大力推进新时代思政课内涵式发展的改革创新之路。作为一个新生事物,这种尝试性的探索,或许会面临着发展中的困惑、争议甚至挑战。其价值不在于探索的结论或结果,而在于在探索过程中对问题的思考。
语料库技术支持下的思政课教学,坚持目标导向和问题导向相结合,注重推动思政课建设内涵式发展,提升学生思想政治理论素养,为深化新时代思政课改革创新提供了一种新的思路和方法。
参考文献:
[1]梁茂成,等.语料库应用教程[M].北京:外语教学与研究出版社,2010.
[2]王顺生.“中国近现代史纲要”课教学基本要求[M].北京:高等教育出版社,2016.
[3]课程教材研究所.中国历史(八年级上册)[M].北京:人民教育出版社,2006.
[4]普通高中课程标准实验教科书:历史1(必修)[M].北京:人民教育出版社,2007.
[5]教育部.《普通高中历史课程标准(实验)》摘选[J].历史教学,2003,(7).
[6]何安平.语料库的短语理念及其教学加工[M].广州:广东高等教育出版社,2013.
[7]樊斌,等.语义韵与语义偏好的关系及对外语教学的启示[J].韩山师范学院学报,2008,(4).
[8]本书编写组.中国近现代史纲要(2018版)[M].北京:高等教育出版社,2018.
[9]李晴.怎样评价李秀成及其《自述》[J].历史研究,1979,(1).