政策科学是关于政策过程及与此过程相关的知识,通过制定政策规划和政策替代方案,应用新的方法论确定事件的发展趋势,为政治、经济和文化生活中的重要决策提供直接的重要事实和原则。政策科学突破了政策过程无法进入的界限,使政策分析成为可能。文本分析法是结合语言学方法从文本表层深入到文本深层挖掘文本内涵的工具,其在社会科学中的应用主要是研究政策文本,从整体上判断文本所属领域的政策取向和战略走向,进而做出宏观预测和解释。隐秘的或不完全透明的政策制定与运行过程蕴含着政策意图真实的形成和执行情况,深入政策过程一探究竟成为政策研究界的共同向往,而政策文本作为正式、全面且可查阅到的有关政府行为的文字,记录了政策面对内部或外部压力时在内容上所做出的调整,反映了所在领域社会结构和组织的变迁,是理解政策制定主体、政策覆盖对象、政策目标和政策手段的事实依据,也是探讨各类政策发展过程的新角度。研究者结合政策文本所处的历史环境,依据多种研究程序探索政策文本的话语内涵,对于剖析社会结构、解析社会发展有着重要的意义和价值。
社会科学研究范式是进行社会科学研究的有效工具,不同范式有其自身的认识论与方法论;不同的哲学思想产生了不同的方法论,方法论决定研究方法。政策文本在内容上传递了政策制定者的政治目的,存在多元主体的利益维系,理解政策时需要将文本及其所处的制度背景、实践环境进行有效对接,因而政策文本作为一种研究对象具有复杂性和隐蔽性。科学哲学、政治学、语言学等领域学者不断完善文本分析知识论和方法论,这种为理解文本提供更为科学的方法论指导所做的努力值得关注。随着语料库的建设,政策文本类型与分析方法也愈发多样,确保研究科学性和可靠性的关键正是方法论基础,面对复杂的研究内容与所呈现的尚未成体系的研究方法,对政策文本分析方法论做出清晰梳理显得尤为迫切。本文从研究范式和发展过程两个维度构建方法论分析框架来推进这项工作,探讨六种政策文本分析方法的研究进展,阐释文本分析方法的应用,以期为政策文本相关研究提供借鉴。
一、政策文本分析及其研究范式
文本分析法是一种借助符号媒介,系统分析、比较和归纳文字、音频或视频等文本所蕴含的语言表达,以实现文本阐释和评述的研究方法。政策文本作为文本的特殊形式,是能够传递政策意图、呈现政策制定过程、反映政策执行结果的文本话语表达,其中既有字词句、文本结构脉络及标点符号,也蕴含着抽象的语言逻辑。将文本分析应用于政策研究领域,以更深入具体地感知政策主体在政策制定过程中的意图和政策目标,逐渐成为社会科学研究挖掘文本价值的重要方法。政策研究包含文本、文本质感与文本互联性三个文本阐释的层次,分别考察政策文本与其他相关文本、社会脉络和历史脉络的关联性,强调政策文本研究要发掘文本的深层结构及其演变的内在逻辑,透过文本和话语深入探索政策过程。政策文本分析虽然是研究者做出的,会带有研究者的理解和判断,但实证主义与解释主义范式为政策文本分析划清了价值中立与意义建构的界限,不会任由研究者妄加推断,也不会忽视文本各要素的意义世界。
17世纪以前,对社会现象的观察、研究统一归属自然哲学体系,自然科学与社会科学未做区分,发展出了早期辩证法、演绎法等。19世纪末至20世纪初,社会科学越来越注重经验概括、实验比较、数量分析和定量统计等各种科学研究的方法,围绕科学抽象和科学解释两大系统,研究方法不断演化,发展出不同的研究范式,例如实证主义方法范式、人文主义与解释学方法范式、社会唯实论方法范式、社会唯名论方法范式、结构功能主义方法范式、社会生物主义方法范式等。不同的社会科学研究范式具有各自独特的认识论与方法论。20世纪初,主张科学规范与逻辑操作的实证主义带领社会科学用自然规律解释社会现象,在实证主义发展的推动下,定量研究成为社会科学研究领域的主流,而现代社会科学定性分析受实证主义与解释主义范式的影响,在批判定量研究的过程中也逐渐发展起来,并建立理论知识体系,期望通过对社会事实的观察、记录及解释,归纳概括事实之间的关系。可见,在社会科学研究中,研究范式与研究立场决定了不同的研究路径。
图片
在实证主义范式下,政策文本定量分析主要是通过量化手段来视图化呈现政策文本的内容,更高效地识别政策研究热点主题,梳理政策变迁及发展规律,检验政策执行效果,发现政策文本存在的问题,并做出预测,这符合实证主义所主张的使用归纳与演绎等方法分析可量化的经验观察数据的逻辑验证要求。因此,政策文本定量分析就是实证主义范式下方法论的精确化。政策文本量化研究开创了政策研究与计算机科学领域互动融合的新局面,是通过一系列的转换范式将非结构化政策文本转换成抽象化、特征化、计算机可处理的结构化数据。在文本量化研究中,综合政策分析科学、计算科学、统计学等学科方法,产生了多种把政策文本进行量化表示的方式,基于这些方式的特点,可将当前政策文本量化方法分为三大类:政策文本内容分析、政策文本计量分析和政策文本内容挖掘方法。
政策文本定性分析则是通过文本阐释、语言分析走进政策实施的具体过程,分析政策环境,深入解读政策制定者的意图,获取对当前政策的启示,在发展后期借助专业技术辅助分析以提升应用价值,与解释主义重视信息的收集、意义理解与动机诠释的认识论相契合,也表现出实证主义范式的整体性、精确化特征。不过总体来看,政策文本定性分析还是解释主义范式下方法论的具体化。根据定性研究方法的内涵以及政策文本研究的不同目的,可以从政策文本释义性分析、政策文本话语分析、政策文本比较分析三个方面梳理政策文本定性分析方法及其应用。
二、解释视域下的政策文本定性分析
解释主义社会科学与旨在通过规范技术和过程探索社会现象中存在的客观规律的自然科学不同,解释主义认识论强调社会现实的意义和价值属性,认为社会中人的思想、意识建构了社会现象的真正含义,其中每一个相关解释群体都具有独特性,他们从个人价值观出发赋予了社会现实不同的解释。在这其中,主客体也并非完全分离,没有绝对的客观,在认识社会现象时研究者不可避免地会受到来自周围环境的不同概念、想法等的影响,由此反对实证主义在社会科学实践中所表现出的自然科学的价值中立、过度客观等特征。
(一)诠释文本:释义性分析
政策文本释义性分析是运用诠释学方法理解文本意义并做出解释。诠释学经由施莱尔马赫、海德格尔、伽达默尔与保罗·利科等哲学家的发展,成为社会科学研究中的一门显学,所研究的就是如何最精确、最原汁原味地将涵括在文本中的真理展现出来,蕴含着“解释真理进而要求服从”的含义。诠释学本身是要对世界观、社会文化与知识进行释义,在研究过程中,研究者的主观意识不可避免地影响着研究过程,研究过程也会影响理论的建构和对社会事实的把握;而现实世界中已有的关于个别现象的重要解释和分析本身已构成概念或理论体系,能够为个体主观分析提供客观基础,即新的释义仍然是对客观事实进行解读的。因而,诠释分析的客观性在现代诠释学巧妙结合理论体系的客观性与个体思考的主观性的努力下得到了保证。在诠释学的影响下,社会科学的研究对象不再是纯然客观的事实,而是一个充满意义的世界,社会科学研究用解释的方法深入人们的意识中了解行动背后的意义和动机。由于政策过程和文本之间存在某种动态的联系,对政策文本进行分析能够探查政策过程,因此,要深入理解政策背后的意义,就需要围绕政策文本进行诠释,从而达到理解政策的目的。
以教育政策为例,研究者基于各类政策文本能够确定职业教育、高等教育等领域关注的焦点,进而对政策目的、政策特点、政策动因与价值追求、政策实施及政策评价等方面进行释义,做出政策环境分析、政策利益相关者分析以及政策实践价值分析。政策文本释义性分析能够深入政策实施过程,理清教育政策的阶段性变迁及演变方向,明晰不同的政策发展阶段对特定教育的推动效果,区分不同主体在政策制定和执行中的作用,进而提出相应领域教育政策的发展进路与建议。
(二)语言之辨:政策文本话语分析
话语分析在20世纪中叶以后逐渐被应用于人文社科类的质性研究之中,探索语言在特定社会情境下的使用和表达形式,研究人们如何使用话语、如何构建话语的社会意义。话语分析建立在语言学基础之上。海德格尔、维特根斯坦等语言哲学思想家打破了西方哲学延续已久的有关主体性与反思性的语言观点,随后20世纪70年代兴起的“语言学转向”学术思潮将语言学当作批评实证主义方法论的新力量。“语言学转向”迅速扩展到社会科学研究中,经典实证主义研究方法主张在认识世界的过程中将主体与客体分离,强调科学设计与经验可证实性,受此研究立场所影响的政策话语分析依赖社会科学程序、技术和经验。建构主义者对此提出了质疑,认为人们对社会事实的认识不是由经验有效性决定的,认识应产生于话语、沟通、磋商之类的社会行动过程。关注言说主体和对象之间的关系、关注语境之间联系的话语分析成为“语言学转向”对人文社会科学领域影响最大的语言学方法。相应地,公共政策研究领域也关注到了政策话语与政策过程,出现了所谓的“语言学转向”。后实证主义政策研究主张透过语言、沟通、论证与文本材料,经由系统性的分析与理论建构,重新理解和解释公共政策。在理论知识体系建构方面,话语分析广泛吸纳不同学科的理论和方法,运用符号学、言语行为理论、系统功能语言学等指导分析实践。
立足文本话语,政策文本分析能够提取出文本的特殊词,通过词语界定明确文本所要表达的关键含义,文本话语在一定程度上也呈现了概念作用机制。政策文本话语分析还可以通过将政策文本与语境相关联,让研究者走进文本产生的社会背景,解读文本话语的真正意涵,剖析政策话语体系的建构过程。话语分析在教育领域应用广泛,随着方法论哲学从实证主义向后实证主义的转向,教育政策研究者对政策本质的理解从“社会事实”转向文本和话语。方法论的诠释取向强调政策过程中的意义、理解与动机,方法论的话语分析取向则强调政策结果中的影响、效力和政策话语的社会条件。政策文本作为政策的具体表达,深刻影响政策制定及其执行的有效性,话语分析将静态的文本内容转化为动态的言说过程。在教育领域,呈现出问题导向与关系导向的政策文本研究主题。政策文本话语分析为理解政策过程与结果、行动与动机的关系提供了方法,便于研究者理清政策背后的社会关系,从政策话语主体、政策话语价值定位等揭示教育体制改革过程中政策文本乃至政策本身存在的问题及其成因,进而有针对性地提出改善建议。
(三)互文取向:政策文本比较分析
20世纪60年代法国符号学家朱丽娅·克里斯蒂娃提出了“互文性”概念,互文性强调文本不是单纯的文字排列组合,它囊括了一个场域内的文化背景、社会结构与意识形态,文本之间存在着衔接与延续。互文性理论带动了文本比较方法的发展,文本比较是指通过对相似范畴和内容的文本进行对比,研究其文字、观点和思想的异同,从而实现言语特征分析、学术思想比较等多种目的。相应地,政策文本比较促进了政策文本之间的互动对话,即相互吸收、相互借鉴、相互参照。
践行互文性的文本对话理念,政策领域的学者进行了广泛的政策比较分析。例如有研究从人才界定、领域范围、资金支持、生活保障、激励措施和后期培养等方面对四川省和江苏省高层次人才引进政策进行文本比较分析,以期说明我国东西部相关政策的共性和差异。也有研究从政策背景、参与机构、主要内容和体系特点等维度比较国内外政府信息公开和政府数据开放相关政策文本,以期明确政府信息公开和政府开放数据二者之间的关系。在教育政策领域,研究者以同一系列政策文本、省际政策文本或国内外政策文本的比较为主题,发现政策文本在内容架构、综合实践、活动定义、基本理念、目标、内容、实施以及管理与保障等方面存在异同,这种比较为进一步的政策评估奠定了基础。例如有研究基于《关于教育体制改革的决定》《中国教育改革和发展纲要》与《中共中央 国务院关于深化教育改革全面推进素质教育的决定》的比较分析,识别出了文本脉络之间的对话连接与文本精神的一致性。也就是说,通过比较分析,能够理解不同教育政策文本的基本内涵,明确文本所传达出的政策要求,进而探索政策文本之间的关系。
总之,在政策研究方法论中,政策文本定性分析作为解释范式的一部分,通过展现个人和集体文化观念、语言、动机的文本来解读社会行动和社会现象,发展出了释义性分析、话语分析及比较分析方法。在发展后期,受实证主义范式的整体性、统计学等认识论与方法论的影响,为提升分析效率,研究者尝试运用信息技术改造传统分析技术与方法,从而提升文本分析的科学性与有效性,为政策文本定性分析创设了与计算机科学协同发展的方法。例如,上述传统政策文本比较分析主要是对不同政策文本进行阅读和统计分析, 整理出政策主旨、特征等,再抽取政策文本的某一方面内容进行文本之间的比较得出研究结论;但文本比较需要分析大量非结构化的文本信息,为提升效率,研究者开始探索结合计算机高速计算技术进行文本比较的方式,实现文本的自动化分析。C++、Java、Python等编程工具的使用助推了高效的文本比较研究。政策文本话语分析方法也已开始探索构建基于计算机辅助政策话语分析的理论模型,追寻大数据时代话语分析的创新发展。
三、实证主义下的政策文本量化研究
社会科学的实证主义和技术官僚取向在20世纪60年代达到了顶峰,一些社会科学家相信,社会科学正在接近自然科学的那种确定性。相应地,政策分析带有实证主义精神的明确印记,之后大量的数字和定量分析技术充斥在政策分析当中。作为实证主义范式指导下定量方法在政策领域的具体应用,政策文本量化分析呈现出数据分析、计算思维等突出特征。其中,内容分析基于理论分析框架,通过编码关注文本内容特征和规律;计量分析基于数据库或语料库对政策文本进行结构化、视图化的整体性分析;而文本内容挖掘方法又具有自动化和分析语义结构、文本语境的优势。
(一)分类编码:政策文本内容分析
在实证主义者看来,现代科学、技术和工业的发展是客观存在的,自然科学以重复性实验与经验观察探索自然规律的研究方式具有科学性,社会事实外在于人,要保证研究者的价值中立与研究对象的客观性,在获取知识、验证假设的过程中广泛使用观察法和实验法,并要以明确的统计数据作为研究支撑。因而,实证主义政策分析对技术要素有着明显追求。伴随着社会科学研究的“语言学转向”,强调语言逻辑、诉诸事件一般规律的逻辑实证主义产生,政策分析不可避免地受到逻辑实证主义学说的影响。如前文所述,诠释背景下的社会科学研究强调文本内涵的诠释与推理,通过语言符号将模糊复杂的文本内容组合成有条理有规则的体系,而在对自然现象进行说明时,逻辑实证主义强调经验与逻辑的重要作用,认为只有能被经验证实的命题才是有意义的。这一时期的社会科学研究坚持归纳主义的原则,通过逻辑分析将命题分解为多个概念,再将这些初步分解出的概念归纳整理成更基本的概念,得出一般规律。
内容分析法遵循社会科学研究的实证主义范式,目标是对某一问题和现象进行描述、解释、预测和控制,获取具有普适性的知识,科学、客观地探索政策文本的语言符号。内容分析法在具体操作中首先要根据研究问题抽取文本,然后确定分析单元和归类标准,也就是遵循实证主义范式的先验设计要求,在研究开始前明确变量、测量方式和编码规则,接着对内容编码,将分析单元分配到类目系统中去,研究者对量化数据做出解释和分析,对内容特征做出总结和概括,最后不可缺少的是对分析结果进行信度和效度的检验,使研究结果具有可推广性和可复制性。传统的内容分析法通过对所抽取的重要文本内容的编码,将繁杂的文本内容归纳为围绕特定类目的系统化的编码信息。虽然传统内容分析中的人工编码部分带有研究者对文本的释义性解读,但这种方法对数据框架有更为明确的界定,与释义性分析开放性的数据选取形成对比,提升了文本数据的有效性。传统内容分析适合用于那些元素清晰出现可以直接计数、关键字词句明显、编码简单明了的文本,研究者只需关注相关内容是否出现,进行词频、词与词之间的相关性及因子分析等统计性分析。随着计算机技术的发展,QD AMiner、SPSS Text Analytics for Surveys等文本数据管理软件产生,虽然分析步骤还是沿用传统内容分析法,只是在编码部分由人工转为半人工,还是依赖于研究者的人工操作,但计算机辅助编码和统计工作提升了传统内容分析的效率。即各种文本分析软件的使用能够降低人工处理的比重,具有文本数据自动统计和关系识别的优势。
政策文本内容分析以某一领域的政策文本为研究对象,关注其内容特征和核心要素,捕捉政策执行中的着力点,归纳政策演化规律,有时也会结合描述性统计分析对结果作进一步解释。例如,关于易地扶贫搬迁政策过程的研究对政策文本进行编码分类,提炼多个政策维度,识别出了政策体系的演变特征。内容分析也可用于政策扩散研究。例如,运用内容分析法对农村政策在各地的扩散过程进行的实证研究,结合政策传递过程中的内外部因素提出了研究假设,在数据处理中将中央农村政策的事件史数据转换为事件史模型设定的数据结构,并设置虚拟变量建立回归模型以检验假设,探讨了我国正式文件运作的过程与机制。
内容分析也常与政策工具联系在一起。内容分析是将定性的文献资料转化为定量数据展开分析的一种集量化研究和定性研究于一体的分析方法,政策工具在分析政策过程与政策结果中扮演着理论指导的角色。政策工具有多种类型上的划分,根据政府干预程度差异所造成的强制力的区别,可以将其划分为自愿型工具、混合型工具和强制性工具。如果考虑工具特性及其应用环境对工具使用效果的决定作用,也可以将政策工具划分为供给型、环境型和需求型三种类型,这种分类强调政策问题、政策目标与政策工具的适配性。为准确获得政策文本的结构化特征与规律,从政策工具视角建立起分析框架,再将政策内容放入框架中进行分析,能较好地满足政策文本量化分析的研究期待。因而,结合政策文本与研究问题、研究目标,挑选合适的政策工具进而构造分析框架在政策文本内容分析中具有广泛的应用。例如,有研究在分析慈善捐赠政策时,对中央层面的政策文本进行编码和分析,总结出政策的阶段性特征,并考量了强制型、混合型、自愿型三个维度政策工具的使用情况。也有关于水污染治理政策的研究按照内容分析的基本步骤,挖掘分析单元、编码、构建政策工具分析框架,呈现了水污染治理政策类型及发展趋势、政策工具的历史演变路径,并指出未来的工作需关注政策工具选择路径依赖问题、部门决策主体选择偏好问题,以及多元主体协同共治机制未达成等问题。有研究将政策工具分类思想用于养老服务体系,构建以政策工具维度为X轴、以养老服务体系为Y轴的二维分析框架,将相应的政策文本内容编码,然后放入分析框架中对数据进行描述统计分析,剖析养老服务业政策在养老服务体系和政策工具两个维度上存在的问题,进而提出改进建议。也有计算机辅助内容分析运用爬虫软件与人工选取的方法从政府网站抽取养老产业相关政策文本,通过MAXQ-DA软件解构、归类政策文本内容,从中提炼出与主题相关且可以计量的政策维度,并分析政策工具的作用。这些研究显示,内容分析方法将政策工具作为定义分析单元的理论依据,一定程度上能够克服传统定性分析信度不足的问题。
总体来看,内容分析法关注文本的内容特征,构建政策分析框架定义分析单元,对文本进行编码和归类,使政策文本分析更具规范性与程序化。但内容分析将概念从文本语言环境中分离出来,作为量化的数据进行分析,无法看到文本各要素如字词句与语言结构、语言环境的联系。
(二)结构化分布:政策文本计量分析
随着计算机技术、算法的迅猛发展以及语料库的持续建设,政策文本分析在模型、算法和技术方面有了越来越多的选择,所能处理的素材量不断增加,处理精度也得到了大幅提升,这为政策文本分析引入了新的方法和理念,政策文本计量分析和文本内容挖掘方法应运而生。从研究方法上看,政策文献计量属于描述性推论,即利用观察值来推导难以直接观察到的结论。在坚持研究者的价值中立、研究对象的客观性以及从整体视角出发进行研究的实证主义认识论的基础上,计量分析主要使用计算机技术,基于政策文本结构要素,对大量可观察的文本资料作频次分析、共现分析、政策网络分析和引文分析等结构化、视图化的分析,呈现文本结构特征和变迁规律,并对数据进行描述和解释,实现宏观层面的政策分析。政策计量分析源于文献计量,1969年“文献计量学”(Bibliometrics)名词出现,代替了文献统计学,随后文献计量学在发展中广泛吸收社会学、数学、物理等学科的理论与方法,不断完善自身理论和知识体系;2015年“政策文献计量”(Policimetrics)的概念被提出,由文献计量学研究方法迁移而来的政策文献计量逐渐发展起来。政策文本计量分析主要是采用文献计量的基本理论与方法,基于已有政策文本数据库或政策文本语料库,从政策主题分布、政策发布时间序列分布、政策引证以及政策主体关系等维度对政策文本进行计量分析。之后,政策文本计量分析研究逐渐被应用于多个领域,以揭示政策文本各要素的结构化分布特征和发展趋势。
例如,在科技金融政策文本的分析中,有研究从政策的总体发展、主体、主题以及作用面等方面进行数量分布分析,了解政策分布特征、政策主体合作模式、政策体系结构等。还有研究在对第三次分配最新国家政策要求与战略部署相关文本进行分析时,系统呈现其发布时间、发布部门及文本内容,并以清晰的图表对现有权威调查数据作出描述和解释,理清第三次分配的价值和发展进路。在教育政策研究中,有研究基于科学知识图谱分析法整体分析教育政策学的研究热点,也有聚焦于高等教育、基础教育等具体教育政策文本的计量分析。其中,通过对高等教育政策出台的时间、数量、出台部门、政策文本类型等进行频数统计,并进行视图化呈现,发现政策的数量变化和国家政治、社会发展密切相关,治理主体由单一走向多元,政策体系愈发完善。对职业教育政策文本发布时间、发布单位、文件主题词、文件被引用频次等方面作计量分析,探索热点领域和发文趋势,发现职业教育文件愈发重视职业教育信息化,有关高职教师的内容主要聚焦于管理制度,存在聘任机制不完善、忽视专业培训、缺乏考核评价等问题。对中小学减负政策文本从名称体例、适用范围、颁布主体、颁布年度等维度进行梳理,发现减负政策持续增多,但政策注意力分配有限、政策制定主体过于集中,影响了政策实施效果,因而后续政策应明确各主体的政策权责边界,弱化当前以升学和学历选拔为核心的人才竞争机制,引入教师奖励与能力建设工具减轻教师负担,保障师生身心健康。
这些政策文本计量分析视图化、结构化考察政策文本各要素分布特征,明晰政策文本研究热点及政策主题间的内在关联,把握政策文本的基本特点与现存问题,不断优化政策、提升政策效力,特别是在推导政策体系在现实世界难以直接观察到的发展趋势方面有一定的优势。当然,与上述政策文本内容分析方法相似,政策文本计量分析也未将分析的关注点转至语言逻辑和文本上下文信息。
(三)自动分析:政策文本内容挖掘方法
文本内容挖掘方法遵循了实证主义范式对语言进行逻辑分析的要求,关注语言用法、语言产生的经验场景和使用背景。它集成了自然语言处理中的文本表示模型以及计算机的多项技术,能够归纳文本的语法和语义类信息,在分析中根据上下文信息获取文本词语之间的关联度。文本挖掘和自然语言处理技术为分析数字政府计划和政策科学研究领域的政策文本提供了新的工具。作为对大规模文本集进行阅读和系统分析的自动化分析方法,文本内容挖掘可以借助一系列计算机手段对文本内的一些主题词进行结构化的分析,虽然在主题词选取部分也延续了传统内容分析依赖研究者对文本内容进行部分诠释的做法,但弥补了传统内容分析无法考察词语在文本环境中存在的语义结构关系这一缺憾。
文本内容挖掘方法的基本步骤主要包括选取文本、使用软件对文本进行预处理、选择一种算法、对方法的性能进行评估并验证,以及以实际操作分析文本特征。文本处理中传统的主题模型假设词语的序列是可以交换的,属于“词袋”模型,能基于词语反映文本语义,实现计量分析和传统内容分析未能完成的较深层次的影响力、效应、态度等方面的探索,但忽视了词法和词序,容易模糊文本上下文的关系。针对这一局限,基于文本上下文信息的模型不断被发展出来,主要包括HTMM-LDA,HTMM,MEMMS等。对文本数据进行处理后,要根据研究目标、研究问题选择合适的算法分析文本。例如,想要知道当地新闻报道的态度是正向还是负向,就要推断每篇报道的类别,了解不同类别文本的总体分布情况。仅靠人工阅读文本并做出推断既耗费时间又耗费资源,而文本内容挖掘这种自动分析方法可以通过词典法和监督学习方法降低文本分类的成本。
因而,文本内容挖掘方法可以实现自动归纳大规模政策文本的特征、演变趋势和存在的问题。例如K-means聚类的应用能够按照不同的维度对政策文本数据进行主题分析,得出不同内容、性质和效力的政策在发展各阶段表现出的差异性和失配特征,并提炼出政策演化规律。LDA大数据模型可以对政策文本进行低维主题集合,发现大样本政策文本在主题强度、主题领域及主题结构方面的薄弱之处。相较于政策文本内容分析和政策文本计量分析,文本内容挖掘方法在政策领域中的应用能捕捉到政策文本所传达的潜在语义,特别是意识形态、政策倾向和态度。例如,通过主题模型LDA算法可以提取政策文本中的政府职能倾向信息,进行中央和地方政府职能的匹配性、对应性研究。政治科学已经将这种方法广泛应用于立法机构的发言、政党声明、各项条约等文本的分析中,实现语义解读、态度判断等研究目的。这种方法也可以通过机器学习实现社会预测,以及政策文本优劣势评价与一致性对比。例如,有研究采用文本内容挖掘方法对我国罕见病相关政策文本进行词频分析和语义关联性分析,识别罕见病政策关注的重点内容,并结合计算所得的PMC指数值、评价等级和PMC曲面图,对罕见病政策样本的评估等级进行由高到低的排序。在涉农政策的研究中,学者根据政策文本中词汇的向量表示构建出政策内容再生产指标,按照词语的上下文信息将词语分配到向量空间中,在得到所有词汇的词向量表示、保留词与词语义关系和词汇语境信息的基础上,结合其他算法,实现了对政策内容再生产程度的测量。
四、政策文本分析的方法融合趋向
由上述两部分可以看出,解释视域下的政策文本定性分析与实证主义下的政策文本量化研究各有优势和不足。解释视域下定性研究中的政策文本释义性分析通过文本观察、精读、逻辑推理进行文本意涵阐释,对文本中各要素的概念、联系及结构进行描述和推理性分析,以把握文本内容的复杂背景和思想,发掘作者的意图和文本的真正意义。例如以描述事实为目的的案例研究,根据文本内容阐释得出了一般结论,但是在解读过程中不可避免地存在研究者的主观思考和文本内容的局限性,这是因为一个事件、一个案例会有多种现象表征,政策文本释义性分析将目光聚焦在典型事例、现象等焦点上,不仅不易判断所选取文本数据的有效性,而且分析结果随机开放,得到的是可以对特定事件进行深入解释的情境化理论,缺乏可推广性和普遍性。话语分析使用语言学理论与工具实现对文本语言和语言环境的整体性分析,将静态的文本视作动态的对话、协商过程,依据字词句解读政策文本的含义,可以在研读中梳理出较为清晰的研究思路与文本主旨,更为有效地探索文本内容之间的联系,但话语分析所属的语义学和语言学研究领域较具独特性,使得话语分析的延伸应用受到一定的限制。政策文本比较分析聚焦于案例特性,从不同维度明确细致地进行政策文本之间的对比,一方面能够协助研究者了解政策文本之间的共性,另一方面也能总结某一政策文本的不同之处,为相关政策的调整、改进提供启发,实现政策之间的互动与优化。但是,在进行政策文本比较时缺少固定的比较模式和标准,多是依据研究者想要达成的研究目标选取相应的文本要素进行分析,所选取的要素是否核心要素无法判断,特别是在政策文本内容抽象复杂、政策类型和规模不断扩展的情况下,比较分析的科学性和客观性会面临挑战。
政策文本量化研究能将抽象的概念转化为可操作的要素,在内容分析中依据理论构建分析框架,通过特定框架将复杂的文本数据分解为可操作的分析单元,再对政策文本编码的结果进行分析,能够识别政策文本明显的内容特征。虽然政策文本内容分析使用计算机能有效提升编码效率,但概念抽取、变量制定和对内容的分类仍依靠研究者和分析者的主观判定,缺少统一标准,另外内容分析能归纳的是文本中可识别的内容特征,对潜在语义难以展开推导。而且,计算机辅助的内容分析所进行的编码是否合理,分析框架的设计是否全面、具体,都会影响研究者对政策文本的客观理解以及政策分析结果的真实性。政策文本计量分析融合文献计量学、统计学等学科特色,从数据量化、统计分析等数理角度得出文本的结构化特征,可以实现政策主体的合作模式、政策体系的解构与演进等政策文本宏观层面的分析,但它关注高频词语,可能会忽视一些对研究有特殊意义但出现频次不多的词语,使政策文本分析的全面性受到质疑。文本内容挖掘方法在短时间内以几乎完全自动化的分析技术和文本表示模型快速处理大量政策文本,与计算机技术、算法的联系更为紧密,能够获得政策文本传达出的潜在语义,可以减少政策文本分析应用的资源消耗,在大数据时代具有较强的可推广性和适用性。但是,计算机辅助政策文本分析并不是取代人工,而是增强人类研究的能力,如何平衡人工参与和机器分析之间的关系,是研究者需要进一步深思的伦理问题。
20世纪70年代,随着符号互动论、现象学等理论的兴起,实证主义研究范式面临危机,产生了定量研究与定性研究的范式之争。后实证主义代表人物杰弗里· C.亚历山大将经验环境与形而上学环境联结起来,指出过度强调经验观察的实证主义与忽视经验观察的非实证主义对科学发展的阻碍,他开始从新功能主义的视角改造传统实证主义,构建科学连续体,协调经验研究与理论建构的双向互动。这个连续体从理论上把经验与形而上学、实践与理论统一起来,一定程度上既克服了形而上学的思辨性, 又克服了经验主义、自然主义的片面,形成了一个较为成熟的、辩证的实证主义方法论,缓和了经验与形而上学的争论,即“全部科学发展是一个双轮的过程,既为经验的论证亦为理论的论证所推动”。20世纪70—80年代,伴随定性与定量研究是否可以结合的讨论,后实证主义者认识到将两种范式结合或许能开创社会科学研究的新局面,由此,后实证主义研究方法逐渐呈现出定量研究与定性研究相结合的特征,在一定程度上推动了混合方法的出现。从概念上来说,混合方法研究是在单个研究或调查程序中,研究人员收集和分析数据并整合研究结果、得出结论时,同时使用定性和定量的路径或方法。作为社会科学领域长期以来两大范式之争的结果,混合方法研究已被众多学者看作是定量研究与定性研究的优势整合。20世纪80年代以后,混合研究进入程序发展阶段,研究者关注数据收集方法、分析方法、研究设计和进行混合方法研究的目的。20世纪90年代初,混合方法由先前收集多种形式的数据以抵消每种数据形式的缺点的思想转向对定量和定性数据的系统整合,并出现了通过不同类型的研究设计来组合数据的想法。21世纪初,众多学者提倡将混合方法研究视作一种独立的方法论、方法或具体研究路径,混合方法逐渐成为更为系统化的研究范式。
从方法论来看,定量定性相结合的研究方法受到上述后实证主义对早期实证主义观点批判的影响,但也未能逃离实用主义、辩证主义和复杂性范式的争论背景。实用主义支持者从问题导向出发,对定性、定量以及实用主义方法做出解释,试图为社会科学寻求一种综合性的方法。辩证主义方法论主张尊重范式之间的差异性,将定性与定量研究有机结合起来,使混合方法研究在数据理解和方法使用的过程中更具科学性和客观性。复杂性范式研究思维的多元复杂特征指导了混合方法研究的方法融合趋向。但相对来说,混合研究的方法论体系发展还不够成熟,在实际运用中容易产生范式之间的冲突,还需要深入探索。
在混合方法研究范式争辩的启示下,政策文本混合分析需要依据混合方法研究的自然科学与人文社会科学的融合、研究活动与实践情境交互、多维联系的复杂性思维等思想,结合后实证主义秉持的经验研究和理论建构互动、定量和定性研究方法共用的原则,进行政策文本混合分析方法的实践应用。例如,在分析社会创新相关政策文本时,有研究采用多案例研究方法,从时域分布、主体、领域等角度对案例文本作计量分析,呈现文本的结构化特征;在动因的叙述部分进行了反复阐释性解读,简洁提炼动因,得出关键词,进行理论阐述。在国家教育法规政策文本研究中,有研究使用量化工具对法规条款进行编码和统计分析,进而结合文本所处的历史脉络和政策实践进行文本阐释,发现政策文本包含多种价值要素,对政策问题的处理展示出权力主体在复杂政策过程中所做的价值选择。这样,一方面能够发挥计算机技术的智能化分析特长,提升政策文本分析研究的信度和效度,视图化呈现文本特征与结构;另一方面,可以对现象、案例进行深入剖析和阐释,实现方法的优势融合。
中国社会正经历现代化转型,社会条件与现实问题日益复杂多元,政策科学如何在巨大且复杂的社会系统内展开研究并提出可行方案亦面临挑战。社会系统的复杂性是内在的、固有的,又是不断更新的,需要我们基于新的研究视角,使用新的方法论工具,把其潜在的、隐藏的复杂性明晰地体现出来,这样才能从根本上摆脱传统社会科学研究受到的科学性质疑和发展困境。本文对六种政策文本分析方法及其方法论的阐释可以为全面理解和深入剖析各类政策的制定和发展过程提供科学思路,同时因应社会系统的复杂性探索政策文本分析的方法融合,兼具理论价值和实践意义。当然,政策文本分析的方法融合趋向并不意味着混合研究是最佳或普遍适用的方法。文本语言的复杂性意味着所有方法都无法完全准确地描述文本数据的生成过程,研究者要根据文本类型、研究问题、研究目标等选择相应的方法,以得出有效的结论。
(作者简介:杨慧,南开大学社会学院教授)
网络编辑:同心
来源:《社会科学》2023年第12期