江苏科技信息
    主页 > 期刊导读 >

科技信息分析从单一维度到多维复合的演进<sup

科学技术信息一直是情报学关注的重要内容。在人类科技进步的发展史上,科技情报分析与服务扮演着至关重要的角色。改革开放以来,我国政府高度重视科学技术的创新与发展,近年来的《政府工作报告》多次提到科技创新在国民经济建设中的重要地位。中共中央、国务院印发的《国家创新驱动发展战略纲要》明确提出了我国科技创新的战略要求、战略部署、战略任务、战略保障等。科技创新不但是一线科研工作者的时代使命,也为科技信息分析与服务工作提出了新的要求。以往的科技信息分析多以引文、关键词、专利技术中某单一数据类型为对象展开研究,研究视角与方法也多为单一维度的信息分析。虽然取得了丰富的成果,但限于数据的片面性,以及分析视角与方法的单一性,研究工作难免存在局限。作为科技创新的保障,科技信息分析与服务的能力亟需提升。大数据时代科技情报工作,需要以多维度的视角从数据和方法上实现创新。

本文采用数据科学的思维,对科技信息分析中研究数据与研究方法的变迁进行梳理与分析。重点剖析科技信息分析中,从单一维度向多维复合的转变模式与特征。在梳理与总结科技信息分析演进脉络的同时,揭示其背后的动力机制,从数据科学范式的视角,为科技信息分析领域的相关研究提供借鉴,探索科技信息分析研究领域新的学科增长点。

1 单一维度的科技信息分析

科技信息研究是情报学领域亘古不变的核心主题。图书情报学界科技信息研究的经典方法是以科技文献计量方法为主。其中主流的科技信息研究主要包括基于科学论文引用关系的科技信息研究、基于文献核心词的科技信息研究、基于研究者和机构的科技信息研究、基于专利技术的科技信息研究等。

1.1 基于引文关系的科技信息分析

20世纪中期,Garfield[1]和Price[2]分别在Science杂志上撰文,从科学论文引用关系的视角探索科学知识发展脉络与模式,是基于引文关系研究科学知识信息的典型代表。科学引文能够反映人类科学知识的传承与创新,在呈现知识发展脉络方面具有优势,此外还被用于科研评价等领域。学术界基于引文关系的科技信息分析主要包括3个方面:①科学知识的时间演化性,研究目的在于发现科学前沿知识随时间演化的规律[3];②科学知识传承的连通性,聚焦于发现知识传播与知识传承中的知识关联关系[4];③学科领域的知识群聚性,探索不同或相同学科(或主题)领域的知识引用中存在的群聚性特征[5]。

由于科学引文天然存在时间序列关系,因此基于引文关系的科技信息分析工作都在本质上含有不同程度的时间序列分析。此外,Price[2]在1965年的研究中已经将网络思维引入科学引文分析,尽管这一时期的网络分析方法还相对单一,其思维模式却被后人纷纷学习效仿。此类研究工作的关键问题在于数据维度的单一性。尽管时间序列分析、网络分析等方法随着不断优化完善至今仍然受到研究者的青睐,但是单一维度的引文数据,无论是在试图总览领域知识全貌还是具体细节领域的特征识别上,都尚不足以给出全面的结论。

1.2 基于文献核心词的科技信息分析

传统基于文献核心词的科技信息研究主要通过高频词识别领域核心知识或研究热点。随着数据挖掘与网络科学等理论与技术的发展与引入,学术界基于文献核心词的科技信息研究涌现出丰富的成果。从研究数据的视角看,基于核心词的科技信息分析主要分为文献关键词、社会化标签、文档内容语料等类型数据。此类研究多以领域知识聚类或发展趋势研判为主,主要包括基于论文关键词或标签等采用共词网络和聚类分析识别与验证领域知识的主题广泛性和领域核心凝聚性[6],采用时间序列分析识别领域主题的演变趋势与影响[7],以及通过中心性与核心-边缘分析等方法追踪核心概念发展成为学科支柱的演变[8]。

上述基于文献核心词的科技信息分析中,涉及的分析方法主要包括复杂网络分析、向量空间分布、时间序列分析等。研究数据包括关键词、标签、文本中抽取的特征词等多种类型。虽然涉及多种数据类型,但是性质上仍属于同一维度的数据,而且每个具体的研究工作多限于一种数据类型。基于不同类型的数据的研究结果也未能实现交叉验证。

1.3 基于研究者和机构的科技信息分析

在科学技术的研发与创新过程中,科研人员和研发团队以及研究机构起到至关重要的作用。因此,对于研究人员和团队机构的相关研究是科技信息分析一环。目前,学术界在基于研究者和机构的科技信息研究中已经取得了较丰硕的成果。学术界的这部分研究主要分为静态研究和动态研究两个层面。其中静态研究主要包括合作网络结构特征及合作模式特征[9]、核心学者与合作强度识别[10]、隐性合作关系探测[11]等。动态研究主要集中在合作关系演化与领域核心作者演变方面[12],其中包括科研合作关系的稳定性测量以及科研人员之间的知识流动等。