TUSHUGUANXUEKANNO.1,20202020年第1期
·研究综述·基于知识图谱的国内数字人文研究现状分析陈
琳
(济宁学院图书馆,山东曲阜273155)
∗
[摘要]以中国知网学术资源总库为数据来源,以2005—2018年主题为数字人文或人文计
算的文献为基础,通过对数字人文研究的关键词、发文情况、高产作者、研究机构及出版期刊等数据进行可视化分析,总结并得出国内数字人文研究的热点主题、发展趋势以及面临的问题。
[关键词]数字人文[分类号]G250
数字人文最早起源于人文计算一词。在深度数字化的时代,人文计算已经不能客观地反映其内涵,逐渐被数字人文所取代,成为其更恰当的表述[1]。作为数字技术与人文学科交叉的学术领域,近年来数字人文成为国内外热点研究方向之一,其研究开始于欧美,它的发展推动了人文研究的变革与创新,同时也受到了图书馆界的密切关注。在国内,也取得了突破性的进展,北京大学、南京大学等相继举行了数字人文专题研讨会与学术交流活动,北京大学从2016年开始连续三年相继举办数字人文论坛,分别探讨数字人文概念、实数字人文与史学研究的互动与共生关践与反思[2]、
2017年7月,系[3]及需求驱动下的数字人文项目;
南京大学举办“数字人文:大数据时代学术前沿与探索”学术研讨会[4]。
版期刊等数据,对国内数字人文研究的整体状况、研究热点及前沿趋势进行可视化分析。CiteSpace本是美国德雷赛尔大学陈超美[6]教授开发设计的,研究采用的版本是5.3.R8.12.30.2018。
知识图谱
CiteSpace
图书馆
2基本数据统计分析
通过绘制文献发表的年度分布趋势曲线图可
2.1发文量年度分析
以直观地展示该学科研究领域所处阶段、研究发展速度及研究水平[7]。从所选文献数据中抽取数字人文研究文献的年度数据,对2005年至2018年所发表的文献数量进行年度可视化分析,如图1所示,国内学者真正关注这个领域则是在2005年之后,特别是在2009年,王晓光发表论文《“数字人文”的产生、发展与前沿》,首次对数字人文的概念、内容、发展历史、研究现状和前沿方向进行了2015年是国内数字人文研究的探索时综合介绍[8],
期,这一时期,国内学者的研究主要集中在国外数字人文应用的项目运作、前沿实践、技术研究及在图书馆中的服务创新方面;2016年开始,我国数字人文研究开始进入繁荣时期,以北京大学、清华大学、南京大学等高校为首,围绕数字人文的前沿问题与应用项目,多次举办数字人文研讨会,将数字人文技术与史学、文学、地理学及艺术学等密切关联,推进数字人文项目在国内的实践与创新。
1数据来源与研究方法
笔者以中国知网学术资源总库学术期刊为数
据来源,检索式为“主题=(数字人文)or(人文计算)”,研究的时间范围限定为2005—2018年,检索结果为343条,利用中国知网的“导出/参考文献”功能导出所选文献,剔除不相关结果29条,得到有效文献314篇。
本研究选择CiteSpace软件[5]和中国引文数据库作为分析工具,采用词频分析与引文分析的方法,从所选文献中提取关键词、作者、研究机构、出
CZ1710042)的研究成果之一。*本文系2017年度山东省“传统文化与经济社会发展”专项课题“数字人文对传统文化传承的应用研究”(项目编号:Copyright©博看网 www.bookan.com.cn. All Rights Reserved.图书馆学刊
TUSHUGUANXUEKANNO.1,20202020年第1期
·研究综述·2.3高产研究机构图谱分析
图3是由中国知网可视化工具绘制的高产研
究机构发文情况图谱,发文量≥9的研究机构有五家,主要是高校,且以南方院校居多,公共馆匮乏,只有上海图书馆一家。自2016年开始,以上海图书馆为代表的图书馆界也不断在数字人文的应用中取得实践性进展,上海图书馆家谱知识服务平台基于关联数据技术,重新组织和利用已有的馆藏资源和研究成果,实现针对普通大众的常识普
图12.2
2005—2018年发文量年度趋势
及和智慧寻根服务,针对人文研究学者的知识发“从武康路现和知识挖掘服务[15]。上海记忆项目之
出发”利用数据技术,从上海图书馆藏资料中挖掘事实、数据和知识,重现城市在不同时间、空间、视角上的历史风貌,将不可移动的物质文化遗产与文化记忆资源深度融合,展现城市文化遗产的独特魅力,同时体现现代图书馆兼具公共性和人文关怀的重要价值[16]。
文献作者的发文情况反映了该领域研究的力
高产作者图谱分析
量分布与活跃程度。图2是通过中国知网可视化工具绘制的高产作者发文趋势图谱,作者位次不进行区分计算,图中发文量≥3的作者有29名,以第一作者且发表于核心期刊的作者发文量≥4的为鄂丽君、曾子明、夏翠娟,文章发表时间主要集中在2016年至2018年之间,这些国内学者的研究侧重于国外案例调研与国内实践项目研究。鄂丽君以英美高校图书馆为主要调查对象,研究其数字学术支持现状,特别是研究图书馆协会ARL成员为国内大学图书馆开展数字馆的数字学术支持[9],
曾子明从数字人文视学术支持提供参考和借鉴[10];
觉资源研究、移动视觉搜索等主题为切入点展开夏翠娟则是在数字人文项目的建设与实研究[11][12];
践中不断探索,如以上海图书馆的开放数据应用开发竞赛为例,提出面向数字人文的图书馆开放关联数据在上海图书馆家谱数字数据服务框架[13];人文服务中的应用等。
[14]
图3高产研究机构发文图谱
2.4高产出期刊图谱分析
期刊登载某一学科文献的数量反映了期刊对
这一学科领域关注的程度,这项数据可以为关注这一学科领域文献的读者选择阅读期刊提供参考[17]。图4是发文量前10名的期刊及发文数量,历史发文量最高的是《图书馆论坛》,共计发文30篇。由图可以看出,前10名高产出期刊中,除了《山会科学》,全部是图情学科刊物,图书馆是数字人文项目的孵化器,进一步整合人文学者和国内学者对此深信不数字技术工程师的需求[18],
疑,并在数字人文的研究与实践中不断探索。
图2
高产作者发文图谱
90Copyright©博看网 www.bookan.com.cn. All Rights Reserved.图书馆学刊
TUSHUGUANXUEKANNO.1,20202020年第1期
·研究综述·键词有18个,如表1所示。
表1
关键词
数字人文图书馆高校图书馆数字学术人文计算大数据人文学科图书馆服务
美国数字图书馆数字化可视化关联数据人文科学移动视觉搜索
GIS
数字学术中心人才培养共词分析知识图谱
热点关键词频次排序
词频213424015151188776655555444年份20112014201520172015201620162016201720172017201720182016201720172017201820172017图4高产出期刊分布情况
3
3.1
研究热点分析
高频关键词是论文中出现频率较高的关键热点关键词图谱分析
词,利用CiteSpace软件对文献中的关键词进行词频统计、聚类分析,选出高频关键词并进行分析,CiteSpace软件中,设置结点类型“NodeTypes”为可以获得该领域研究热点及其发展趋势[19]。在
“Keywords”,“SelectionCriteria”选择TopN为50,得到热点关键词的知识图谱,如图5所示。
3.2研究热点主题分析
通过对关键词词频的统计分析,可以得出数
字人文研究领域的热点主题分布,掌握研究主题的成熟度、知识结构、研究的规模等状况[20]。国内数字人文研究主要包括以下3个方面的研究热点主题。3.2.1
国外数字人文研究的调研与借鉴
数字人文的概念起源于欧美国家,国内学者
自2010年开始不断调研国外数字人文研究状况,将国外先进的理念与经验引入中国,特别是以美国为关键词的数字人文调研性文章有11篇。如朱华顺以布朗大学、纽约公共图书馆为例,对美国图
图5
热点关键词知识图谱
邓要然书馆数字人文项目进行研究并给出启示[21];等对美国高校数字人文中心进行调研,探究其运并对图书馆领域数字人文项目进行归营机制[22],
鄂丽君通类,分析其应用热点、运行和管理特征[23];过分析ARL《SPECKit350:支持数字技术》调查报告,深入了解北美高校图书馆的数字人文支持现给我国高校图书馆以启示。目前,国内只有状[24],
武汉大学、北京大学、南京大学三所高校建有数字人文研究中心,这也促使学者们要不断提高对于
该图包含82个结点,199条连线,图中十字型图形代表以高频次关键词为结点的知识聚类图,字体和图形大小体现了该关键词的相对热度。从图5中可以看出,国内数字人文研究主要围绕“数字人文”“图书馆”“高校图书馆”“数字学术”“人文计算”等关键词。样本文献出现了82个词频≥2的关键词,其中词频为5次以上(包括5次)的关
91Copyright©博看网 www.bookan.com.cn. All Rights Reserved.图书馆学刊
TUSHUGUANXUEKANNO.1,20202020年第1期
·研究综述·关联数据、移动视觉搜索、文本分析等关键词研究热点,如曾子明、秦思琪结合数字人文视觉资源研究现状和移动视觉搜索技术研究前沿,构建了面向数字人文的MVS体系架构,为用户提供高效的面向数字人文的MVS服务,拓宽了数字人文视觉数字资源的研究思路[34]。数字学术包括科研数据、学术中心、研究型图书馆等热点关键词,国内学者对这一聚类的研究主要集中在英美等国外图书馆、数字学术中心等应用实践的调研总结与分析上。人文学科聚类则是以人文研究、数字媒介等关键词为中心,针对数字人文在文学、史学等人文研究领域的应用方法、实践探索的研究与探讨。人才培养聚类包括数字素养、数字人文教育、学术图书馆等热点关键词,是近年来新兴的热点研究,我国在有关数字人文教育方面尚未形成系统的运行体系,徐孝娟等国内学者以英美高校为例,从课程方案、课程结构、课程层次和培养目标4个维度对数字人文课程设置进行透视,结合我国数字人文相关领域的教育现状,提出数字人文课程及人才培养建议[35]。
3.2.3数字人文在图书馆领域的研究
数字人文中心建设的关注度。李巧明、王晓光通过对欧美日及中国的17家数字人文研究中心从项目状况、人员组成与组织结构、教育职能和活动开展4个方面进行调研,提出数字人文研究中心的发展要坚持项目运作模式,创新组织建设,以教朱学芳对育为本,靠活动助力等建议[25]。赵生辉、国内外高校数字人文中心的建设状况、模式特征等进行比较分析,提出构建高校数字人文项目资助体系、评价与认证体系以及数字人文领域复合对我国数字人文中心的发型人才的培养等建议[26],
展具有借鉴意义。郭金龙、许鑫指出文本挖掘方法是数字人文研究的一个研究热点与趋势,并介绍了欧美发达国家文本挖掘应用于数字人文研究崔春、毕强通过对美国普瑞特信息的前沿实践[27];
与图书馆科学学院的关联爵士项目的项目内容、开发步骤、实现功能等梳理,认为关联数据技术的张宸等出现为数字人文的发展提供了新的机遇[28];对北美高校图书馆将大数据智能可视化技术应用到数字人文研究、服务数据挖掘、图书馆服务评估进行调查与特征分析,为国内高校数字人文应用3.2.2
研究提供案例借鉴[29]。
数字人文的应用实践研究
数字人文研究的论文分布非常广泛,涉及多
数字人文的应用实践范围非常广泛,从目前个学科,且呈现交叉跨学科的特点。分布较多的前20个学科分类如图6所示,排在首位的是图书情报档案学科,数字人文研究关键词排序中,图书馆也是高频关键词之一,由此可以看出,图书馆是数字人文研究的最重要的研究领域。无论环境怎样变迁,图书馆作为服务部门在信息获取、内容数字化与策展、数字保存以及内容发现与传播等领域都有着不可替代的关键功能[36]。国内学者也深刻认识到图书馆在数字人文研究中的重要作用,在对国外图书馆支持数字人文研究进展、数字人文素养培训等方面进行调研与借鉴的同时,结合国内图书馆自身资源、技术与服务优势,在史学方面深度挖掘史学文献与大规模史料,进行文本化及数据集建设,如国家图书馆的“华夏记忆”项目,北京大学的“中国基本古籍库”项目,浙江大学的“中国历代墓志数据库”等。在语言学领域,在一定规模文本和教学科研需要下进行文本深度挖掘和智能分析,如“全唐诗分析系统”“全宋诗分析系统”等。在人文艺术领域,利用GIS、数据可视化等
国外数字人文研究趋势来看,应用实践主要包括历史学方面的基于GIS的历史地理可视化,文学方面的文本挖掘与TEI标准,语言学方面的基于大型语料库的语料库语言学,舞蹈方面的视频捕捉、运动分析与虚拟现实再现,以及考古学方面的图像分析、色彩还原和数字重建等[30]。国内学者关于数字人文的应用实践研究主要集中在可视化、数字图书馆、数字学术、人文学科、人才培养几个主要聚类。可视化聚类包括GIS、文本挖掘、数字史学、古籍数字化等关键词研究热点,如胡悦融等介绍了文学类文本的“远距离可视化阅读”理论与实董政娥等在调查中外纺织史文献资源馆藏状践[31];
况基础上,提出从文本挖掘、GIS技术、文本可视化和语料库4个方面进行纺织史数字化开发和馆藏严承希、王军以宋代政治为例,借助符号分补给[32];
析方法对哈佛大学中国历代人物资料库进行实证探索与可视化分析,为研究宋代党争政治格局提供了一种新的思考方式[33]。数字图书馆聚类包括
92Copyright©博看网 www.bookan.com.cn. All Rights Reserved.图书馆学刊
TUSHUGUANXUEKANNO.1,20202020年第1期
·研究综述·同层面上对数字人文理念与项目进行推广宣传,促进学术沟通,提升数字人文学科的公众影响力。与此同时,图书馆参与数字人文项目的研究与实践也将面临一定的困境与挑战,如资源获取的版权问题、项目建设的标准统一问题、学科馆员能力参差不齐等,图书馆人应当保持冷静的头脑,对数字人文不要盲目跟从,要合理考虑数字人文项目需求与自身能力,发挥优势,寻求合作以弥补劣势,实现共同的目标。
进行历史档案、考古地理资讯及城市发展史等进行分析与展示,如“淡新档案诉讼关系图”“宋人与宋诗地理资讯系统”等。
参考文献:
图6
数字人文研究文章所属学科分布
[1]
图书馆论坛,2017(4):1-8.
周晨.国际数字人文研究特征与知识结构[J].朱本军,聂华.跨界与融合:全球视野下的数议综述[J].大学图书馆学报,2016(5):16-21.
[2][3][4][5]
4总结
数字人文是计算或数字技术与人文学科交叉
“数字人文论坛”会字人文——首届北京大学
朱本军,聂华.互动与共生:数字人文与史学述[J].大学图书馆学报,2017(4):18-22.“数字人文”[EB/OL].[2017-07-03].http://news.nju.edu.cn/show_article_1_46299.
Chen,C.(2017)Sciencemapping:Asystematic2017-0006.
南京大学新闻网-海内外专家学者南大热议
的学术活动领域,它的发展推动了人文研究的变革与创新,成为国内外热点研究方向之一,同时也受到图书馆界的密切关注。笔者以中国知网学术资源总库为数据来源,以2005—2018年主题为“数字人文”或“人文计算”的检索文献为基础,借助文研究文献进行统计分析与内容挖掘,确定国内CiteSpace软件绘制知识图谱,通过对国内数字人该领域的代表作者、高产研究机构及出版期刊,总结并得出国内数字人文研究的热点主题。目前,数字人文在国内的研究虽然还处于起步阶段,关注度却很高,特别是高校图书馆界,研究范围不再GIS技术应用、文本挖掘、古籍可视化、移动视觉搜停滞在最初的国外数字人文研究的综述性探索,
“北京大学数字人文论坛”综研究——第二届
reviewoftheliterature.JournalofDataandInfor⁃mationScience,2(2),1-40.DOI:10.1515/jdis-Chen,C.andLeydesdorff,L.(2013)Patternsofysis.JournaloftheAssociationforInformation
[6]
connectionsandmovementsindual-mapover⁃lays:Anewmethodofpublicationportfolioanal⁃ScienceandTechnology,2013(2):334-351.
索等新的研究主题成为热点,被更多的国内学者所关注,并逐渐在国内数字人文项目中应用与实践。在数字人文背景下,图书馆是作为数字学术
[7][8][9]
李素梅.基于知识图谱的国内HumanLibrary105-111.
研究现状可视化分析[J].现代情报,2015(5):王晓光“数字人文”.的产生、发展与前沿.方
图书馆作为信研究与实践的拓展空间而存在的[36],
息与资源的集散地,首先,能够为数字人文研究者提供丰富的资源,也能够通过整合、标引等,为学者们揭示资源,提供服务支持;其次,为人文学者团队提供适宜的物理空间与虚拟化的共享空间,成为数字人文项目的孵化平台;再次,图书馆也将是数字人文的发展强有力的助推平台,能够从不
法创新与哲学社会科学发展[M].武汉:武汉大学出版社,2010.11.
鄂丽君.北美高校图书馆数字学术支持现状《SPECKit350:支持数字学及启示——ARL
术》调查报告分析[J].图书情报知识,2017
93Copyright©博看网 www.bookan.com.cn. All Rights Reserved.图书馆学刊
TUSHUGUANXUEKANNO.1,20202020年第1期
·研究综述·术》调查报告分析[J].图书情报知识,2017(4):39-46.[25][26]
李巧明,王晓光.跨学科视角下数字人文研2013(3):26-31.100.
究中心的组织与运作[J].数字图书馆论坛,赵生辉,朱学芳.我国高校数字人文中心建
(4):39-46.[10][11][12][13]
鄂丽君.美国部分大学图书馆的数字学术支曾子明,周知,蒋琳.基于关联数据的数字人曾子明,秦思琪.面向数字人文的移动视觉74-80.
持考察与启示[J].图书情报工作,2017(10):
文视觉资源知识组织研究[J].情报资料工作,2018(6):6-12.
搜索模型研究[J].情报资料工作,2018(6):21-28.
张磊,夏翠娟.面向数字人文的图书馆开放应用开发竞赛为例[J].图书馆杂志,2018(3):33-38,48.
设初探[J].图书情报工作,2014(6):-69,
[27]郭金龙,许鑫.数字人文中的文本挖掘研究[J].
大学图书馆学报,2012(3):11-18.[28][29][30][31][32][33][34][35][36]
崔春,毕强.关联数据在数字人文领域中的应用剖析——以关联爵士项目为例[J].图书情报工作,2014(24):99-105.
张宸,等.大数据智能可视化在北美高校图69-73.
书馆的应用研究[J].图书馆建设,2017(8):
数据服务研究——以上海图书馆开放数据
[14][15][16][17][18][19][20][21]
夏翠娟,张磊.关联数据在家谱数字人文服务中的应用[J].图书馆杂志,2016(10):26-34.
中国家谱知识服务平台.[EB/OL].[2019-04-03].http://jiapu.library.sh.cn/#/about.wkl.library.sh.cn/.
从武康路出发.[EB/OL].[2019-04-03].http://朱红艳,等.2004年——2014年国外智慧图
范佳“数字人文”.内涵与古籍数字化的深度开发[J].图书馆学研究,2013(3):29-32.胡悦融,等.数字人文背景下“远距离可视化阅读”探析[J].图书馆论坛,2017(2):1-9.董政娥,陈惠兰,詹司佳.数字人文背景下纺
织史文献资源现状调查研究[J].图书馆杂志,2015(11):62-69.
严承希,王军.数字人文视角:基于符号分析馆学报,2018(5):87-103.
书馆研究热点图谱构建与分析[J].农业图书情报学刊,2016(2):67-73.
向[J].大学图书馆学报,2017(4):23-29.朱本军,聂华.数字人文:图书馆实践的新方陈琳.基于知识图谱的国内智慧图书馆研究115.
魏瑞斌.社会网络分析在关键词网络分析中的实证研究[J].情报杂志,2009(9):46-49.朱华顺.美国图书馆数字人文案例研究及启纽约公共图书馆为例[J].示——以布朗大学、
国家图书馆学刊,2016(6):58-63.
法的宋代政治网络可视化研究[J].中国图书曾子明,秦思琪.面向数字人文的移动视觉21-28.
徐孝娟,等.国外数字人文课程透视——兼
现状分析[J].济宁学院学报,2017(5):108-搜索模型研究[J].情报资料工作,2018(6):
议我国数字人文课程设置及人才培养[J].图书馆论坛,2018(7):1-11.书馆,2016(12):17-22,48.陈
琳
朱娜.数字人文的兴起及图书馆的角色[J].图
[22]邓要然,李少贞.美国高校数字人文中心调查[J].
图书馆论坛,2017(3):26-34.
[23]邓要然.美国图书馆领域数字人文项目研究[J].
图书馆工作与研究,2017(8):29-35.[24]
鄂丽君.北美高校图书馆数字学术支持现状《SPECKit350:支持数字学及启示——ARL
女,1978年生。硕士,副研究馆员。
研究方向:信息技术与知识服务。
(收稿日期:2019-08-08;责编:谷毓。)
94Copyright©博看网 www.bookan.com.cn. All Rights Reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容