CiteSpace:文献分析软件介绍

发布时间:2023-02-19 阅读 2134

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:唐雪梅 (南京审计大学)
邮箱tangxuemei2018@163.com


目录


1. 软件介绍

CiteSpace 软件是 Citation Space 的简称,译为“引文空间”,是由美国德雷赛尔大学计算机与情报学教授陈超美博士基于 Java 语言开发、基于引文分析理论的信息可视化软件。

该软件可呈现科学知识的结构、规律和分布情况,分析出来的图形称为“科学知识图谱”,主要用于综述类论文写作,理论观点、演化路径、发展趋势、学术史等梳理,学术研究领域热点扫描等方面,是一款定量分析的实用型文献分析软件。

2. 软件安装

2.1 软件下载

浏览器检索 CiteSpace,点击进入官网。

进入官网后,点击官网可视化分析结果呈现图片,进入具体下载页面。

进入下载详细页面后,点击选项栏中的 Files 项,可查看到 CiteSpace 近期的全部版本,选择合适的版本下载。

下载后解压缩文件,根据提示安装软件即可。

2.2 环境配置

CiteSpace 需要在 Java 环境下才可以运行,电脑需要安装 Java 环境。可通过电脑控制面板观察自己电脑是否安装 Java。

软件安装完成且 Java 环境配置成功,运行下载安装的 CiteSpace 软件,点击 Agree 进入操作界面,则软件安装成功。

3. CiteSpace 界面

CiteSpace 的界面分为两类:(1) 功能和参数设置界面;(2) 分析结果可视化界面。

3.1 功能和参数设置界面

CiteSpace 的功能和参数设置界面界面主要分为菜单栏、各功能区和处理过程、处理报告区。

其中,菜单栏包括:

  • File (文件):主要是对当前的功能界面参数进行保存和软件的退出。
  • Projects (项目):主要新建、编辑和删除分析的工程项目。
  • Data (数据):主要是数据过滤和转换。
  • NetWork (网络):主要是对网络文件的可视化以及保存为网络文件。
  • Visualization (可视化):主要是读取 CiteSpace 分析得到的可视化文件。
  • Geographical (地理化):主要对数据地理信息的可视化
  • Overlay Maps:主要用来实现期刊的双图叠加分析。
  • Analytics:主包括 COA 作者的合著分析,作者的共被引分析、文献的共被引分析、期刊的共被引分析等。
  • preferences:主对常规默认项的修改,比如 defer the calculation of centrality 推迟中介中心性的计算。

功能区分为项目区、执行操作区、时间切片功能区、文本处理功能区、网络配置功能区和网络裁剪、可视化配置功能区。在进行简单的知识图谱分析时,只用调整时间选择区以及网络配置功能区,其他选项保持默认。

  • 项目区:新建项目、设置项目路径。
  • 执行操作区:运行、停止、重设项目。
  • 时间切片功能区:时间跨度和时间切片选择,时间跨度根据载数据的时间跨度和分析需要选择,时间切片根据时间跨度选择,一般为 1-2 年。在时间跨度大时选择两年,时间跨度小时为一年,默认为一年。
  • 文本处理功能区:特征词来源选择 (一般默认)。
  • 网络配置功能区:
    • Node Types:为实现文章分析的选项,勾选不同项实现不同的分析目的。值得注意的是,勾选越多,呈现的图形越复杂,不容易分析图形,Article 只能单独勾选。
    • Links:提供了四种网络节点的关联强度的计算方法,分别为 Cosine、PMI、Dice 和 Jaccard,一般不做改动,选择余弦相似度计算方法 (Cosine)。
    • Selection Criteria:为数据阈值的设定,用来设定在各个时间段内所提取对象的数量。TOP N 表示每个时间切片内对象的数量,排名靠前的 N个;TOP% 表示提取每个时间切片中排名前N%的对象;g-index 软件新增加的知识单元抽取方式。一般情况下,调整 Top N 或者 Top N% 来调整网络规模和大小布局网络。
  • 网络裁剪、可视化配置功能区:

    • 对于网络裁剪,CiteSpace 提供了两种算法,分别是寻径算法 (Pathfinder) 和最小生生成树算法 (Minimum Spanning Tree),一般初始生成网络的时候二者均不选,即为默认;生成网络后,根据可视化网络结果在判断是否进行裁剪。裁剪的目的是对网络中的连线进行裁剪,以降低网络的密度,提高网络的可读性,当网络比较密集的时候,可以通过保留重要的连线来使网络可读性提高。
    • 可视化配置功能区:Pruning sliced networks 对每个切片的网络进行裁剪;Pruning the merged network 对合并后的网络进行裁剪,通常选它。
  • 处理过程、处理报告区:

    • 处理过程:报告空间节点总数、实际节点、连线数量等。
    • 处理报告:处理的文献数量、处理时间、网络节点、网络连线数量等。

3.2 分析结果可视化界面

在 CiteSpace 的可视化界面,可以对可视化图形进行进一步调整。该界面包括菜单栏、快捷功能、节点信息列表、分析结果参数信息、可视化图形展示、图形属性调整等区域。

快捷功能从左至右分别是保存、形状调整、配色和背景、聚类功能区、节点属性调整以及聚类和时间线图。

节点信息列表列示了特征词的频次、中心性、特征词出现的时间以及特征词名称。

控制面板 (Control Panel) 可用于突发性检测、节点检索、聚类信息显示、标签设置 (关键词标签、共被引标签、连线、聚类标签调整等)、网络布局 (时间线图、时间趋图等)、可视化调节等。

4. 可视化分析实例

4.1 分析准备

数据下载:以知网文献分析为例。打开知网,在知网首页搜索框中搜索目标文献,可使用高级搜索选项,根据个人需要对目标文献加以限制。需要注意的是:

  • 选择学术期刊,不要选择学位论文、会议等,因为格式不一样,无法转换。
  • 如果文献较多,用篇名检索或者篇关摘检索比较准确。
  • 把学术期刊中的文献综述类论文、会议、征文、选题指南等筛除。筛选完成后,勾选目标文章,导出参考文献,文献格式选择 Refworks。

下载的文献命名为 "download_XXXX",CiteSpace 只能识别此命名格式下的数据文件。

数据转换:推荐提前建立一个文件夹专门存放数据资料,并在文件夹根目录下建立 data、input、output、project 四个以英文命名的文件夹,如下图。

CiteSpace 软件在开始需要对初始数据进行筛选,去除重复数据。以下为去重步骤:

  • 第一步:点击菜单栏 Data 选项,选择 Import/Export。
  • 第二步:Input Directory 选择原始数据文件夹。Output Directory 建立一个空的文件夹用于保存转换后的数据。Input 文件夹保存原始数据,Output 保存转换后的数据。点击 Format Conversion,完成转换后会显示 Finished。

建立分析项目:复制除重转换后的数据文件到 Data 文件,此时, Project 文件夹仍然为空 (主要用于保存分析后的结果)。使用 CiteSpace 进行分析,点击 Project 项中 New 选项,建立一个待分析的项目。

点击后出现以下选项卡:

工程名称为:分析内容名称,例如 green_innovation。Project 和 Data 分别对应到相应的文件夹,Language 选择 Chinese。

4.2 可视化分析

关键词共现分析:第一步选择网络配置功能区中的 Keyword,然后根据自己数据情况和研究需求对其他几个选项卡内选项进行调整。各项参数设置好后点击绿色 GO 选项开始可视化图像生成。

数据处理结束后,出现如下选项卡,点击 visualize,观察知识图谱。最终得到知识图谱如下:

可通过控制面板对图形中的字体字号进行进一步调整,使图形的呈现更加美观,简洁。其他类似于,作者分析,机构分析,共引分析,互引分析,跨时区分析可根据勾选网络配置功能区中的不同选项来实现。步骤同以上关键词分析。

研究前沿的获取:在 Control Panel 中,点击 Burstness,点击 Refresh,就可以生成我们所需要的关键词图片图。

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 文献, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,400+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh