当前位置:网站首页>【科学文献计量】外文文献及中文文献关键词的挖掘与可视化
【科学文献计量】外文文献及中文文献关键词的挖掘与可视化
2022-06-30 13:06:00 【百木从森】
1 关键词的挖掘与可视化
1.1 外文文献关键词词频统计与可视化
在前一章节介绍知识单元完整频次统计中已经对关键词ID和DE字段进行词频统计。在回顾知识点的基础上,进一步进行可视化操作。可以新建一个ipynb文件,在导入功能库和文件后,利用multi_element_count()进行多元素字段的词频统计。
可将上述的频数统计结果,借用词云图可视化结果输出。首先需要将多元素字段频数统计的结果进行处理,形成绘制词云图的DataFrame数据格式,即第一列为标签字段中多元素的分类名称,第二列就为各类名称出现的频数统计。然后在将两列的数据合并,组成分类名称和频数一一对应的列表,即words变量(词云图的核心就是在于words变量的构造),如果有需求可以对图形的标题进行注解,比如这里将NAME赋值为ID,就是表明当前展示的词云图结果来自于ID字段。
ID字段的多元素词频统计结果词云可视化输出如下。元素的频数统计值越大,在词云图中的文字越大。通过滑动鼠标,放置在元素上,会自动显示对应的频数。
边栏推荐
- Basics of golang -- the difference between slicing and array
- On the simplification and acceleration of join operation
- Dart 扩展特性
- Yousi College: Six Sigma is not just statistics!
- 智慧运维:基于 BIM 技术的可视化管理系统
- PG Basics - logical structure management (table inheritance, partition table)
- get请求与post提交区别的简易理解
- Basic syntax of unity script (3) - accessing game object components
- Knowledge dissemination cannot replace professional learning!
- [Title brushing] heater
猜你喜欢

In line with the trend of media integration, Zhongke Wenge and Meishe jointly create digital intelligence media publicity

postman 自动生成 curl 代码片段

科普达人丨漫画图解什么是eRDMA?

Google Earth Engine(GEE)——将字符串的转化为数字并且应用于时间搜索( ee.Date.fromYMD)

正则系列之断言Assertions

逆向调试入门-PE中的VA与RVA换算04/07

Matlab tips (22) matrix analysis -- stepwise regression

rxjs Observable 两大类操作符简介

JMeter learning notes

Postman génère automatiquement des fragments de code Curl
随机推荐
Wechat applet reports an error: typeerror: cannot read property 'SetData' of undefined
Development of unity script program
商品服务-平台属性
Apache Doris Compaction优化百科全书
(8)JMeter元件详解之 Once only Controller 仅一次控制器
Unity 频繁切换分支 结果模型出现莫名其妙的错误
PG Basics - logical structure management (table inheritance, partition table)
Knowledge dissemination cannot replace professional learning!
单元测试效率优化:为什么要对程序进行测试?测试有什么好处?
正则系列之断言Assertions
Derivation of Park transformation formula for motor control
With the development of industrial Internet, the landing and application of the Internet has become wider
The independent station is Web3.0. The national "14th five year plan" requires enterprises to build digital websites!
可觀測,才可靠:雲上自動化運維CloudOps系列沙龍 第一彈
WTM major updates, multi tenancy and single sign on
There is no utf8 option for creating tables in Navicat database.
Open source of xinzhibao applet
科普达人丨漫画图解什么是eRDMA?
可观测,才可靠:云上自动化运维CloudOps系列沙龙 第一弹
【系统分析师之路】第五章 复盘软件工程(敏捷开发)