问题1:我们是谁?
我们是一群曾经深受科研方法困扰的博士和青椒。欢迎关注公众号【学术点滴】和公众号【文献计量】,里面有我们开发的科研软件。
问题2:我们在干什么?
为了让科研小白快速或不懂方法的人进入科研领域,学会各种复杂模型方法,我们开发很多简单易用的科研软件,帮助正在受科研方法困扰的学生和老师上岸。
问题3:我们教授了什么内容?
目前学术圈主流的一些研究方法广受关注,如文献计量、科学知识图谱、社会网络、质性分析、中英文文本挖掘、量化分析、情感分析、网络爬虫、综合评价、机器学习、
深度学习、文本分类预测、聚类分析、降维分析、学者影响力评价、科学演进、回归分析、关联规则、链路预测、异常检测、灰色关联、熵权法、层次分析、因子分析综合
评价、高端图谱绘制等方法,均是我们教授的内容。
问题4:我们开发了哪些软件?
学术点滴团队【微信公众号:学术点滴】开发的软件包括:
(1)TM文本挖掘软件
(2)DMKD数据挖掘软件
(3)机器学习算法应用软件
(4)SE科学演进软件
(5)AE学术影响力软件
(6)MC高端动态图谱软件
(7)万能侠
(8)MS数理统计软件
(9)DWCE数据加权与综合评价软件
(10)Timeline时间线:一款用于主题趋势和战略坐标绘制的软件
(11)COOC图谱与计量软件
(12)CN引文网络软件
(13)ST科学计量学软件
(14)Evoviewer科学主题演化软件
以上软件统一集合为金字塔DIKW软件。
问题5:这些软件能够干什么?
Text Minin 中文版一款用于中文文本挖掘的软件核心功能:
[1]多个文本自定义分词、频次统计、词云图绘制、主题聚类
[2]单个大文本自定义分词、频次统计、词云图绘制、主题聚类
[3]突破VOS软件只能做数据库数据的局限
[4]使用VOSviewer软件做任意网络文本的图谱
[5]基于TF-IDF算法的多文本关键词提取
[6]基于textrank算法的多文本关键词提取
[7]用户评论情感分析
[8]基于词袋模型的LDA主题挖掘
[9]基于TF-IDF模型的LDA主题挖掘
[10]神经网络语言模型
[11]关键词去重
[12]同义词一键合并
[13]无意义词一键删除
Text Mining 英文版一款用于英文文本挖掘的软件核心功能:
(1)多个文本自定义分词、频次统计、词云图绘制、主题聚类
(2)单个大文本自定义分词、频次统计、词云图绘制、主题聚类
(3)该软件同时可突破VOS软件只能做数据库数据的局限
(4)使用VOSviewer软件做任意网络文本的图谱
(5)基于TF-IDF算法的多文本关键词提取
(6)基于词袋模型的LDA主题挖掘
(7)基于TF-IDF模型的LDA主题挖掘
(8)神经网络语言模型
(9)关键词去重
(10)同义词一键合并
(11)无意义词一键删除
(12)英语词组提取
DMKD 一款用于数据挖掘与知识发现的软件核心功能:
数据量纲
(1)标准化
(2)中心化
(3)归一化
(4)均值化
(5)初值化
(6)最小值化
(7)最大值化
(8)求和归一化
(9)平方和归一化
(10)正向化
(11)逆向化
(12)区间化
距离度量
(13)欧式距离
(14)标准欧式距离
(15)平方欧式距离
(16)布雷柯蒂斯距离
(17)堪培拉距离
(18)切比雪夫距离
(19)曼哈顿距离
(20)汉明距离
(21)JS散度
相似度度量
(22)简单匹配相似系数
(23)余弦相似度
(24)皮尔森相关系数
(25)杰卡德相似系数
(26)谷本相似度
主成分分析
(27)主成分分析(二维)
(28)主成分分析(三维)
聚类分析
(29)k均值聚类(二维)
(30)k均值聚类(三维)
(31)k均值聚类(N维)
(32)通用网络图绘制
(33)系统聚类图
(34)双系统聚类图
(35)Louvain社区探测算法
(36)Girvan_Newman社区探测算法
(37)层次聚类网络图
(38)谱聚类算法网络图
(39)模块度计算
关联规则
(40)Aprior关联规则算法
(41)FP-growth关联规则算法
无向网络指标计算
(42)中间中心性
(43)接近中心性
(44)特征向量中心性
(45)聚集系数
(46)点度中心性
(47)网络节点数
(48)边数
(49)平均度
(50)网络密度
(51)平均聚类系数等网络指标
Science Evolution 一款用于科学演进路径绘制的软件核心功能
Science Evolution软件是一款用于学科领域动态追踪的软件,不仅能够一键综合提取中国知网、中文社会科学引文索引、Web of Science作者、机构、关键词、国家、期刊、摘要等信息,还能逐年统计各个字段每年变化数量,用于动态展示学科领域发展状态及未来发展趋势。
(1)关键词逐年统计与科学演进路径绘制
(2)作者逐年统计与科学演进路径绘制
(3)机构逐年统计与科学演进路径绘制
(4)期刊逐年统计与科学演进路径绘制
(5)国家逐年统计与科学演进路径绘制(WOS)
(6)学科逐年统计与科学演进路径绘制(WOS)
(7)关键词总量逐年统计
(8)作者总量逐年统计
(9)机构总量逐年统计
(10)期刊总量逐年统计
(11)国家总量逐年统计(WOS)
(12)学科总量逐年统计(WOS)
(13)关键词新增总量逐年统计
(14)作者新增总量逐年统计
(15)机构新增总量逐年统计
(16)期刊新增总量逐年统计
(17)国家新增总量逐年统计(WOS)
(18)学科新增总量逐年统计(WOS)
(19)合作度计算
(20)合作率计算
(21)共现度计算
(22)共现率计
Academic Influence Evaluation 一款用于学术影响力评价的软件核心功能
一位学者、一个机构、一本期刊的学术影响力如何评价?
在写文献计量和知识图谱方面软件时我们往往通过作者、机构的发文量进行测度,即统计哪些是高频作者、高频机构。
显然,通过发文量来定义学术影响力有失偏颇。但是,为什么大部分相关论
文中确使用该指标呢?
主要原因是频次统计最简单,利用诸如CiteSpace、Bibexcel、COOC等软件可以直接获取,而其他指标的获取就相对复杂了很多。
如,除了发文量,我们还可以使用被引频次来反映学术影响力,即某位作者的被引频次越高影响力越大。
但由于发文量越多被引的几率就越大,为此我们可能会想到用篇均被引频次来反映学术影响力。
这些传统指标似乎都不能满足复杂的学术评价需要。
因此,又有学者提出复合型的指标,即同时考虑发文量和被引频次之间的关系,较为出名的是h指数、g指数、p指数和z指数等。
面对如此众多的评价指标,如何计算、合理选择指标是困扰相关人员的一大难题。
基于此,【学术点滴】团队开发Academic Influence Evaluation软件,中文名:学术影响力评价软件。
该软件不仅能够一键计算上述指标,还可以对指标间的关系进行相关性分析和可视化展示,帮助使用者选取最合适的指标。
MLAA 一款应用机器学习算法的软件核心功能
【1】应用于中文文本分类、验证、预测与评估的算法:
(1)K近邻模型
(2)最近质心模型
(3)贝叶斯模型
(4)决策树模型
(5)随机森林模型
(6)极端随机树模型
(7)AdaBoost模型
(8)梯度提升分类模型
(9)逻辑分类模型
(10)岭分类模型
(11)支持向量机模型
(12)随即梯度下降模型
(13)被动攻击分类模型
(14)线性感知器模型
(15)神经网络模型
(16)Bagging模型
【2】应用于英文文本分类与预测的算法:
(1)K近邻模型
(2)最近质心模型
(3)贝叶斯模型
(4)决策树模型
(5)随机森林模型
(6)极端随机树模型
(7)AdaBoost模型
(8)梯度提升分类模型
(9)逻辑分类模型
(10)岭分类模型
(11)支持向量机模型
(12)随即梯度下降模型
(13)被动攻击分类模型
(14)线性感知器模型
(15)神经网络模型
(16)Bagging模型
【3】应用于数值型数据分类与预测的算法:
(1)K近邻模型
(2)最近质心模型
(3)贝叶斯模型
(4)决策树模型
(5)随机森林模型
(6)极端随机树模型
(7)AdaBoost模型
(8)梯度提升分类模型
(9)逻辑分类模型
(10)岭分类模型
(11)支持向量机模型
(12)随即梯度下降模型
(13)被动攻击分类模型
(14)线性感知器模型
(15)神经网络模型
(16)Bagging模型
(17)标签传播模型
(18)线性判别分析模型
(19)二次判别分析模型
【4】数据降维的算法:
(1)PCA降维
(2)增量PCA降维
(3)核PCA降维
(4)截断奇异值分解降维
(5)因子分析降维降维
(6)独立分量分析降维
(7)多维缩放MDS降维
(8)TSNE降维
【4】聚类分析的算法:
(1)K均值聚类、预测与评估
(2)MiniBatchKMeans聚类、预测与评估
(3)Birch聚类、预测与评估
(4)近邻传播聚类、预测与评估
(5)谱聚类、预测与评估
(6)层次聚类、预测与评估
Mathematical Statistics 一款用于数理统计的软件核心功能:
(1) 描述性统计
[1] 单列数据分布
[2] 整体数据分布
[3] 正态分布检验
[4] 散点图矩阵
(2) 统计可视化
[5] 柱形图
[6] 树形图
[7] 词云图
[8] 折线图
[9] 散点图
[10] 直方图
[11] 多条折线图
[12] 箱线图
[13] 饼形图
[14] 雷达图
[15] 玫瑰图
[16] 混淆矩阵图
[17] 共现图
(3)参数检验
[18] 单样本T检验
[19] 两独立样本T检验
[20] 配对样本T检验
[21] 单因素方差分析
[22] 两因素方差分析-无交互
[23] 两因素方差分析-有交互
[24] 卡方检验
[25] 方差齐次性检验
(4) 相关分析
[26] 皮尔逊相关
[27] 斯皮尔曼相关
[28] 肯德尔相关
(5) 回归分析
[29 ]虚拟变量设置
[30 ]多重共线性检验
[31] 一元线性回归
[32] 多元线性回归
[33] 二元逻辑回归
[34] 多元逻辑回归
DWCE 一款用于数据加权和综合评价的软件核心功能:
(1) 灰色关联加权
(2) 熵权法加权
(3)层次分析综合评价
(4)TOPSIS综合评价
(5)因子分析综合评价
COOC 一款用于文献计量和知识图谱绘制的软件核心功能:
1-综合提取中国知网CNKI、万方、维普、CSSCI、SinoMed、Web of Science、Pubmed、EI、Scopus、ScienceDirect数据库
2-中文(多)数据库去重清洗
3-Web of Science数据库去重清洗
4-多数据库综合去重清洗,包括中英文混合去重清洗
5-词去重
6-多数据库同义词批量合并,无效词批量删除
7-频次统计
8-发文年代分布
9-(作者、机构、关键词、期刊、国家等)柱形图、树形图、词云图、饼形图、玫瑰图、雷达图
10-逐年关键词、作者、机构、国家、期刊等频次变化可视化(逐年条形图、逐年树形图、逐年散点图、逐年雷达图、逐年玫瑰图、逐年词云图)
11-中英文共现矩阵(关键词、作者、机构、国家等)
12英文矩阵大小写转化(关键词、作者、机构、国家等)
13-相异矩阵
14余弦相似度矩阵
15相关矩阵
16-欧式矩阵、矩阵标准化
17-词篇矩阵:作者篇矩阵/机构篇矩阵/国家篇矩阵......
18-二模矩阵,适用于文献计量、知识图谱,同时适用于董事关系网络、贸易、物流、地理等学科二模网络
19-耦合矩阵:基于主题的耦合矩阵
20-字段组合
21-邻接表
22-共现矩阵转邻接表
23-二模矩阵转邻接表
24-邻接表转有向net
25-邻接表转无向net
26-混淆矩阵图(相关分析矩阵图)
27-共现图、合作网络图
28-社区聚类图
29-系统聚类图
30-双聚类图
31-累积主题演化路径图(时区图)
32-加权主题演化路径图
33-期刊查询
34-Web of Science、Pubmed数据库参考文献引用格式自动生成
35-确定核心作者
36-确定高频词
Scientometrics Tools 科学主题趋势和类型挖软件核心功能:
[1]聚类散点图
[2]累积子主题演化
[3]加权子主题演化
[4]主题聚类下所属文献
[5]子主题强度演化
[6]关键词战略坐标
[7]主题战略坐标
通过上述功能不仅能够了解宏观科学主题演化过程,还能发现微观科学演化过程,并且能够随着科学发展发现科学主题的强度变化和主题间强弱关系等。
Evoviewer 一款用于科学主题演化分析的软件
科学的发展具有一定的规律,那么,我们能否通过研究主题的演化对某一领域研究发展与演进过程进行刻画呢?显然是可以的!Evoviewer软件可以对科学主题演化路径进行绘制。另有一个特色是操作过程完全自定义,可根据需要划分时间,构建关系,选择演化权重等条件!!!
CiteNetwork 一款用于引文网路挖掘的软件核心功能:
**CSSCI数据库**
1 统计文献被引频次
2 作者被引频次
3 期刊被引频次
4 绘制文献共被引网络
5 绘制作者共被引网络
6 绘制期刊共被引网络
7 绘制文献直接引用网络
8 绘制重要文献直接引用网络
9 绘制作者直接引用网络
10绘制 期刊直接引用网络
11被引网络点度中心性
12被引网络中介中心性
13被引网络接近中心性
Web of Science数据库
1 统计文献被引频次
2 作者被引频次
3 期刊被引频次
4 绘制文献共被引网络
5 绘制作者共被引网络
6 绘制期刊共被引网络
7 绘制文献直接引用网络
8 绘制重要文献直接引用网络
9 绘制作者直接引用网络
10绘制 期刊直接引用网络
11被引网络点度中心性
12被引网络中介中心性
13被引网络接近中心性
重要的一点:上述操作过程的中间数据我们都可以获取,以白箱的方式直观进行操作,使用者也可以利用中间数据进行其他自定义分析、研究
Timeline时间线:一款用于主题趋势和战略坐标绘制的软件:
1-综合提取中国知网CNKI、万方、维普、CSSCI、SinoMed、Web of Science、Pubmed、EI、Scopus、ScienceDirect数据库
2-自定义综合去重清洗
3-同义词批量合并,无效词批量删除
4-共现矩阵构建
5-二模矩阵构建
6-矩阵气泡图
7-数据降维(PCA、增量PCA、核PCA、截断奇异值分解、因子分析、独立分量分析、多维缩放MDS、TSNE等降维算法)
8-聚类分析(Louvain、Girvan-Newman、K均值、MiniBatachKmeans、Birch、近邻传播算法、谱聚类、层次聚类+聚类网络图)
9-时间线气泡图
10-累积时间线图
11-加权时间线图
12-聚类-累积时间线图(节点圆圈大小可用频次、点度中心性、中间中心性、接近中心性或自定义权重表示,节点圆圈颜色可用Louvain、Girvan-Newman、K均值、MiniBatachKmeans、Birch、近邻传播算法、谱聚类、层次聚类或自定义聚类结果表示)
13-子主题-累积时间线图(节点圆圈大小可用频次、点度中心性、中间中心性、接近中心性或自定义权重表示)
14-聚类-加权时间线图(节点圆圈大小可用频次、点度中心性、中间中心性、接近中心性或自定义权重表示,节点圆圈颜色可用Louvain、Girvan-Newman、K均值、MiniBatachKmeans、Birch、近邻传播算法、谱聚类、层次聚类或自定义聚类结果表示)
15-子主题-加权时间线图(节点圆圈大小可用频次、点度中心性、中间中心性、接近中心性或自定义权重表示)
16-子主题聚类平均时间计算(用于判断主题新颖性)
17-文献所属聚类主题
18-子主题强度时间线绘制
19-战略坐标(向心度与密度计算)
20-二维坐标图绘制-真实值
21-二维坐标图绘制-虚拟值
22-二维散点分类颜色图绘制
23-二维散点分类形状图绘制
24-三维散点分类颜色图绘制