把这个给关闭,你不关闭的话他执行不了的,因为他最终的结果直接是在这个原一个三个表格中替换的,懂吗?原一个三个表格中替换的, 咱们随便举个例子,好吧?比如说咱们把私信, 比如说咱们把思想政治教育, 嗯?今晚吃什么呢?撕,这有没有同一次?咱们最好是找一个同一次,对吧? 行业加人工智能,人工智能 感觉还没有,没找到什么同义词呢,对吧? 这有设置一带一路,设置设置一带一路也不好,比如说咱们举个例子啊?举个例子我自己给你,给你添加两个同一次 一带一路, 一带一路, 然后这中间再加一个,好吧?一带一路,我想把 我要把两个爷两个做成一样的,对吧?你不可能一个是这个,一个是那个, ok, 我想把这个这种有带引号的一带一路全部替换成没有带引号的一带一路,好吧?可以吧?我们把这个复制过去,然后把它关掉,因为咱们执行的时候要把它关掉。 同意词是什么?待引号的一带一路,对吧? 先打开复制一下 带跑的一带一路, 哎,扭过了, 然后目标是什么?一带一路,他不带引号,把带引号的替换成不带引号的带引号的其中有两个,对吧?咱们做之前需要把这个给关掉, 然后点击合并, ok, 合并完成。咱们看一下带引号的一带一路有没有贴完成不带引号的一带一路, 一带一路,一带一路,一带一路是不是完全替换了吧?这说明咱们这个程序已经运行正确了,这就是关键词的替换与删除。用的是 gigo 这个软件。哪个在哪里获取呢?在微信公 银行学术典经理。回去,这就是咱们的这节课,是不是非常方便?很方便,对吧?下一节课咱们就利用咱们已经清洗过的数据怎么做贡献矩阵,也非常的简单。 ok, 咱们这节课就到这,咱们下节课再见。再见。
粉丝366获赞838

首先我们还是先打开这个塞的 space。 好的,嗯,他已经打开了, 那么我们,嗯,首先是我们要把自己的数据进行一个导入,然后直接选择一个选择关键词好了,然后我们进行把数据跑一下啊。 ok, 我们让他暂停一下。好的,呃,那么到了这个页面之后呢?嗯,可以用这个几点稍微再小一点,然后,嗯,让这个 稍微接点,再稍微分散一点。大家可以注意啊,这个标签呢,它其实是可以让这个节点进行一个分散,那么这个呢是可以让节点进行集中,大家 可以在做图的时候灵活的运用和调整。嗯,我们可以让他的字体也稍微再小一些,嗯,让更多的文字显示出来。好了 好了,好了,我们就让他先显示这些文字好了。嗯, 那么接下来我们要对呃里边的一些呃文字进行一个修改,那么我们怎么操作呢?嗯,首先我们可以看到,嗯,这个电脑的一个左侧面这边有个 q 二四,我们先点点一下, 其实就是他一个排序,让他按照一个他的一个嗯,手拼或者是同类型字幕进行的排序。那么我们可以看到啊,在我们这个标签当中有一个这个叫预测啊,还有 一个这个叫做,嗯,叫做预测,预测模型,预测, 呃,还有风险预测,预测模型啊,预测,其实这三种呢?嗯,在一定程度上我们比如说我们认为他就是说有点重复,因为是同一词,我们可以把这个啊,预测啊都统一修改为那个风险预测。 那么我们需要做的呢,就是第一步,我们先找到这个风险预测这个这个标签,我们先点一下啊, ok, 他在这 为了方便起点,我把它拉出来,让大家看的更清晰一点啊。然后我们单击鼠标的右键,嗯,那么在这边有一个 id, 兔子这个 lissis 的选一下,然后我们再接下来啊,对这个选择找 这个预测这个这个标签啊,因为比较小啊,没显示出来,但是我刚刚在点的时候,大家可以看到他就出现在这里啊,那么我们就再选中他,单击右键之后点最下面这个,他是一个,就是塞塞肯德瑞这个, 然后他成功了之后,他就会有这样一个呃,提示,那么 ok, 嗯,那么我们基本上就他的意思就是说我们需要再重新进入到这个页面的时候才能进行一个修改, 那么我们接下来我们就进入到,嗯,我们因为我们是,比如说我们要批量性修改,不光只是修改这一个,呃,数值,我们想要修改其他的一些数值,嗯,就是标签文字啊,比如 我举一个例子,比如说,嗯,我们要修改,嗯,把这个食管磷癌和食管癌做一个修改,嗯,我们还要就做一个合并, 哎,我们还要想把这个胰腺肿瘤和胰腺癌做一个合并,嗯,等等,就类似这样胃肿瘤和胃癌做一个合并,那么我们接下来就是打开这个 project 啊,这是我提前已经就是啊,我们自己在自己存出好的这个文档的 post, 那我们找到这个文件叫 a, 嗯,爱丽丝,哎,这个文件,那么点开这个文件呢?因为我是麦克版本,那么我们就直接用这个右键右键这个文本编辑把它打开, 那大家可以看到,嗯,在这个对话框当中呢,可以显示出刚刚我们修改的那个文字,就是我们 其实是要保留的是这个风险预测,那我们就把它放在前面,那么我们是需要用呃修改的是这个预测。呃,那么接下来呢,我们可能还要对其他的一些标签做一个呃同步的,就是呃一并进行修改。那么怎么做呢?我们先,嗯直接就是在这边直接输入内容就好了, 嗯,直接先复制,然后比如说我刚刚找到一个叫胃癌和胃肿瘤,那我比如说我们想保留的是胃癌,那我们就把胃癌输入进去,那么这边气坏呢,就是胃肿瘤, 那么我们下面我们还想再进行一个修改,比如说我们要把一线,我们要一线癌,我们是要保留的一线癌,那么一线肿瘤我们就不需要的一线一线肿瘤我们要合并的一线肿瘤,那么 我们在下面再找一个,再找一个,嗯,比如说是,嗯再找一个结肠肿癌症 啊,癌症和肿瘤这两个是,其实他是一个同,同一个意思,那么我们就直接把这边我们要,比如说我们要保保留的是癌症, 癌症,那我们是肿瘤。 ok, 那么其他的方法其实是一样的,我们可以不断的在下面,然后呃就是修改重,大家要注意,就前面这个标识以及中间他这个标识字符呢,其实是不能动的,我们只需要把那个文字啊对应做一个修改就可以了,然后点击直接擦掉就好了。 呃,那么接下来我们把这个页面关掉之后啊重新再进入一次,等会大家再看一下, 好了,我们先暂停一下,嗯,好,我们还是跟刚刚一样排个序,大家注意看,我刚刚其实我是替换了一个胃肿瘤和胃癌,大家可以看,基本上在胃 这个这一行里面其实是没有喂肿瘤的,因为已经被我替换掉了。还有一个刚刚就是一线肿瘤啊,我替换成一线癌了,大家可以看到啊,还有一个就是癌症和肿瘤啊,这块我也是把它进行那个替换,这就把肿瘤全都啊跟癌症合并在一起啊。 好的,那么这个是一个合并啊,那么接下来我们再讲一下怎么去把它啊进行一个剔除,就比如说我举个简单的例子啊,我们对拍个序 啊,比如说我们,嗯对这个标签我们是不需要的啊,我们直接先找到这个标签啊,他是在最下面大概看一下在 随机游走,我们不要这个标签。好,那我们就直接选中这个标签之后鼠标右键,然后直接选择这个倒数的,嗯,第三个这个叫嗯 akulusonnes, 直接点一下,然后他会有个提示, 我们点确定,那么这个标签他就会被嗯删除掉了。那么在我们嗯,这样的话,在我们后面的不论是做这个呃时间的走线图 啊,还是之后的一个突变词图,他都会,嗯,就是就都不会纳入进来都。而且我们嗯刚刚取消的这个呢啊一定 要注意,还是跟刚刚哎一样,也是需要把这个页面关掉之后啊,重新再跑一下。 嗯,好了,我们嗯点击一个暂停,大家可以看到刚刚我们排除的这个文字呢,其实他就是在这随机游走,他就会显示在这,那么我们操作过程当中我们所有去除掉的文字呢?他都会显示在嗯,这个位置。 好,基本上,嗯,这就是,嗯,我用的这个麦可系统,嗯进行一个呃标签,嗯, 标签词的一个修修改,嗯,以及那个标签词的一个删除以及合并。啊,希望能够对大家有所帮助,谢谢。

三分钟教你用会 sex space 视频,最后有操作指南哦!哈喽,大家好,今天呢,我们来聊一聊文献综数利器 sex space 的使用方法。 sex base 是一个非常强大的文献综述工具,它可以帮助我们发现学术研究领域的热点、趋势和关键作者。首先,我们需要准备好论文的影文数据库,可以是 website, scopris 等等。然后将影文数据导入到 sex base 中。接下来我们可以选择不同的分析方法,如共词分析、影文网络分析等等。 共词分析可以帮助我们发现关键词之间的关联和演化,从而了解研究的热点和学术趋势。而引文网络分析可以帮助我们发现关键作者和他们之间的引用关系,了解学术圈的权威人物。最后, set space 还可以生成各种图表和可视化的效果,帮助我们更好地理解和展示研究成果。 所以,如果你正在进行门线综述,或者是想要了解某个领域的研究热点和趋势,那在 space 绝对是一个非常有用的工具。

还有就是这个标签不连续的问题,比如说我们这关键词呢,我们给他做个剧类,我们点这个像像葡萄一样的这个点一下选择 k 就是 kos 关键词,以关键词进行分类 好了,那他会出来这样一个,嗯,他自己默认那个,这样我们再点一个 lr, 这个是对他剧烈的一个定义,就是算法。那出来之后呢,如果你觉得影响视觉的话,可以把里边的节点让他变得更小一点。 ok, 然后这是我们一个剧烈,大家可以看到他主要零零一二三四五六,其实他都有,但是在有些情况下,我们可能这个节点他没有显示,但是在有些情况的时候,可能他的节点并不是 非常连续的,他可能是零三六七等等像这样的情况,那这是什么原因呢?主要是因为这边点这个飞舞塔,飞舞塔是过滤的意思,那么他这个节点 他这个剧烈呢,他会把一些出现的比较离散的啊,这种剧烈呢,他会让他进行隐藏消失,那我们点一下,点一下就是把这个过滤取消掉,那我们再重新剧烈一次的话,他就会显示齐全。 我这个因为我这个距离他是刚刚好的,他都显示的比较连续的,所以不存在这个问题。尤其是大家在用大量的这个数据进行分析的时候,可能就会存在这样的问题。就 大家有的说点这个 k 之后剧烈全部消失,我一般推荐大家尽量还是点,因为版本不一样,所以有的版本可能,比如说太早的版本可能会有这样的问题,但是 我一般推荐就是点这个,就是相机这个三,这个三种颜色,这个点他啊,那他他自己会自动生成这样一个剧类,而且也是我们,嗯比较直观能看的, 包括这边剧烈标签无法显示完整,其实也是在啊,这边也也可以在这边进行调节,就是让他剧烈标签显示完整,也是在这边进行调节。然后颜色的调节呢,大家都在这一块进行调节,你可以选择让他变颜色改变都可以的。 okay, 这就我们换了一种新的颜色, 那我们再点一下这个时间线图,因为现在他这个新版的他只有这两种, 就是两种模式,像大家之前讲的这个,嗯, kimevnyw 这个已经被被取消掉了,现现在只有这两种模式。 ok, 这个图线呢,我们可以让他稍微的图形尽量稍微缩小一点, 然后这里呢其实就可以对他节点进行一个调节,你可以让他显示更多或者更少,然后这字体大小都可以进行设置。然后这边呢 这边呢可以显示他这个的宽度,离散的宽度,大家在自己在进行,前面几期的视频我也有讲过,大家可以再进行调节,因为他这个反应起来还是比较迟钝的,如果你点的太快的话,他跟不上你的节奏的。 好了,那今天的分享就到这里,谢谢大家。

来了,他来了!他带着文献中束神器来了!大家好,这里是小陈研究所,你们知道我当研究生之后做了最多的一件事是什么吗?那就是写文献中束,将期末作业要写文献中束,导师任务要写文献中束,连写个申报书都要写文献中束。 可是写文献中书真的好难啊,毫无情绪怎么办?现在小陈带着三十倍的文献中书神器助你一臂之力! 三十倍是陈超美等教授基于抓瓦开发的一款信息可视化软件,是知识图谱分析方法的重要工具之一,可以用来研究分析大量文献,将某一领域的研究现状及热点清晰的展现。 关注小陈,逐渐接受三十倍教程哦! 自从学会了 sisice, 老师再也不用担心我不会写文献周数了。

三个模块里给你解释了,但是呢具体操作起来啊,有很多具体的细节啊,这时候我会结合,我很理解,结合我们从呃中外各种各样的机会,我们给大家啊,在中国的,比如说科学网上,在国外的 各种各样办的这些啊,就瞅瞅有什么地方。这时候我们问到的呃读者用户问到的问题,我们来给大家解释解释。比如说在这一步在数据收集的时候需要注意什么?在呃数据最后分析的时候需要注意什么? 比如说好多好多参数,如何选择这些参数?呃参数你选择参数的影响是什么?对你后边的影响是什么?都要做些介绍啊,所以这个 下面这几个部分呢,侧装于安装啊,功能介绍,数据的采集啊和预处理,这时候呢,再往下就会给出大家一些具体的实力。 这个塞斯贝斯啊,有许多种分析的方法啊,其中有几种,比如说科学合作网络, 科研合作网络就是研究啊,几个不同的哎,比如说研究一个论文,这个论文有几个作者,这几个作者 作者发表同一篇文章,他们就是成了合作者,所以说这个合作者是局部的信息构成了一个网络分析,这种网络就可以回答一些 许多高层次的问题,据说这个合作是谁和谁合作呀?或者是这个合作是在每一个领域合作,合作和那个地理位置有什么关系啊?这些方面,呃相对后边来说比较直观,就是说科学合作的网络是比较直观的网络, 这些网络的合作,网络的分析啊,作为第一个例子,第第一部分实力啊,同时呢你可以看到是怎么样啊?通过这个流程具体化,具体到合作网络分析的时候啊,来体现这些功能和原理 啊。下边呢,下边还有这个科学主题和科学领域的贡献分析。贡献?是啊,比如说一个论文 里头啊,同时有出现两个关键词,两个关键词一个是 k 一啊,一个是 k 二,这两个关键词, 如果你发现一个论文里列出这么几个关键词,这样的话就叫贡献。贡献呢啊,也是一个常用的办法,就是怎么样找找出他的局部的联系。你看这个前面合作是局部的联系,是共同作者。 下边的贡献是合作关系啊,就相当于合作关系,但是呢,贡献就是共同出现在一个地方,这样他是局部的联系。 第三,下边一个是最核心的啊,塞斯贝斯最核心的功能,最核心实际上就是说塞斯贝斯的设计啊,完 全是为了实现这一个主要功能,其他的功能都是辅助实现的。呃,顺便比较容易实现。这个文献供背引分析啊, 根据前面的理论,前面几个理论说文献供背分析反映的是一个学科一个领域里头的 一种犯事。前面一会会讲到这个为什么叫做犯事,他是一种犯事呢?就说这个犯事在经常在变化,也就是酷恩的理论,我们回头会具体讲一讲这个啊,这些理论 不光是哲学上有酷恩的理论,还有社会学类有其他的竞争的理论,有这些理论会具体的讲,但是这个塞斯被子的设计说既然有这些,呃,犯事,犯事之间会有 转换,这也就是说科学革命,科学最后的进进步啊,都是通过犯事之间的转换来进行的。 但是怎么样了解这个犯事呢?犯事是关键点,是有一种是通过这个文献供背人网络的特征来了解这些关键点,所以说从这些基础层次上直观的可见的 啊,信息,我们可以返回来来看到哲学上才能出现的这种犯事的结构啊,犯事的转换等等等等。所以从这方面来看,塞斯被子啊 啊的一个突出的一个特点就是怎么样用啊这些实际上你可以每个人都可以操作的这些工具来达到解决这些问题,达到这些非常抽象的一个层次上才能看到的问题。这最后不仅仅是关于一篇文章,一个论文,而且是 关于整个学科,所以这个视野啊,就是非常啊跨越了几个层次,从啊从高层次的,低层次的啊,互相之间 经过几次几次的这种跨越。所以说有时候用户用三四的时候觉得这个东西比较不好琢磨这个分析到底是从哪入手,如何解答这些得到的结论。 所以整个来说,呃,我们这个一方面有针对性,针对好多用户提出的各种各样的问题来解答他们的具体的需要。另一方面呢,也给大家提供一个系统的学习这个的机会。 这个你可以看到这不光是一个领域,不光是一个,比如说不光是一个什么树木计量学,也不光是一个,呃 啊,计算机也不光是知识挖掘的,但是他牵涉,而且他牵涉了许多各个方面的领域,他综合的是一个解决一个问题,为啊为动力的就是解决这个问题。是什么呢?就这个学科, 某一个学科,我对这个学科感兴趣,我怎么样通过这些现有的知识,现有的工具来更快的更有效的达到我的目的? 那当然就说现在的方法是,呃比较费时费力,而且呢具有局限性,这个方法呢 提供了一个新的可以辅助,不光可以辅助,而且可以开阔我们的视野的一个办法 啊。最后还有这些,呃,塞斯贝使用中常见的问题,常见的问题,你可以从别人的经验里学到很多东西,别人说如, 如果说这个流程里我们知道哪个节点,哪个关键点容易出问题,容易出现什么问题,我们可以呢一返回来,呃,改进塞斯被子的设计,这个界面上让你不容易在 走到那条岔路上去。所以呢啊,通过这个系统的这几个步骤,我们希望啊大家可以更有效的 运用这些工具,同时运用工具,最后结果就是啊,你省省掉了很多很多,原来可以你必须花费很多很多时间 来掌握这些知识,掌握这些信息,现在通过运用这些有用的工具,更合理的运用这些工具啊,你能省很多时间,也可以用这些很多宝贵的时间来发现更新的问题。好,这就是这个 啊要点我们需要,里面还包括很多很多的知识点,但是呢,整体来说就是给大家提供这么一个系统学习的机会。

选题困难,用工具四个法宝破混局,百度学术来分析现状趋势很清晰,功能非常强大。还有维普来选题,智能 上段很放心,直往快速看,领域研究热点很清晰,老朋友靠谱, citizenbase 也可以挖掘热点,很灵敏。最后截图在这里,下期内容你来提,等着你!

最近临近毕业,有的同学还没有发小论文,问我怎么办?那么我其实推荐你学习一下这个 sales space, 在中国之网上搜的 sales space 的话,呃,已经有一万多篇文章,而在英文数据库里面,呃,也有两千多篇文章。 学术的话啊,也有三万多快三万的文章。那么如果你想尽快发文的话,可以写一篇中文的啊,发一下,一个月写一篇,然后发了啊,很快也就能赶上。如果你想发高质量的话,也可以写一篇英文的啊,好好写,然后也能发那个优质文章。那么也需要系统的学习一下书啊,学习一下该方面的知识就可以了。

如何在三十秒内找到一个研究领域所有经典文献及总结结果?对一个研究生来说,最难的是写综术前的文献调研,这需要大量的文献调查及总结。打开赛特心思的免费文献剂量功能与抗议,输入关键词 查询的年份区间,即可快速总结该领域的某机构获作者的期刊发文量,以及研究领域的热点变化趋势。 ai 还会智能给出推荐的三十篇必看文献以及经典文献,这些文献都可一键下载。最实用的是可以一键生成 pdf 报告,科研小白再也不怕导师让你剪辑文献了!

呃,各位抖音的同同学大家好啊,今天给大家介绍一下 sss 六点一二六高级版与普通版的区别。 首先说啊,在普通版这里,金奈斯 top n, top n 百分比只有这三个参数,没有这些啊,最低被引用多少啊,像后面这些,比如说半年被引用多少的这些参数,呃,相对来说呢,呃高级版要比普通版多很多功能。 其次呢,就是它能分析的数据库也不一样啊,像普通版只能说只能分析外包 size c n k i, 像这个高级版能分析这个 scobe 啊,还有就是结合 massacle 啊,还有就是说这个朋友卖的这些数据库来分析多样化的数据。 呃,如果说有需要的同学可以说去呃联系我来这个激活高级。呃,而且呢,我目前在市面上看到了一些关于塞斯贝斯的教学,其实有很多图做的都不是很合理, 比如说咱们拿关键词贡献来举例子啊,咱们勾选到 keyword 之后直接勾就行,随后呢直接可置换。 你们做完图,你们做图的时候,他都会蜷缩成一个团,全部蜷缩在一起,其实是看不到他的一个整体结构的,对你们分析这个主题的前沿 分析他的重点其实起不到啊,多大的帮助。咱们来到这里之后啊,可以让他多跑一会,让他跑的分散一些。随后呢, 你可以利用旋转按钮让它旋转一下啊,新版要比老版方便的点在于放大缩小,用鼠标滑轮即可,不用说啊,点这边有一个放大镜, 当图形处于一个稳定的状态的情况,咱们点击一下这个圆盘,点击这个圆盘的目的就是让这些词处于一个啊,不同频次展现不同大小的节点,这样你能够直观的看到这个, 呃,这个主题的重点,点完之后呢,咱们要来到这里,小 member 啊 labels 这里咱们要把这个 bytegore 换成第二个啊,第一个 bytegoree 是这个根据中心性排列,就是与这个词相关的词,它都会展现出来。 然后第二个词呢,是根据频次排列,就是频次越高,这个词越优先展示。咱们选完频次之后,可以把这个预值拉低,预值的意思你们可以理解为水龙头,就是预值,比如说现在是十三,就是这份数据, 频次在十三以上的词,他会展现在这里啊,明显的咱们这份数据可能要啊拉的低一些,咱们预值拉到的二, 拉到二之后,咱们怎么办呢?把这些重叠的词,把他们啊拉一了啊,把这些跑出去的词也给往回拉一了。 这个节点在哪里呢?节点在他的左下角,节点在他左下角啊,新版本如果说你点住了啊这个词,比如说基层一线,点住 这个词之后,只会显示和他有关联的词啊。随后呢,你要点击一下空白的地方,让他恢复如初。咱们目前来说,把这些重叠的词全部拉开之后, 咱们要做的就是对图谱进行一个美化。首先来说啊,咱们要调整一下它的节点,其实节点你调整不调整都可以啊。 note 第二个词的第二个,咱们换成一个圆的就可以了,这样呢,你们也好记一些。 随后呢,咱们要对颜色进行调整,就是不同的年份,让他以不同的颜色来展示小面板啊 call map 这里呢,你可以选择一个彩色,选择完彩 色呢,你可以把这个呃呃这个颜色再加深一些,其实选完彩色之后,整个图的立体感瞬间就上来了,这个加深不加深完全是看个人的喜好 啊。由于说种种期刊啊,由于说这个期刊有各种各样的要求,最常见的呢,就是你需要考虑出版式打印出来的效果, 比如说咱们是一个白底,白底的情况下呢,你尽量配一个黑字,咱们这个呃上面选择一下 labels labecaller 这里呢,有一个呃 tom labels, 咱们选一个黑色啊,就可以了。 随后呢,现在你能看到这个底底下有一个呃红色的边框,咱们依然是啊 labels labels 呃,第三个词的第二, 也是特么的 boss, 你把这个 h s v 值给它拉满啊,就可以了。像现在这张图其实就已经是呃呃算是半成品。还有一个细节咱们可以调一下, 咱们来观察一下左边的频次表啊,第一数列呢,这个叫频次,这个毋庸置疑。第二数列叫中心性。 中心性指的是啊词与词之间的桥梁,比如说 abc 三个词,中心性充当于 b, 连接着 a 与 c 啊,这个就叫中心性。 咱这这个中音性,大家能看到啊,中音性为零。所以说这里呢,要手动的算一下啊, notes 最后一个词直接点就行。算完中音性,大家看图上有一个啊啊,有一个 细节,比如说年轻干部,年轻干部周围形成了一个紫色的光环,这个代表这个词在短期之内被大量的引用,所以说他才会形成一个紫色的光环,比如说这个干部选拔,他就没有 啊,所以说这都是解图的一个小细节,像现在来说,这个图就已经是完成了啊,这个图咱们直观能看到, 学者们重点注意的是啊,这个年轻干部啊,培养选拔啊,以及说培养啊,干部培养,培养模式,基层一线, 这是学者们目前来说啊,在该领域是着重重视了一些啊,小分支,随后呢? 这些线代表什么意思?比如说这个选拔与培养,选拔与培养之间有连线,代表他们同时出现在一篇文章啊,仅此而已 啊,这就是关于关键词的贡献啊,你们不要把图做的特别的扎堆,如果说扎堆的话,你连最基础的思维,最基础的啊逻辑架构你都看不清的话,其实对你们分析是没有什么帮助的, 所以说有需要教学的同学可以给我发私信,就先这样子,祝大家学业顺利。

hello, 大家好,这节课给大家讲一下全网独家的一个东西,是关于 set sweats 的。 众所周知,三的 space 他只能做文献数据库里面的文献或者是专利,比如说 cti 中国之王里面的一些文献,然后利用 sad space 这个软件可以做他的一些分析。 可以做什么分析呢?比如说关键词的贡献句类以及主题路径,或者研究经验分析, 也可以做作作者合作网络、机构合作网络这些分析。当然你也可以利用 set specs 软件做 ws、 ybocs 英文数据库,以及别的一些数据库,如德文特什么。呃,这些数据库都是可以的,但是 目前三的 sys 只能局限于这些数据库,如果我想做一些不是这些数据库的数据导入到三 sys 能不能做呢?是不能做,但是 如果你学完这节课之后,你就会发现,利用 set switch 也可以做一些非文献数据库里面的数据。比如说哪些呢? 比如说国家社科基金项目,可以利用 sales space 做历年的国家政策、新闻标题等等。你能想到的有时间、有文本 一一对应的都是可以利用三四百多,因为三四四的特点就是将时间因素导入到了这个知识图谱中,对吧?比如说咱们举个例子,这是国家社科基金 项目数据库,这个数据库里面有很多项目的项目标题,咱们如果把这些项目标题全部都给取下来 啊,讲课的时候我会讲怎么爬取,因为我针对这个书写了一个小程序,可以直接爬取的,不用你复制。你看有没有发现这个里面他是有标题的,他这个里面学科分类,国家社科,社科领域的很多啊,你看各个领域都有, 比如说马列,还有哲学这些世界历史、语言学以及图形教育啊,艺术、军事 这些就是社科领域的,社科领域的项目都在这里面,我可以把它取下来,然后对他的标题,他的项目标,项目名称进行分析,对吧?但是已 前的分析仅仅是利用别的软件分析,而从来没有利用过三十四 s 进行分析过,所以你如果利用三十四 s, 现在用它来分析写一篇论文,有可能是 得到 c 看的。呃,这个可以发 c 看的,有可能是可以发 c 看的,因为以前没有人做过, 如果你做,那不就是非常新颖吗?所以也就是个时间差的问题啊,以后别人看的话,别人看到的话也会写, 如果同意主题的写了好好几篇,那肯定是第一篇,对吧?第第第一篇会得到 c 看其他的就可能性比较小了。当然你可以投不同的 c 看,这个时间差都是在里面的,他因为 c 看的发表年限比较长,你可以利用利用 用它进行写,当然这这个是非常幸运的,非常幸运的,因为以前从来没有人用过,是从来没有人用过,所以你可以用用一下, 当然你得学习这个课程,对吧?学习课完课程之后你才能会用,要不然你不用啊,这这个课程你可以从哪里得到呢?就是关注微信公众号学术点滴。关注微信公众号,学术点滴。这是我刚刚写的,还没有写完啊。 写完之后课程录完之后会传到这个公众号上,你可以通过公众号进行进一步的学习,然后写论文啊,利用的软件就是本公众号开发的 super set space 软件,利用这个软件,如果你有数据的话,你可以分析国家社科, 国家政策,还有新闻标题这些,而这些都是以前无法用 sat specs 做的。而 sad spec 的特点,它是有几个图比较好,哪几个图?主题剧类主题,演化路径,时间线研究,前沿探测,这些图是比较好的,对吧? 然后这就是 size spice, 如果你想学习 size spice, 做一些基本的中国之网的数据,或者是 w s 的数据,你可以关注微信公众号,呃,然后从里面 进入相应的这个推文的链接,你就可以学习对应的 set specs 的课程,而这一节课是 set specs 的提高篇,或者说是终极篇,因为以前的 set specs 只能做现成的数据库,而这节课 set specs 学习完之后,你可以用它来做非数据库,里面, 懂了吧?然后这是第一节课,咱们主要就是做一个介绍,然后下节课咱们就开始拔取这个数据库里面的数据,然后拔取完之后,咱们还得利用 啊,五大五大的一个软件,然后进行分词,分完词之后,咱们还得利用 首先啊,首先这里面设计的软件,第一个软件是取这个项目数据库的软件,第二个软件是五大的一个软件进行分词,第三个软件,嗯,就是咱们的 super set space 这个软件。第四个软件就是 set space 软件, 当然里面还是利用了 excel 进行一些数据的简单的操作一下。呃,这节课就到这,咱们下节课就是爬数据,行吧?爬数据加上分词,行吧?下节课咱们下节课再见啊。

同学们,今天我来给大家分享一下关键词剧类这张图的做法。关键词剧类这张图呢是在关键词贡献的基础上生成的,我们做关键词贡献期贡献之后呢,大家看我鼠标位置这边呢有个紫色葡萄,我们按一下这个紫色葡萄, 他旁边呢是有三种剧烈的形式的,有 tkat 是拍头标题, k 是关键词, a 是摘要,我们做关键词剧烈吗?所以我们选择 k 关键词剧类,我们做关键词剧类呢,一般常见的有三种算法, lsillr 和 usr, 我们常见的呢常用的是 llr, 然后呢也有 lsi 这种呢?我们 都可以来摁一下这个算法,他会显示出来不同的剧类结果,大家可以根据自己他这个他生成的剧类,然后是否符合我们的一个分析来决定你要哪显示出哪种剧类算法。 做完这个剧类之后呢,我们呢下一步呢就是去调节这个图,我们还可以很明显的看到这个关键词字体有点大了,我们把它调小一点, 因为我们是主要是显示关键词嘛,你要觉得他不应该,你就直接把它给去掉就 ok 了,就把直调高一点, 去掉之后呢,我就是不显示关键词,我们只显示剧类,然后我们来看一下,通过放大来看一下一共有多少个剧类,他一共有从零,然后到 到我们的这个十六,一共有从零到十六,一共有十七个,但是他显示出多少呢?他一共有多少个剧类呢?他显示有十八个,就是他显示有十八个剧类, 这个十八个距离他就他就相当于第十七个,他没有显示出来,我们该如何给他调节出来呢?我们呢可以要要按一下这个非特斯,这边有个非特斯,他因为他是有一个限定值的,我们需要把他限定值给他调小, 然后我们该如何调呢?就是我需要把剩下的,就是你在做的时候呢,会经常出现一种情况,就是 中间呢可能会少一个,或者是少连续少三个,我们该如何把那个缺少的给调节出来呢?我们需要把这个重新,就是把这个给插掉,我们重新运运行, 大家稍等一下, 重新运行之后呢, 我们呢还是先做我们的关键词贡献,做完关键词贡献我们还是做我们的关键词贡献,我们这一次呢首先把这个菲特斯这个值给取消掉,就这个值就这个按钮给他给取消掉,就是我们先把他给取消掉 不小心的另一部分了,我们把它给它挑出来, 调完之后呢,然后我们再按我们的这个紫色葡萄,再按我们的 k 值,然后这个呢我们就可以去去这个呢他就显示全了,我们就可以找到我们第十七个了,就是从零到十七, 他就把这个从一共这十八个距离全部都显示出来了,如果你在做的时候发现少了一两个,你也是一一样的算法。在菲德斯把这个限定值给取消掉,做完之后呢, 我们还会出现一种情况,这是什么情况呢?就是我们对于我们关键词剧烈,还会出现一种情况,就是中间有一两个不是我们想要的,或者是我不要十十八个剧烈,我只要前十五个,我们该如何调节呢? 我们调节剧类的做法呢?一共有两种,都在我们的剧类的标签里,第一种呢就是这个, 呃,通过标签来显示出来,假如你在做的时候,你不想要哪些剧烈,你就按照这种做法给他显示出来,你看这种做法呢,他就是第四个, 他只要零到三四不要,然后五六不要,七到八,他只要这些,然后我们都能给他做一下限定,然后我摁一下之后,他就只显示我们这些我想要的剧烈,如果说你需要对你的剧烈做一些不想要的去除呢?你也可以先点一下。另外一种 条法呢,就是按一下我们的这个也是距离,他有一个呢展示最多的距离就是我如果说你要他出现十八个,你只要前十五个,就按下至十五,按下确定, 然后他就是只显示出从零到十四,然后这就十五个距离,他是这样显示的,这是我们调节距离的 两种方式。然后调节完剧烈之后呢,我们需要来调整这整个图的做法,这个图呢目前还是比较丑的,我们该如何调节呢?首先呢还是去找到我们的开了麦,把这个线条给它显示出来, 显示出来之后呢还是调整,我觉得我一直觉得是直线比较好看,还是把它调成直直直线。然后呢看一下哪哪种颜色符合他, 然后如果说你调完他这个颜色之后呢,你会发现他这个距离的颜色不够统一,对吧?然后呢你还是需要把他的这个, 把他这个先把这个字体不显示了,把他剧烈的颜色给他统一一下。在哪里统一呢?还是我们的 label label 这边呢?有个 label carlo, 我们去找到我们的剧类, 剧类的颜色把它调成黑色吧,调成黑色,调成黑色呢,大家可以看到啊,还是有一点阴影部分的,我们把这阴影部分也是在剧类这边有背景颜色,这边呢有一个 有一个,咱们的这个剧类的背景颜色调到我们 ssl, 把它透明度给它调到最高,就把这个魔法纸呢给它调到调灯透明的,它就能显示出来了,这颜色还是有点不太明显,对吧?然后我们把它这个调成彩色吧, 调整彩色之后呢,大家可以看到啊,这张图就稍微好看了一点,但是他我们还可以给他显示出他的那个色块啊,我们呢怎么显示呢?我们可以如果让色块更加好看呢?我们 可以是大家看我鼠标位置,我们可以先按一下这个糖葫芦,按一下子糖葫芦之后呢,他会把这个就是具体的 关键词的点状呢给突突出一下。然后呢我们再找到我们这个边的剧类,剧类这边呢找到剧类啊,就是这边有个 car shou heid, carol hushi 的,我们按一下他 就他就会显示出模块值,这就是如果你觉得这个就很好看了,你就微信 shifta 或者是这个翻尔这边 cividpng, 把它原图给它保存一下就 ok 了。 然后呢,有些同学会说,哎,老师,那个刚刚我们的 s 值 q 值呢,就是我在做文献的时候会经常会看到,就是有说 s 值和 q 值的,这个 s 值和 q 值呢,也 一般呢,就是属于我们的模模块化和性度的一个问题,大家相关的知识呢?大家可以去百度一下,这个很简单的。然后我们有些你们看图的时候呢,也会做成一个具体的一个, 他们会做成一个方块形式的,不是不是做成我们四块形式,在哪里调呢?大家可以看到啊,这边有一个塞挺,然后有个 ifu 报道,我们来就是我们按一下他,他就只显示我们的一个色块,这就是我们这个,我们还是通过这个鼠标的调节位置,把这个黑色阴影部分给显示出来, 然后然后我们去这就是我们关键词距离图的做法,我们如何看我们关键词距离的具体信息呢?也是按一下这个距离,距离这边呢有一个距离 发现我们就按一下这个剧烈,发现这个呢就会显示出来。我们这个软件呢他是就是这个剧烈,是做了多少个剧烈,在做了零到十七十八个剧烈,假如我选定一个从,然后这边呢有句有对剧烈的具体介绍,这边有个 size。 再次呢就是这个剧类的成员数量一般呢,我们对他的选择呢就是小于十,我们就觉得他 适量太小了,就是不具有代表性。我们小于十的我们都是不关注他,大家可以看到我从从他的九呢九之后到他的十八都是小于十的。我们实际过程中如果说你可以不描述他的, 然后 s 值呢,这就是我们剪影度的一个 s 值呢,就是剪影度,剪影度什么意思呢?就是我们用它形形容我们这个这整个剧类里面的 成员的紧密程度,还有他的那个或者说是他的同志性,如果他就是越接近一越大,我们对他的限数值的限定呢,一般都是零点七大于零点七呢,我们就是认为他 这个,呃他的剪影度是 ok 的,他的整体的同志性啊,包括剪影度是 ok 的,然后命这边一二,这就是这个, 这是呢我们这个剧类里面的,呃,就是剧类里面的关键词的一个,就是经常出现的一个年份,然后我们会在主要年份, 然后呢大家可以看到啊,我们这边呢就是我们的一个 lsi 还有 lr, 然后这边呢就是他的不同的算法,然后我们呢可以根据我们的需要来就是来选择 不同的算法,然后这里面呢都是主要的一些关键词,然后呢如果说你需要把这个值呢,就是大家看文献的时候,你需要把所有的值给选择出来,他没办法一下子倒出出来,我们就是就是全全全部选中,右键全部选中,然后一个 ctrlc 加一个 ctrlv, 可以复制到我们的表格里。如果说你要看这个剧类里面的具体信息,我们可以假如我需要看到第二个剧类,他就会显示出来我们第二个剧类主要有哪些关键词,他的频率是多少, 然后他就会在这里主要显示出来,你可以去看这里面的剧内里的具体信息,这就是我们关键词剧内的一个做法,然后今天的分享就到这里了。

老师再也不用担心我的学术英文写作了,这个工具手把手教我们怎么写,输入任意一句想表达的中文,比如试试数据呈现波动趋势,就会给出很多以发表论文中相似的学术表达。还贴心的提供了每个例句的文献来源,方便我们去引用 哦!还可以对所有例句进行在线改写,教我们写好论文的每一句话,准确又高效。不用再去先写中文,再用翻译软件僵硬的翻译为英文了。会卷的朋友已经去赛特新斯官网悄悄用起来了。

先建立这四个文件家在之网,根据需要检索一页可以全选五十个,记住格式, 把下载好的粘贴到 input 文件夹。 首先进行数据类型转换, cnk i 倒出来的,所以选 king t 文件就是当时那四个文件家所在的位置, 显示为零,说明未转换修改。把 input 文件加的名字按要求命名, 重做刚才的数据转换, 根据需要自己命名。 把 project 和 data 两个文件夹也对应导入, 根据需要限定时间, 没有要求全包含,就可以去给 t 看看最早一篇的时间来定。其实时间 分析关键词就选 t words。 这里出错是因为数据转换后我忘了把 output 的结果粘到贝塔导致的,只需要年过去再够就可 终于成功。

刚才有一个同学咨询我,我很开心啊,这是一个很好的问题,他问说老师,我下个学期要要读博士了,我这个暑假呢,老师想让我写一些文章去发表,我应该从哪做起呢?非常好啊,如果你不知道要写啥, 你就写文献中书。哈哈,为什么呢?因为反正你入学以后,你写你的博主论文也有很大的一块需要写文献中书啊。文献中书你用比较传统的方法做就没啥意思了啊。你现在要可以去试一试这个比较大规模的文献的书里啊。嗯, 用那个织网的可视化分析或者用 sexyex 软件去做啊,大家可以在网上下几篇你的领域当中,用 sexys 和织网可视化分析的那样的文献中数去学习一下怎么写。你就照猫画虎,照着写一篇, 摸一摸,你看看文献中数怎么写更好。你写好文献中数基本上就上路了。好,希望对你有帮助。

好了啊,我们现在要跟大家做的是关键词剧类啊,那么现在是关键词出来之后呢?现在剧类点击这个剧类, 这就是我们所看到的关键词聚类,这个类别就已经聚好了。那么聚好之后呢,我们需要去嗯,探的一个核心的词,看他在当前的这个时间节点当中。呃,他的 这是关于词啊,然后看一下啊,十五, ok, 这个是十五个词啊, 这个没有什么世界价值啊,那么这个是他的一个关键词。呃,一二三四,我们需要看的是 现在其实我所遇到的问题是在于说这些关键词的背后,他所对应的这一个一个类的词在什么地方找,这是我现在所遇到的问题啊,我们现在先把这个,把这个图先保存一下啊,这个是, 呃,这个是这个第六个图据,关键词关键词这个剧类啊,剧类,关键词剧类,这是第六张图,然后图六。 好,我们先看一下这个图啊。哦,这是图六,我们先看一下。 好,这是关键词的图六,这个图六的话就是我们现在所看到的这一个关键词区内, 现在这个关键词剧内,呃,我想要的是这个关键词剧类的这个下面的这些文字,我要想办法去找一找啊。 ok, 保存,因为在这个文字的查找过程当中呢,他在剧烈的话 是可以用不同的算法,因为清华的博士的话,因为用了他的算法,今天这个地方的话,我看有还有第四个算法,他把这个算法去做了,那个就是图形,我觉得做的很好,那么在这过程中我们可以把这个,呃,调,这个是调图的他的这个样式啊, 这是图形的样式,那么先把这个图调的比较好的话,真的是比较比较好使啊。然后他的这个深浅度啊, 这个文字的话也是可以调的, 国家认同。然后现在,嗯, 他这个他这个句的一个类的这个类别里面呢,是刚才我们所看的那个关键词, 然后现在这个关键词,呃,有一些他有些阴影部分去啊,他这个不不亮了, 这个是他 那个外面的一个亮度啊。 现在那个,呃所做的呢?我们看一下这个啊,就是他是这个是不同的算法,然后不同的算法,我们点一下不同的算法,一个、两个、三个。 嗯,创建一个 tfboysid, 再次尝试 好像没有这个第四个算法这个算法的,有谁知道他这个算法的这个就是 呃关键词背后的这些这一组的这一个,他这个文字在什么地方?这是我现在所遇到的问题啊。 好,我们做完这个,刚才这个是做的是剧类啊,剧类分析了,就到这个地方。下面我们就跟大家做一下那个,这是实线图、实区图和我们的这个,呃, ladies as cap 啊,我们先到这个地方啊。

哈喽,大家好,这节课我给大家讲一下怎么去理解三的 spa 四的实区图 啊。这篇作文是我自己写的,然后放在了微信公众号学术点滴上,学术点滴里还有很多关于 sens, max 啊, ucniteyex, ico, 还有该费拍即可这些知识图谱,或者说可视化文献计量的软件,大家如果想获得这些软件或者学习相关的教程,可以去关注一下学术点滴微信公众号 啊。这节课我就给大家讲一下怎么去理解这个图。这个图是经常用到的,也是塞的 spa 四的一个独特之处,因为塞的 spa 四,他的这个图将关键词与 时间联系起来了,这就不仅仅的是看关键词了,因为其他的可是话软件他主要做的就是关键词,对吧?关键词的贡献之类。而赛的 spax, 他加入了时间,有没有看到加入了时间, 所以咱们就可以去理解一下。怎么去理解这个图,我看了很多网上的论文啊,里面说的都不清晰,甚至有些是错误的。 那咱们这这节课就讲一下他的本质,这是我已经写好的一个文档,已经发布,发布出去了,所以录制视频就是放在啊壁站上,然后可以让更多的人看到。三的 sps 有一个亮点是将时间因素 加入了知识图谱的绘制中,先划分时间段,你看下面的时间段,对吧?从一九九八到二零一七,然后将合并起来,一起将,其实就是合关键词合并起来一起分析,这就是他的史趣图,又叫主题路径图,其实就是一个主题的演化过程, 因为一篇文章的主题可以用它的关键词来表示啊,主要讲解一下,如果有不对的,还请指出来。 这个图中的每一个圆圈,他代表的是一个关键词,该关键词在分析数据集中首次出现的年份。比如说数据管理,就是在咱们下载的这个数据集中,一九九八年出现。当然如果咱们分析近十年,或者近五年、 近二十年,而这个领域自从研究一共有好几十年,有五十年、六十年了,那 咱们这个数据管理只是在这一个一九九八年咱们下载的数据中第一次出现。在一九九八年咱们没下载的数据,比如说一九九七年,他也也有可能出现了,但是这时候咱们就无法 无法分析了,因为咱们没有下载一九九七年的数据,懂了吧?也就是说数据管理可能在以前的年份出现了,但是咱们针对咱们下载的数据,他第一次出现的年份是一九九八年。科学数据管理是二零零八年出现的, 当然也有可能他是一九九七年,一九九六年也出现过,但是针对咱们下载的数据还是二零零八年出现的,就是这个意思,也就是这句话的意思, 关键词一旦出,一旦出现,将固定在首次出现的年份,尽管之后论文中仍会出现该关键词,图中将不再显示,只会在刚出现的年份显示,懂了什么意思吧? 比如说数据管理在一九九八年出现了,一九九九年、二零零六年、二零零七年都出现了,但是咱们只把它固定在一九九八年,如果后边还出现了,那么咱们会将后边出现的频次累加到一九九八年,所以一九九八年数据管理这个圆圈很大, 懂了吧?是这个意思,是不是有种豁然开朗的意思, 对吧?就是这个意思。一九九八年他的文献量是很少的,但是他的关键,他的收据管理,这关键词频次怎么这么大? 只能说明后边的出现的频次累加到一九九八年了,就是这个意思。那这种方法合不合理呢? 比如说如果一个关键词一九九八年出现一次,之后几年没有出现,而而在二零一二年出现了八十次,那么软件会把该关键词归结到一九九八年,显然是不合理的,对吧?因为一九九八年出现一次,二零一二年 出现,二零一二年如果出现了八十次,那应该说在二零一二年,这个数据管理是研究的重点,但是咱们把它归结到一九九八年了,这就不太合理了,对吧?当然这也只是一小部分的情况, 现实生活中出现的几率不是很大,不是很大,对吧?不可能一九九八年出现一次,然后又到了二零一二年又出现了 八十次,这个差距有点大。当然也是有可能的。有说一个领域,他刚开始研究研究了,呃,一点点就是研究了皮毛,然后进行不下去了,然后过了一段时间,过了十年,二十年,然后这个领域又火起来了, 就是这种意思,懂了吗?比如说人工智能领域,他中间有有很长时间的,这个就是低谷期,然后现在又火起来了,对吧? 这就是关于这个圆圈大小的解释,圆圈大小的解释,懂吗?圆圈大小的解释,然后 这个线条怎么解释呢?线条怎么解释呢?这个之间的连线,你看他有圆圈,有连线,对吧?这个图中不就有圆圈,有连线, 加上一个时间轴,对吧?线条怎么解释呢?线条也好解释,线条代表着关键词之间的联系,也正是这种联系式的主题路径图能够加入时间因素。 如一九九八年的数据管理和二零零八年的科研数据管理同时出现在二零零八年的某一篇文件中,那么数据管理和科研数据管理之间便存在一条联系,这条联线从一九九八年到了二零零八,就是数数据管理、科研数据管理,他们直接有一条连线连到了, 说明在二零零八年,有一篇文章同时出现了这两个关键词,然后他们就会联系起来。当然不止一篇文章,可能有很多篇,十篇、二十篇、五十篇, 所以他们之间的联系,懂了吧?就这个意思啊。连线表示 两个关键词出现在同一篇或多篇文当中,那么这种方法有没有缺陷呢?因为刚刚咱们说了,这个圆圈的大小有没有缺陷?有,连线有没有缺陷?也有。 比如说,如果同两关键词同一念均第一次出现,他们这两个关键词就在同一篇文章中,那么他们之间应该是有连线的。但是现实情况呢?现实情况是没有联系的,当然 任何方法都有缺陷,能做的就是尽量优化,对吧?嗯,现在 已经把这个图完全给大家讲讲解解析了,是不是?现在你再去看这个图,是不是很清晰明白他是什么意思了,对吧?这个图也是我用三十四分做的,是不是比很多论文里面方便, 要的都很美观,对吧?然后,嗯,这就是,呃,制片论文,大家可以去关注这个公众号,微信公众号,学识点滴。 可以,这里面有很多东西,很多东西,比如说有一个我自己编的一个软件万能侠,现在是六点零版本了,可以免费下载论文,还有搜索各种你想要的资源,以及各种 工作学习的效率工具。你不需要下载别的工具了,直接下载这一个软件,然后它里面有很多插件,你直接点击用就行了。 还有各种各种小工具,大家可以去关注一下。好,这节课咱们就到这,咱们以后再去分享别的一些好的东西,再见。