粉丝288获赞1436


哈喽,大家好,我是让学术问题说人话的分老师,很高兴在我的频道继续和大家见面。很多学生写论文的时候,其实根本不知道 sci 论文不是想到什么就写什么,因为问题往往不是出现在内容上,而是出现在结构上。 因为 sci 的 论文本质上不是堆积内容,而是一个完整的逻辑系统。首先我们一起来看一看 sci 真正重要的是什么? 很多同学会误认为 sci 最难的是英文,但现实情况是,英文不好的人也能发 sci 论文,因为审稿人真正看的不是你的单词有多高级,而是你有没有把一个研究问题讲清楚。 所以很多论文的问题其实是有内容但没有推进逻辑,读起来就像写课堂作业。因此 s c i 论文不是在展示你知道多少,而是在证明你的研究是成立的。第二部分,我们一起来看一看 s c i 论文为什么一定有一个固定的结构? 我发现很多学生会问到,为什么所有的 sci 结构都那么的相似?这是因为 sci 本质上是一种标准学术化的表达,它需要让审稿人快速的判断你研究什么,以及为什么这个问题值得被研究,然后你怎么去验证以及结果靠不靠谱。 所以绝大部分的 sci 本质上都在回答这四个问题。接下来我们再来看一看 sci 最核心的六个部分是哪一些?其实大部分的 sci 论文核心结构都差不多,都是由 introduction 开始,这里你要告诉别人你研究什么问题, 到了 literature review 部分要告诉别人已经研究到了哪里,那在 research gaps 的 时候还要说明现在还缺少什么问题。 需要特别注意的是,在 research gaps 部分,它决定了你的论文有没有价值。接下来,到了 mythology 部分,你要告诉你的读者,你的研究证明是正确的。最后要在 conclusion 说明你的发现是什么。 所以很多的同学问题不是不会写,而是不知道每一部分为什么会存在。第四个部分,为什么很多学生写不好 sci 论文呢? 这是因为很多人从头到尾都在做一件事,那就是写内容,而不是推动逻辑。所以最后会出现一个问题,那就是写了很多页,但重点不清楚,审稿人会读得非常辛苦。 而 sci 最重要的一件事其实是降低你的阅读阻力。真正高级的论文不是信息量最大,而是最容易被理解。 如果你现在正在写论文,可以先问自己一句话,那就是你的论文是在堆内容,还是在推进一个研究逻辑?很多时候,这才是像论文和像作业的区别。好了,不卖焦虑,不喊口号,我是凡老师,我们下次再见,拜拜。


到现在还有的科研宝们,不知道 sci 论文都有哪些类型,今天花一分钟把论文类型说清楚,再也不用未选类型发愁。 第一种,原创研究,这是最核心的,自己做实验,攒数据,实打实的成果,毕业凭职称都认这个。第二种,综述, 不用做实验,就是把这个领域的研究梳理一遍,总结总结,适合有一定积累的同学。第三种,简报短讯, 研究成果没那么完整,主打一个快,想快速发表,占个成果的,选这个准没错。第四种,病例报告,主要给做临床的同学用,报道一些罕见病例、特殊病例,给同行做参考。 另外还有评论、观点、方法学会议相关的类型,不用记太细,主要了解上面四种主要类型就好。不管你是刚入门的新手,还是做了多年的老科研,只要选对论文类型投稿,就能多省时间少踩坑。

格拉斯哥邮件原文五 a classic text, frequently cited by check gpt the three remaining sources have fabricated d o i。 翻译过来,八篇参考文献,五篇 check gpt 高频推荐三篇 d o i。 伪造。我们第一次看到这份邮件时也盯了三分钟。五本真实存在, 三本查无此书,查重认书名 turning 引认内容源头,半真半假,比全假更致命。 ai 幻觉撕开引用链补真实 d o i。 是 突破口,补真实来源从第一页开始。

哈喽,大家好呀,我是你们的科研部卷学姐。在我的日常工作中呢,会遇到很多医生或者医学生问我,我想研究某方向,那这个数据库可以做吗?这数据库发文情况怎么样呢?其实这些问题的答案你自己就可以在帕麦上面轻松找到,所以今天视频 手把手的教大家帕麦的初级使用,保证你看完就能上手。告别盲目解锁,一定要记得先收藏,避免找不到喽。首先我们先了解一下帕麦到底是什么? 简单的来说,它是全球医学研究人员和临床医生使用频率最高的免费文献解锁平台,是由美国国立医学图书馆开发的,它的数据来源非常的广泛,核心呢是收入了五千六百多种高质量奇葩的 mad line, 再加上 p m c 里面的开放获取文章,出版室直投的新文章等等。从学科来看呢,它包含了临床医学、基础医学、护理、药学、公共卫生等 这些方向。那从文献类型来看呢?无论是原始研究,比如 r、 c、 t, 还是综述面来分析,还是指南共识,这里面都是有的。可以说 palmer 就是 一个既权威又全面的医学文献宝库,那我们就必须要掌握一下它的绞索啦。 palmer 的 绞索灵魂就是布尔逻辑绞索式,这是信息绞索的基础,大家一定要记住这三个大写的绞索词, and or not。 那第一个 and 呢?是取焦急,比如我们输入 hypertension and unhas, 那 就是检测既包含高血压又包含 unhas 的 文献,用来缩小我们的范围,我们就可以去使用筛选标题和摘药这个字短,然后再输入疾病和数据库,就可以找到对应疾病的数据库文章啦。那咱们在 看第二个 or, 它呢是取病级,那比如 hypertension or high blood pressure, 能把不同说法的高血压都囊括进来,用来扩大咱们这个减速的范围,这样就尽可能地去解锁到全部高血压的相关文章啦。 那第三个 not 是 排除,那比如 hypertension not stroke 就是 减速高血压,但是排除都要其中中风相关的文献。那这里要给大家敲一下黑板啦。在 power 里面呢,这三个逻辑词必须要用大写字母, 如果我们用小写,就会被当成普通的单词进行处理了。当然其实 power 本身就可以去选择这些逻辑词的。重点来了,我们来一起看一下 power。 进入实操,你直接搜索 power, 然后就可以找到我们官网了,它这个官网其实很好找的,然后首页其实就有快速的解锁框,那比如说如果你只输入一个 hypotension, 我们点 search, 大家可以看到我们输出的结果非常多,有几十万条,对吧?那这个时候呢,我就要给大家讲一些技巧了,这个时候我们就要提高我们的剪辑精确度,所以我们可以使用自断限定点回这个 advanced, 那这里的话就可以去进行一个字段的限定,比如说有作者呀,领域呀,还有我们的 s b, n 号啊,语言,这些都是有的,我们可以直接往下划,我们限定它是标题或者摘要。然后这里可以看到我们刚刚说到的这三个逻辑词,这里比如说我想要去用它解锁 unhas, 好, 这里它已经帮我的解锁式已经做好了,那我直接点击 search 就 可以了,这样的话我们解锁到的结果就是 unhas 数据库里面做 hypertension 的 文章的,大家可以看一下, 对吧?好,那我们的第二个技巧的话,就是在我们的左边会有很多的筛选器,那我们要善于去应用这些筛选器,比如说我想看他这个高血压在 n s 数据库里面发表了一个情况, ok, 那 我点这里可以看到, 那从除了今年,因为今年是五月嘛,那往年的话基本上都是逐年上涨的一个趋势,去年达到了七百五十四篇。如果说我不想看太旧的文件, ok, 那 我可以点击这里筛选近一年的文章,那这里就是我筛选的近一年的相关文章啦。 那如果说咱们还想去进行更多的关键词的解锁, 大家看比如说我想加一个它的发表的语言,或者说发表的时间,我想再精确一点,那我们可以点击我们的历史解锁式, 先给它放在这里,然后我们再去找到对应的时间或者语言,再去把它们 and 起来就好了,这个所以非常非常的简单。这个呢就是我给大家告诉的技巧啦,我们要善于使用咱们左边的字段限制以及这个解锁逻辑词。 还有就是咱们的解锁结果其实是可以去再进行一个筛选的,这里可以添加啊,我们可以看到它的语言,那么选英文还有年龄等等等等。 另外呢,再给大家送上几个小贴士,就是我们在使用 power 的 时候的话,也是可以去善于运用一些插件的啊,这些插件的话就不做具体推荐了,大家可以自己去查一查。那我们运用插件之后, 我们可以在解锁结果里面直接显示切开影像因子和分区,这样我们来选择阅读文件会更加的方便,进一步的筛选我们想要读的文章的质量。好了,今天我们的分享就到这里,那我们下期再见,如果你有什么想学的也可以留言告诉我哦。

大家好,今天我与大家分享的这项工作是来自上海人工智能实验室的 miniro 二点五。在当前大语言模型和解锁增强深层技术爆发的时代,高质量的数据是不可或缺的基石。然而人类世界中海量的高价值知识 都封存在 pdf、 学术报告等复杂的文档之中。因此,如何将这些包含密集文本、复杂公式和图标的高分辨率文档转化为结构化数据, 成为了多模态理解领域的核心任务。所以这也就带来了我们这篇论文的一个核心的矛盾与痛点,也就是现有方案的两难的境地。来看一下文章描述,面对极其复杂的文档图像,当前 主流技术呢,是陷入了两个极端的困境。首先是传统的流水线方案的多米诺骨牌效应,也就是文章中二点一这边所提到的这样早期系统呢,它通常将任务拆分为布局检测、文本识别、公式识别等多个独立模块。这就像一条永长的工厂流水线,某个环节一旦出错,误差就会向后传递 并且被放大,而且部署和维护多个独立模型是极其繁琐的。另外一方面就是端到端视觉语言模型 v o m, 它的一个算力黑洞与幻觉。近期火热的端到端 v o m, 比如千万二 v l 或者 j m a, 它是尝试直接输入原分辨率图像,但是文档中大面积的空白和 低信息区域呢,会产生海量的视觉透支,带来二次方级别的计算复杂度,导致了极其严重的一个效率瓶颈, 并且在处理长文档时是极易产生幻觉。接下来呢,我们将重点讲述文本的一个破局点, minor u 二点五的它的一个结偶哲学。那么如何打破精度与效率的死界,文本给出了一个答案呢,就是 minor u 二点五,一个仅有一点二 b 参数的轻量级 结偶式的双阶段解析框架。在这里,我们用一个形象的比喻,带着大家理解下这个问题。想象一下,我们在阅读一份超大版面的报纸, 我们绝不会一开始就拿着放大镜从左上角一寸一寸地扫视这整张报纸,这个其实就像端到端,原声分辨率 v o m 的 做法是极度低效的。我们人类的本能呢,是先退后一步,动览全版,去快速定位到标题图片和正文区块,这也就是 minor u 二点五的这个第一阶段,全局布局的分析, 再把目光或者说放大镜去聚焦到某个特定的文章区块上仔细阅读,这也就是第二阶段。譬如内容式列。那么通过这种粗到细的策略, mineu 二点五呢,它是完美避开了海量无效 token 的 计算开销。接下来,我们结合一下这篇论文的 figure two, 带着大家做一个更深入的解读。 mineu 二点五呢,它的架构是非常精简的,我们大家可以看一下这幅图,它是有一个六百七十五 m 参数的 navit 视觉编码器,一个 patch merge 以及一个零点五 b 函数的前文二, instruct 语言模型结构器所构成的。首先是第一阶段,也就是这里的 stage 一, 它是一个布局的分析,首先系统将文档图像下裁量到一零三六乘一零三六像素的缩略图,这一步是极其清亮的模型能够在这个尺度上快速地捕捉全局结构,从而输出各个元素的坐标 类型。是这里的第二阶段,内容识别。在第一阶段领导下,模型从原始高分辨率图像中精准裁剪出局部特征区,比如公式表格,并且在保持原生分辨率,一般来讲是上限限制。在二零四八 乘二十八乘二十八像素的这个情况下进行极其细力度的内容识别。作者在底层任务设计上也做出了极具启发性的这样的一个创新。传统的布局检测通常使用的是目标检测区领域的六指标,但是我们会带领大家通过 figure 四 进行一个更详细的一个解读。大家呢,可以看一下这里的 figure 四。这幅图文本块的边界通常是模糊的一个仅仅框住大意, 但不能够精细的预测,可能获得完美的 loo, 而一个竹行精确贴合的预测反而得分很低。为此,作者在这里是提出了 page loo 指标。那么通过计算页面像素级别的覆盖率来评估布局,使其呢和人类视觉的直观判断呢,是高度一致的。下来我们再带着大家去探索一下复杂公式的解析, 也就是我们这里的 adr framework。 现有的 vlm 呢,在面对超长推导公式时,常常呢发生了严重的结构性幻觉。作者是设计了原子分解与重组的框架,通俗的来讲就是化整为零。面对一个长篇的复合公式模型呢,它先进行布局分析, 将其拆解为单行的原子公式,对每一行独立进行了高精度的识别,最后再利用空间位置信息呢,把它们重新拼装组合在一起。再看一下这里的 figure 六表格识别,最大的痛点呢,是距离太长。传统的 v o m 是 喜欢输出 html 的 格式,但 是 h t m l 包含太多非视觉相关的繁琐语法标记是极其踊跃的。而 minor u 二点五,它转而提出了使用 ibm 的 这样的一个 o t s l 为中间表示。 o t s l 直接对应表格的二 d 矩阵结构,使得平均数据长度呢缩减了约百分之五十,大幅降低了深层难度 和时间。另一方面,任何优秀的模型它都离不开强大的深层难度和时间。另一方面,任何优秀的模型它都离不开了微调数据集, 给大家讲一讲它的一个设计思路如何呢?在海量无标注文档中找出让模型头疼的困难样本。作者巧妙地利用了模型推理的一个随机性,对同一张图片进行了三次独立推理。如果这三次输出的结果是高度不一致,说明样本呢,正处于模型的决策边界上, 是极其不稳定。系统呢,会自动将这些样本过滤出来,交人工进行高精度标注。这种将好钢用在刀刃上的一个数据工程, 是 minor u 二点五性能飙升的一个关键。接下来我们来讲一讲这篇论文的一个实验验证。我们会带着大家通过图标进行一个深入的理解。我们还是先把目光聚焦到 figure 一 这个板块。这里是展示了 minor u 二点五 在 omni dock bench 上的一个表现,作为一个仅有一点二 b 参数的模型, minor u 二点五的综合得分呢,达到了九十点六七,它不仅超越了同量级的专用模型,甚至跨级别碾压了七十二 b 的 千万二点五 l 以及商业币源的 gemine 二点五 pro。 我们再给大家谈一谈这篇论文的一个实验设计上的亮点。值得一提的是,作者在公式验证中没有采用传统的基于 latex 抽象语抽象语法数匹配的这样一个评测,因为 latex 语法是非常灵活的,它们采用的是 e s p rate, 这为我们日后设计多模态的评估体系也是提供了极佳的一个思路。评估呢,应当回归到最终的视觉呈现, 而非基于底层代码的格式。接下来我们再给大家看一下这篇论文的 paper 三、我们可以看到,双阶段架构带来了一个巨大的红利,在没有任何部署优化的情况下, mindu 二点五呢就能达到极高的吞吐量。而经过了 v l l m 的 优化后,呢端导端的速度更是达到了二点一二 page s 每秒,它是某些三 b 参数模型的四倍以上。最后我们再总结一下这篇论文。首先我们谈一谈这篇论文的一个研究启发。 mindu 二点五的成功 给我们的一个最大的启发在于,在多模态大模型的时代,一味地堆叠参数规模和暴力输出,高分辨率并不是唯一的解法。 通过深入理解任务物理特性,比如文档天然具有区块分离的属性,进行合理的架构结构,全区与局部的玻璃配合精准的数据非人工程,也就是我们刚所说到的 m i c 小 模型,同样呢,能够在专业的垂直领域展现出超越超大模型的一个统治力。我们再谈一谈潜在的部署以及未来的展望。 这项工作也有可以进一步探索的空间。由于采用了暗夜裁剪和局部识别的策略模型,在处理跨页的超长表格或者被分页强行截断的段落时,可能会面临上下文割裂的挑战。未来的工作呢,或许可以探索如何在该解偶框架中引 入轻量级的跨页记忆机制,以实现真正的篇章级语义连贯解析。以上就是我关于这篇文章的分享,谢谢大家。

刚上岸还摸不清科研门道,分不清论文类型,看不懂其他分区,读不懂外文文献,甚至是不知道在哪找文献。这期视频专门为颜林新生量身打造,一站式扫清所有科研盲区,新手小白也能轻松吃透。首先分清个人论文与 diy 号。 大论文就是学位论文,分为硕士、博士论文,是毕业拿学位的硬性要求,字数篇幅大,需完成学位答辩审核。 小论文呢,篇幅精简,多为几千至一万字,包含刊论文与会议论文,由对应平台编辑及外省专家同行评选。 d o i 号相当于论文专属身份编号,方便无限解锁定位。再区分主流刊分类, 国际刊刊常用三大数据库。 s c i 主打自然科学优势刊 s s c i 聚焦社会科学领域, e i 则侧重工程技术方向。国内核心刊分为三大类, 北大核心是由北大图书馆评选,全学科覆盖,每三到四年更新一次目录。南大核心呢?即 c s s c i 是 由南京大学与社科院评选,偏向国内社科类优质刊物。 还有科技核心,多用于理工、医学类学术发表。熟知这些基础名词,能快速理清投稿、发表与毕业学术要求。 不管写大论文还是小论文,都离不开基础的文献阅读。我一般习惯用小滤镜,只要将本地 pdf 文献一键导入平台,系统,便能自动抓取文献相关信息,快速匹配出对应刊名、影响因子以及刊分区等关键词数据,快速锁定底刊高质量文献。 很多年龄的宝子们刚入门不知道去哪里找文献?找中文文献的话,首先选知网、硕博论文、各类刊文献基本都能搜到,其次就是万方知网,找不到的不妨来这找找,尤其科技、医学类文献资源很丰富, 查英文文献优先用 w o s, 读研常用,不仅能搜文献,还能直接查开引用量,细看影响因子。除此之外,骨科学术、 pubmed 也都是很不错的外文剪辑平台。小滤镜直接整合了各类文献剪辑平台,不用来回切换多个网页,一站式剪辑文献,省时又省心。 我知道炎陵的同学会有点畏惧英文文献,虽然看着全是英文挺吓人的,但翻译成中文之后读起来其实挺简单的。点一下小滤镜的右上角全是英文之后读起来其实挺简单的。点一下小滤镜的右上角全是英文之后读起来其实挺简单的。点一下小滤镜的右上角的右上角的右上角的不会乱, 快速过一遍文线,特别方便。阅读的时候遇到看不懂的句子,直接划词翻译就行,右边有好几种免费的翻译引擎可以换,非常方便。 除此之外呀,阅读文线的时候难免遇到疑惑,大家一定要及时钻研弄懂。遇到专业术语或是不懂的知识点,及时做好高量标记,随手写下批注,整理思路。我平时都会用平台里的边读边问功能,一通原文内容, ai 就 能给出精准解答,全程阅读不受打断,学习效率直接拉满。 科研之路起步不难,难的是没有正确的方法引路。希望所有的科研新手都能牢记这些基础知识点,避开学术路上的各类弯路,稳稳迈出科研第一步,从容开启自己的研究生学术生涯。本期干货内容满满,觉得实用记得点赞收藏,后续还会分享更多科研实用技巧,我们下期再见!

现在很多人做科研,最可怕的不是没工具,而是你的工具太多了。多到很多人已经不是不会用 ai, 而是越用越乱。明明花了很多时间搜到的文献还是不对路,明明已经看了几十篇 中数,还是写不出结构。明明 ai 给了你一个特别像那么回事的答案,结果你回头一发现,你引用的那篇核心文献,后来的研究早就在反驳它了。你以为自己在提效,实际上很有可能是你在用更快的方式把自己带进一个更大的坑。所以今天直接给你结论, consensus 适合探路, eliest 适合搭矩阵, side 适合查证据链。如果你刚进入一个问题,最想知道的是什么?这个论点在学界大方向到底偏支持、偏反对,还是观点混合呢?这个时候先上 consensus, 它最适合干的不是替你写完整的综述,而是先告诉你这个方向 到底值不值得继续追。如果你已经知道大致的方向了,接下来你要做的是系统的整理文献,比较样本量比较研究设计,比较方法, 变量、结论局限,把一堆论文拉成一个能够比较的矩阵。这个时候上 elisa, elisa 最厉害的不是更会说,而是更会做证据工程,它更像是一个综述工作台。如果你已经准备下笔了,或者是你最怕的是我引用的这篇高背影文献 到底稳不稳?后面的研究是在支持他,还是在打他的脸就上 site? 他 最狠的地方不是只能搜论文,而是他那个智能引文。他会尽量告诉你这篇论文后来是被支持、被反驳,还是只是被 顺手提了一下?所以真正成熟的工作流根本就不是三选一,而是用 consensus 探路,用 elisa 搭矩阵,用 site 和证据链。这才是二零二六年更成熟的文献工作流。为什么很多的科研人用了很多的 ai, 文献还是做得很痛苦啊?因为 工具链断了。最常见的三种断法,第一,搜索和判断断了。你搜了很多的文章,但是你根本就不知道这篇文章是不是在真正回答你的问题。你以为自己在推进中数,其实很可能是积累了一堆的噪音。第二个就是你的阅读和你的提取断了。 搜到文献以后,又回到最原始的体力活,开 pdf, 看摘药,抄方法,记样本,量,摘结论,自己去做表,文献一多,你就会发现你不是在做中数,你是在 高端的体力工。第三,引用和核查断了。这最危险。你问 ai 一个问题,他回答的非常流畅。你看到一篇高背影文章,觉得他应该很可靠。你在综述里写下已有研究表明,却没有再追一句后来的研究到底是 支持他,还是在打他的脸。所以,别再问老师哪个工具更强,真正的问题从来就不是哪个最强,真正的是你现在处于什么样的研究阶段,最缺的是哪一段能力。如果你只想先知道这个问题,学姐怎么说,那么你上 consensus。 如果你要进入系统的整理,批量的提取,搭综述矩阵的阶段,上 elisa, 如果你已经准备写综述,写引言,写基金,最怕引用翻车上 sight。 二零二六年,真正拉开差距的不是谁会用 ai, 而是谁 不会再把 ai 用错。如果你今天还拿着一个聊天机器人硬啃八十篇 pdf, 还在靠高背影判断文献是否可靠,还在把看起来很学术误当成证据站得住,那你 不是不努力,你只是工具链该升级了。如果你想让我把这三大神器继续拆成一套真正能够上手的文献工作流,我会把它整理进星球,包括不同研究阶段 怎么选、怎么组合、怎么少走弯路。想直接照着搭的可以来我们下期的分享,再见。拜拜。

每天带您认识一本新刊,今天我们要认识的是 ios of medicine 对 国人非常友好的医学方向 sci 刊 k k r q 一 分区、中科院二区、影响因子四点三,出版范围广泛,覆盖了三十多个医学领域, 几乎适合医学沾边就可以尝试投稿的一本刊,且发文量逐年增加,投稿难度也在逐渐下降,是一本有口碑又有性价比的医学刊。

讲真的,这本新加坡水灾啊,不投后悔一辈子。别看他 if 只有二点二分,却是当地医学会的亲儿子,常年稳居四区,投稿后最快一个月就能出结果,编辑完全不会拖延,对病例报告也非常友好。 唯一不足的呢,就是需要先支付投稿费一百二十五新元,被拒后不能退款。但是如果你的文章被录用了,后续则无需支付其余任何费用。

七十八点五分顶堪重磅突破,上海交大陆顺团队拿下埃菲尔肺癌初治晚期患者阿米万,他单抗加拉泽替尼,双药联合完胜现有神药奥希替尼,中位生存期直接拉满 三年,生存率百分之六十 vs 百分之五十一,脑转移控制也更持久,注意副作用风险更高,选药要权衡利弊,想学生信复刻思路,点关注下期拆可抄的作业。