00:00 / 01:27
连播
清屏
智能
倍速
点赞61
Recording4月前
把论文变成网页增加可读性 这个大模型用的是免费的gemini 2.5 pro 直接上google ai studio 就能用aistudio.google.com 我的prompt 是: 1. 核心任务 将这个学术论文内容,制作成一个用于可视化讲解的 HTML 文件。 2. 作者视角的思维重现 (主观叙事) 从论文作者的第一人称视角出发,带领读者体验解决问题的完整心路历程。 剖析最初遇到的挑战和困惑。 一步步、有逻辑地推导出最终的解决方案和算法。目标是让读者学会作者是如何思考并一步步构建出这个方案的。 以及如何设计实验验证自己的理论,展示重要实验的结果,论文重要的insight。 重点在于多说说why,甚至可以考虑用通俗易懂的比喻才解释一些复杂的东西。 3. 布局与视觉要求 不允许对中文使用斜体,因为很难看。 视觉风格: 整体风格要专业、简洁,可读性强,让读者看起来不疲劳。颜色搭配要舒适,字体大小要合适,确保读者拥有良好的视觉体验。 辅助说明: 对于设计思想或关键操作中可能令人困惑的地方,请给出解释。 4. 技术实现规范 输出格式: 必须是单一、完整的 HTML 文件,直接输出到一个generated code里,方便我复制,并且是中英文结合,中文为主 代码规范: 只能使用 HTML 标签(如 <b>, <strong>),严禁在 HTML 文件中使用任何 Markdown 语法 (如 **)。 公式处理: 所有公式必须使用 LaTeX 格式书写,并用美元符号 $ 包裹。 如果有公式,那公式里的变量一定要解释清楚是什么。 如果提到了论文证明了什么什么,那一定要把原文的证明的相关内容写出来一部分,不用太长,方便我的定位具体的内容在原文那里就可以。 术语的话要在括号里写出对应的英文,避免翻译出现问题 如果涉及了一些非本论文的经典数学工具,那一定要介绍一下,既要有公式也要通俗易懂,并且举例子不能脱离这个数学工具本身的概念,一定要恰当的例子才有帮助。 必须使用 KaTeX 库来渲染公式。 在 HTML 中引用 KaTeX 的 <script> 或 <link> 标签时,必须移除 integrity 属性。 html有两个标题,一个是你的生成的标题,一个是原始论文的标题,这个标题不是title标签,而是h1标签 注意你是无法插入图片的,所以不要瞎编
00:00 / 06:13
连播
清屏
智能
倍速
点赞10
AI工具读论文提效,我的实测与选型 GPT‑5、Gemini、Claude、NotebookLM、Llama.cpp、Cursor、ima 本期和大家分享我用AI工具高效阅读论文的整套方法:从PDF文本与图表,到TEX源码工作流,实测对比多款工具的优劣势,并给出不同场景的选型建议。 快速结论(基于我的实际体验,仅供参考): - 一般长度论文:优先 GPT‑5 thinking;图表多时可先整篇发、再补截图核对细节 - 多模态理解:Gemini 表现稳;Claude视觉能力相对弱一些 - 长文档/多文件:ima(DeepSeek V3.1 thinking)整体优于 NotebookLM(我这次测试) - 隐私/离线:Llama.cpp Web UI + Qwen 3 VL 30B A3B 组合可用性高 - 开发者工作流:Cursor + Composer 读TEX源码,高效定位结构与要点 演示亮点: - 用Meta一篇ASR论文图片做图表解析实测,对比 GPT‑5 / Gemini / Claude - Llama.cpp“每页当图”设置与效果验证 - NotebookLM vs ima 的长文档对比 - Cursor + Composer 从 Arxiv TEX source 到结构/要点/图片解读的完整流程 声明:不同版本/模型更新会影响效果,以上结论为当下个人体验,并非商业推广。 欢迎在评论区分享你的经验与更佳实践(李沐老师的“如何读论文”视频也很值得看)。 时间戳 00:00 开场 & 读论文方法 00:33 快速选型结论 03:06 实测对比:图表解析与纠错 06:06 本地方案实操:Llama.cpp Web UI 09:20 Cursor + Composer 读TEX源码工作流
00:00 / 13:29
连播
清屏
智能
倍速
点赞15
00:00 / 00:55
连播
清屏
智能
倍速
点赞7
00:00 / 02:44
连播
清屏
智能
倍速
点赞135
00:00 / 00:24
连播
清屏
智能
倍速
点赞0