00:00 / 07:22
连播
清屏
智能
倍速
点赞98
00:00 / 06:31
连播
清屏
智能
倍速
点赞3252
Gemini CLI 实际操作演示 Google 的命令行工具 Gemini CLI 真的是非常好用,做了个简单的使用示例。目标:让 AI 自动读取我们零重力杯科幻征文的参赛作品,统计每篇的字数、写一段内容概要,并生成一份可视化报告。整个过程只需要给 Gemini CLI 两条自然语言指令,操作特别简单,堪称编辑的效率神器。 操作流程 一共 4 步 1. 把作品文件放到同一个本地文件夹。Gemini CLI 目前还不支持 Word 格式,要先把文件转成 pdf 或 txt 格式。 2. 打开 PowerShell 或其他终端工具,切换到作品文件夹目录,然后输入 gemini 启动 Gemini CLI。 3. 输入第一条指令:“请统计文件夹里所有文档的字数,并为每一篇写一段介绍,把结果保存为一个 txt 文件。” Gemini CLI 会自动逐篇读取、统计和写简介。我测试了 20 篇稿子,大概花了 15 分钟,全程无需人工干预,只有在保存结果到 txt 时需要确认一下。 4. 输入第二条指令:“把统计信息做成一个精美的作品展示网页。” Gemini CLI 会先给出一个创建方案,确认后就会自动生成一个 Bootstrap 框架下的 html 展示网页。 整体感觉,Gemini CLI 的字数统计不是特别精准,作品概述写得还可以,课作为专业编辑的参考。最厉害的是它能读写本地文件,能开浏览器,还能通过 MCP 调用各种其他工具,绝对是一个万能助手。 有兴趣的朋友可以自己试试其他各种玩法,有想本博主帮忙实现的功能欢迎留言评论。 Gemini CLI 完全免费,每天有 100 次免费操作额度。具体安装方法可以参考 Paul Cuvert 做的介绍视频(搜索我的站内)。 #AI编程 #Gemini #GeminiCLI #AI技术 #人工智能
00:00 / 01:30
连播
清屏
智能
倍速
点赞2
Docling本地配置从入门到精通保姆级教程轻松OCR扫描件 🚀支持视觉大模型的开源PDF解析+OCR工具!Docling本地配置从入门到精通保姆级教程!支持LM Studio+InternVL3-9B与Gemini2.5 Pro轻松识别解析模糊PDF扫描文件 #docling #ocr #lmstudio #gemini #ai 🚀🚀🚀视频简介: ✅【企业知识库必备利器保姆级教程】免费开源神器docling震撼来袭!PDF秒变Markdown,扫描文档轻松识别,比付费工具还强大,支持调用InternVL3和Gemini 2.5 Pro模型 📄 本期视频将详细演示了IBM开源的docling PDF文档解析工具的使用方法! 🛠️ 视频分为三个部分: 1.基础使用- 用Python代码和命令行直接解析PDF转Markdown 2.本地模型 - 配合LM Studio调用InternVL3-9B模型处理扫描版PDF 3.云端API- 使用Gemini 2.5 Pro模型获得顶级OCR效果 💻 通过简单代码将复杂PDF文档成功转换为Markdown格式,连表格和图像都能完美保留。 🔬 针对扫描版PDF,视频展示了如何调用开源视觉模型InternVL3实现精准OCR识别。对于要求更高的场景,还演示了调用Gemini 2.5 Pro API,连模糊不清的扫描文档都能完美解析! ⚡ 通过docling配合视觉模型,企业知识库项目能轻松处理各种文档格式,大幅提升工作效率! 📋 视频详细讲解了每个步骤的代码实现,包括模型配置、API调用、批量处理等功能,适合开发者学习参考。 🎯 最终效果让人惊艳 - 连emoji表情、引用格式、模糊文字都能准确提取,成功率极高!
00:00 / 09:31
连播
清屏
智能
倍速
点赞171
00:00 / 00:55
连播
清屏
智能
倍速
点赞21
00:00 / 00:24
连播
清屏
智能
倍速
点赞803