Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
AI抖音
探索
直播
放映厅
短剧
搜索
您是不是在找:
扣子工作流什么时候可以用skill
金甜瓜代码怎么用
clawdbot可以手机部署吗
辅导编程的机器人怎么样语音移动
fc26 fsu插件不生效怎么解决
端口清虚仪使用教程
clawdbot配置钉钉
大龙虾ai能干啥
阿里云有豆包模型吗
双击打开的IDEA没有文件编辑权限
kate人不错
3月前
实测 PaddleOCR‑VL:文档OCR天花板? 真实场景测评 + 本地部署踩坑 这期视频我在飞桨 AI Studio 上实测 PaddleOCR‑VL,结合官方 Demo 与多种真实场景(长图海报、表格页面、B站截图、博物馆文物/书法、收银小票、说明书简繁混排、IKEA海报、倾斜/反光/特殊字体等)全面评估它的结构化能力、表格/公式识别与阅读顺序表现。 同时分享我在本地部署的完整过程与问题记录:Mac 端运行失败的原因(目前仅支持 A 卡 GPU 如 A100)、如何用 AI 编程工具(Augment + GPT‑5 + uv)搭环境、改脚本、定位上游 issue,并给出替代使用建议与实操心法。 非广告,纯体验与踩坑总结,适合想把图片/文档高质量结构化为 Markdown/表格数据的用户参考。 亮点摘要: - 结构化强、表格/阅读顺序表现佳,繁体识别不错 - 复杂场景下对反光、倾斜、非常规字体/版式仍有盲区 - 简繁混排有时会出现错位/混淆 - 本地部署现阶段对硬件依赖较强,推荐优先用云端/官方平台 时间戳 00:00 PaddleOCR‑VL 热度与定位 01:22 官方 Demo 与能力概览 02:35 真实场景实测 09:16 本地部署踩坑到解决思路
00:00 / 12:39
连播
清屏
智能
倍速
点赞
86
AGI_Ananas
5天前
PaddleOCR-VL-1.5模型综合极限测试对比本地部署 测试PaddleOCR-VL-1.5 #deepseek #paddleocr #vLLM #PDF #ocr
00:00 / 04:14
连播
清屏
智能
倍速
点赞
57
AGI_Ananas
1天前
GLM-OCR模型综合测试:本地vllm部署,PDF解析 GLM-OCR模型综合测试:本地vllm部署,对比deepseekocr2、mineru、paddlevl模型公式识别,表格识别pdf文档解析 #deepseekocr2#ocr#mineru#paddleocr#GLMOCR
00:00 / 05:50
连播
清屏
智能
倍速
点赞
55
AGI_Ananas
1周前
deepseek-ocr2测试对比mineru paddle deepseek-ocr2综合极限测试对比本地vllm部署对比mineru以及paddlevl模型公式识别,表格识别pdf文档解析#deepseekocr2 #ocr #mineru #paddleocr #pdf
00:00 / 10:13
连播
清屏
智能
倍速
点赞
62
千问大模型
11月前
Qwen2.5 - VL还能这样操控手机?!(附教程) 上个月,我们正式开源了多模态视觉理解大模型——Qwen2.5-VL。除了视觉理解之外,它还可以直接作为一个视觉智能体帮你操控手机和电脑!详细教程可前往GitHub的cookbooks目录,欢迎上手体验!#人工智能 #通义千问 #Qwen
00:00 / 02:11
连播
清屏
智能
倍速
点赞
97
cpolar
2月前
别再在线找OCR了!PaddleOCR-VL打造你的Ai助理 告别繁琐在线OCR!用 PaddleOCR-VL 一键部署你的本地“AI识图助理”,离线精准识别图文,安全高效全掌控。
00:00 / 05:48
连播
清屏
智能
倍速
点赞
175
AI超元域
4月前
🚀本地部署+全面测评!阿里最强全模态大模型Qwen3-Omni史诗级更新!OCR能力、音频识别、视频理解无所不能!Qwen3-Omni-30B-A3B-Instruct支持语音输出! 🚀🚀🚀视频简介: ✅神器降临!阿里Qwen3-Omni多模态大模型完整评测,实时语音对话+视频理解+OCR识别,Docker本地部署零门槛上手! ⚡️ 本期视频详细演示了阿里巴巴最新发布的Qwen3-Omni多模态大模型的完整部署和测试流程!这是一个原生端到端的多模态AI模型,采用MoE混合专家架构,拥有353亿总参数。 ✨ 主要演示内容包括:Ubuntu系统Docker本地部署、实时语音对话测试、音乐理解与歌词提取、模糊扫描件OCR识别、视频内容理解分析、AI生成内容识别等多个实战场景。模型支持119种语言输入和10种语音输出,包括粤语、四川话等方言。 🎯 三大版本功能各有特色:Instruct版本支持多模态输入输出、Thinking版本支持思维链推理、Captioner版本专注字幕识别。无论是语音翻译、音乐分析还是视频理解,Qwen3-Omni都展现了卓越性能! 🔥🔥🔥时间戳: 00:00 开场介绍 - 阿里巴巴发布Qwen3-Omni多模态大模型 00:32 模型架构 - MoE混合专家架构与参数详解 00:42 三大版本介绍 - Instruct、Thinking、Captioner功能对比 01:09 语言支持 - 119种语言输入与10种语音输出能力 01:34 本地部署教程 - Ubuntu系统Docker环境配置 02:35 推理服务启动 - localhost:8901端口访问演示 02:59 在线音频识别测试 - 实时语音对话功能展示 04:14 音乐理解分析 - AI描述音乐风格与提取歌词 06:00 OCR能力测试 - 模糊扫描件文字识别 07:04 视频理解测试 - 目标人物追踪与时间定位 09:29 游戏画面识别 - AI生成内容理解分析 11:10 多语言语音输出 - 支持粤语四川话等方言 11:20 实际应用场景 - 语音翻译、音乐分析、视频理解等 #qwen3 #qwen #Qwen3omni #aigc #ai
00:00 / 11:30
连播
清屏
智能
倍速
点赞
205
玉七零【教程👀简介】
10月前
Qwen2.5-VL视觉模型本地部署! 10分钟学会Qwen2.5-VL本地部署运行,最强视觉AI模型,含可视化页面,离线可用!小白也能轻松部署!附部署文档 #大模型 #大模型即将改变世界 #AI #人工智能 #计算机技术
00:00 / 09:59
连播
清屏
智能
倍速
点赞
100
炮老师的小课堂
3月前
Qwen3-VL-多模态模型comfyui本地部署及使用 地址这里发不出来,大家看视频结尾自己手动输入一下吧 #Qwen3VL #comfyui #comfyui工作流 #comfyui教程 #ai视频
00:00 / 12:49
连播
清屏
智能
倍速
点赞
71
AI超元域
11月前
vLLM本地部署Qwen2.5-VL多模态大模型 vLLM本地部署Qwen2.5-VL多模态大模型!70亿参数即可打造监控视频目标查找项目!轻松实现监控视频自动找人!RTX A6000显卡部署Qwen2.5-VL-7B-Instruct模型实战教程 🚀🚀🚀视频简介: ✅【完整教程】用Qwen2.5-VL模型打造智能监控系统?支持自然语言精准搜索目标人物!从环境配置到代码实现,从接口调用到界面开发,手把手教你用Python和FastAPI搭建企业级应用,附完整代码和部署文档 📱 在本期视频详细演示了阿里巴巴最新发布的Qwen2.5 VL多模态大模型,并演示如何利用它来实现视频监控中的目标人物识别功能。 🔍 主要内容: 详细介绍Qwen2.5 VL模型的优越性能,特别是在图像识别和人物特征识别方面的出色表现 完整演示使用vLLM框架在本地部署Qwen2.5-VL-7B-Instruct模型的全过程 通过实际案例展示如何使用OpenAI API调用模型进行图像识别 使用FastAPI开发了一个基于FastAPI和Tailwind CSS的Web应用,实现了上传视频并利用Qwen2.5-VL-7B模型逐帧分析,根据输入的目标人物描述检测目标出现的时间点。 通过几个实际视频案例演示了该程序的运行效果。Qwen2.5-VL-7B模型能够快速准确地检测视频中的目标人物,即使目标不太清晰也能识别,整体效果非常不错。 #AI #Qwen #Qwen2 #qwen25 #Qwen25vl
00:00 / 13:36
连播
清屏
智能
倍速
点赞
111
玉七零【教程👀简介】
8月前
Unsloth微调Qwen2.5-VL视觉模型 实现复杂数学公式的OCR!适合借鉴学习~大模型|LLM #ai #人工智能 #大模型 #多模态模型 #大模型学习
00:00 / 30:33
连播
清屏
智能
倍速
点赞
19
AI超元域
1年前
超越GPT-4o视觉能力?本地部署Qwen2-VL多模态视觉大模型! #gpt4o #qwen #qwenvl
00:00 / 10:06
连播
清屏
智能
倍速
点赞
105
AI超元域
9月前
本地部署+测评最强开源企业级OCR大模型InternVL 🚀挑战Gemini 2.5!最强开源企业级OCR大模型InternVL3!本地部署教程+实战测评全纪录,轻松搞定潦草手写汉字、模糊PDF扫描件、模糊复杂表格,效果炸裂超过人眼!支持Open WebUI 🚀🚀🚀视频简介: ✅企业知识库搭建不再愁!本地私有化部署最强开源OCR模型InternVL3-14B,彻底解决敏感扫描件处理难题,保障数据安全,精准识别模糊古籍、复杂代码,附带LMDeploy本地部署与OpenWebUI交互完整指南 ✅本视频详细演示了如何在本地部署开源模型InternVL 3来进行OCR识别,避免敏感数据经由第三方API泄露。 💻 从环境配置到模型部署,再到OpenWebUI交互,全流程手把手教学! 🚀 通过多场景测试,包括: ✏️ 潦草手写体识别 🧾 模糊小票内容提取 📄 复杂表格结构识别 📜 古籍文字识别 📊 流程图转Python代码 ⚙️14B参数版本在识别效果与资源需求间取得完美平衡! #ocr #InternVL3 #internvl #ai #aigc #
00:00 / 13:11
连播
清屏
智能
倍速
点赞
1179
杨博士说AI
6天前
Deepseek OCR2应用了Qwen模型框架 #AI #Deepseekocr2 #qwen #大模型
00:00 / 02:35
连播
清屏
智能
倍速
点赞
64
千问大模型
10月前
消费级显卡也能跑!QwQ-32B本地部署教程来了! #QwQ #通义千问 #AI #人工智能
00:00 / 01:49
连播
清屏
智能
倍速
点赞
9119
玉七零【教程👀简介】
9月前
Qwen-VL模型LoRA微调训练 实现微调视觉模型实战!草履虫也能轻松上手~大模型|LLM|多模态模型 #ai #人工智能 #大模型 #多模态大模型 #大模型学习
00:00 / 30:03
连播
清屏
智能
倍速
点赞
91
kate人不错
3月前
Qwen3 VL 实测横评:4B/8B/A3B/A22B 本期带你上手 Qwen3‑VL 系列最新进展与全流程实测:从 235B‑A22B 到 30B‑A3B,再到更适合本地的 4B/8B。围绕图像→提示词反推、JSON 结构化、OCR、网页克隆与复杂图理解等真实任务,逐项对比速度、准确度与可用性。 你将看到: - 4B/8B/A3B/235B 不同定位与官方宣称性能对照 - LM Studio + Open WebUI 三开同测,6‑bit 量化的实际体验 - 反推 AI 绘图提示词:输出完整度与建议质量差异 - JSON 格式化提取与 OCR:正确率与遗漏点分析 - 网页克隆(视觉 Coding):代码行数与相似度对比 - 速度基准:token/s 实测,A3B vs 8B - 关键结论与选型建议 TL;DR: - 235B‑A22B 仍是综合最强;A3B 多数任务更稳更快;8B 在局部任务更好;数学题 4B 罕见反超 8B。 - 本地优先 A3B(更快、更全),对特定场景再对比 8B;追求纯效果且算力足,首选 235B‑A22B。 - 注意公平性:官网 235B‑A22B 未量化,本地测试为 6‑bit 量化,结果仅作参考。 时间戳 00:00 Qwen3‑VL 性能 03:56 上手实测
00:00 / 13:03
连播
清屏
智能
倍速
点赞
54
InfoQ
1周前
DeepSeek又“偷袭”了!OCR 2正式开源。这次最大的亮点是把阿里Qwen2当成了“视觉之眼”,LLM架构正在全面吞噬传统视觉模型。🚀 #DeepSeek #AI #Qwen2 #识字 #成本低 #InfoQ @抖音创作小助手
00:00 / 01:40
连播
清屏
智能
倍速
点赞
21
IT咖啡馆
11月前
苹果看上它了?阿里最强视觉模型 Qwen2.5-VL测评解析 最近看到有新闻说,Apple选择阿里云 作为中国地区的AI提供商,而阿里云正好发布了Qwen2.5-VL视觉模型,这会不会是为此而做的铺垫呢?今天来带大家一起解析这个新开源模型,中国不止DeepSeek,Qwen也很不错。 #人工智能 #大模型 #阿里云 #阿里 #苹果
00:00 / 09:26
连播
清屏
智能
倍速
点赞
437
AI超元域
9月前
本地部署最强OCR大模型olmOCR!支持结构化精准提取复杂 本地部署最强OCR大模型olmOCR!支持结构化精准提取复杂PDF文件内容!完美识别中英文文档、模糊扫描件与复杂表格!本地部署与实际测试全过程!医疗法律行业必备!轻松应对企业级PDF批量转换需求 🚀🚀🚀视频简介: ✅【企业必备】告别低效PDF转换,olmOCR一键提取文档内容完美保留原格式!基于Qwen2 VL 7B模型的olmOCR本地部署全流程,打造PDF提取神器,轻松应对手写笔记、学术论文与多列布局 ✅本视频详细演示了如何在本地部署olmOCR开源项目,实现从PDF文件中提取内容。主要内容包括: 1️⃣使用olmOCR官方demo测试其对英文和中文PDF文件的提取效果。结果显示,无论是英文论文还是中文技术文档,olmOCR都能很好地提取出PDF的文字、图像、表格等内容,并保持原有格式。 2️⃣在Ubuntu系统上本地部署olmOCR。首先安装conda环境和依赖包,然后克隆olmOCR项目并测试PDF提取效果。 3️⃣使用Gradio创建Web UI,方便用户通过网页上传PDF并使用olmOCR提取内容。提取结果可以显示为纯文本、HTML网页预览,并给出PDF元数据信息。 4️⃣使用不同PDF样本文件进一步测试本地部署的olmOCR提取效果。结果表明,即使是质量较差的PDF扫描件,或者以表格形式展示的PDF,olmOCR也能很好地提取并还原原始内容。 🚀🚀🚀时间戳: 00:00 - 项目介绍:olmOCR的背景与用途,解决PDF转Markdown和纯文本的需求 01:17 - 官方demo测试:展示olmOCR处理英文和中文PDF文件的实际效果和输出质量 03:42 - 本地部署准备:安装Miniconda、创建虚拟环境和必要依赖,克隆项目到本地环境 05:04 - 命令行功能测试:使用官方命令测试PDF提取功能,检查提取结果的准确性 05:50 - Gradio界面构建:创建交互式UI界面,提升用户体验,便于日常操作使用 07:03 - 多类型PDF测试:测试中文文档、模糊扫描件和复杂表格文件的提取效果 09:12 - 总结与资源获取:回顾olmOCR优势和应用场景,提供代码和资源获取方式 #olmocr #ocr #ai #aigc #大模型
00:00 / 09:27
连播
清屏
智能
倍速
点赞
193
刘靖峰-峰哥讲AI
9月前
最佳本地OCR模型在实际使用对比
00:00 / 06:48
连播
清屏
智能
倍速
点赞
15
kate人不错
2月前
Qwen3‑VL 在本地怎么选更稳 llama.cpp 新 Web UI 真的香 本期你将收获: - 如何快速上手 llama.cpp 新 Web UI(安装、启动、功能全览) - Qwen3‑VL 32B/A3B 与 Gemini 2.5、Claude Sonnet 4 的多场景实测对比 - GGUF vs MLX 的真实差异:OCR/边界框/长图/反光/复杂版式等 - JSON 模式、PDF 当图像、HTML/JS 内联、URL 参数输入等“提高生产力”的新功能 - 何时选 Unsloth/GGML 的 GGUF 版本,避免 LM Studio 版本问题 - 4B‑Thinking 与 Omni‑3B 的“思考力/语音理解”实测与适用场景 - 我的结论: - 本地优先选 GGUF(GGML/Unsloth),llama.cpp 新 Web UI 体验非常好 - 32B 在多数场景下更稳更准,A3B 速度快但有场景差异 - MLX 量化存在精度/边界框问题,社区正在修复 时间戳 00:00 开场 & 上期更正 02:24 llama.cpp 新 Web UI 上手 03:31 Qwen3‑VL‑32B 亮点与基准 04:20 多模型实测对比 09:01 GGUF vs MLX 实测 17:04 4B‑Thinking/Omni‑3B 实测
00:00 / 18:56
连播
清屏
智能
倍速
点赞
30
AGI_Ananas
5月前
本地部署gemma3:4b识别pdf对比qwen多模态api 这期视频带大家实测 Gemma3:4B 本地部署 与 Qwen 多模态 API 在 PDF 识别上的表现。 🔹 实验场景: Gemma3:4B → 完全本地运行,无需显卡,纯 CPU 测试 Qwen 多模态 → 通过官方 API 调用,处理同一份 PDF 🔹 对比维度: 文本提取与理解能力 格式化输出(TXT / JSON) 运行速度与资源消耗 本地部署 vs API 调用的优劣势 想知道小模型在本地能不能打?本地运行和云端 API 之间差距到底有多大?视频里给你一手答案! 如果你对 多模态模型、PDF 解析、AI 本地部署 感兴趣,这期视频千万不要错过~ #Gemma3 #Qwen#本地部署大模型#多模态模型 #人工智能
00:00 / 03:39
连播
清屏
智能
倍速
点赞
20
阿里云
2月前
把世界“说给”盲人听!国内首款AI助盲眼镜,基于通义千问打造 #助盲 #公益 #盲人 #出行安全
00:00 / 04:33
连播
清屏
智能
倍速
点赞
3640
Ai随风
3月前
Qwen3—VL本地安装保姆级教程(附工作流和模型) #runninghub #comfyui #ai #qwen #ai视频
00:00 / 11:56
连播
清屏
智能
倍速
点赞
75
卢松松
1周前
DeepSeek 半夜更新 OCR 2,用的竟然是阿里的 Qwen #人工智能 #阿里云 #大模型
00:00 / 01:26
连播
清屏
智能
倍速
点赞
116
深度极客
11月前
只有3B的视觉模型,可本地部署! 近期,Convergence AI 发布了一个轻量级的网页自动化助手模型 Proxy-lite。这是一个基于 Qwen 2.5-VL-3 B-Instruct 微调的 3 B 参数视觉语言模型 (VLM),能够自主完成网页浏览和操作任务。 #人工智能 #AI #机器学习 #大模型
00:00 / 00:30
连播
清屏
智能
倍速
点赞
2234
aiaihaozhe9527
11月前
Qwen2.5VL-3B-4bit多模态 windwos整合包,本地部署,16G显存,#ai #ai本地部署 #ai整合包
00:00 / 00:45
连播
清屏
智能
倍速
点赞
4
AI超元域
8月前
Docling本地配置从入门到精通保姆级教程轻松OCR扫描件 🚀支持视觉大模型的开源PDF解析+OCR工具!Docling本地配置从入门到精通保姆级教程!支持LM Studio+InternVL3-9B与Gemini2.5 Pro轻松识别解析模糊PDF扫描文件 #docling #ocr #lmstudio #gemini #ai 🚀🚀🚀视频简介: ✅【企业知识库必备利器保姆级教程】免费开源神器docling震撼来袭!PDF秒变Markdown,扫描文档轻松识别,比付费工具还强大,支持调用InternVL3和Gemini 2.5 Pro模型 📄 本期视频将详细演示了IBM开源的docling PDF文档解析工具的使用方法! 🛠️ 视频分为三个部分: 1.基础使用- 用Python代码和命令行直接解析PDF转Markdown 2.本地模型 - 配合LM Studio调用InternVL3-9B模型处理扫描版PDF 3.云端API- 使用Gemini 2.5 Pro模型获得顶级OCR效果 💻 通过简单代码将复杂PDF文档成功转换为Markdown格式,连表格和图像都能完美保留。 🔬 针对扫描版PDF,视频展示了如何调用开源视觉模型InternVL3实现精准OCR识别。对于要求更高的场景,还演示了调用Gemini 2.5 Pro API,连模糊不清的扫描文档都能完美解析! ⚡ 通过docling配合视觉模型,企业知识库项目能轻松处理各种文档格式,大幅提升工作效率! 📋 视频详细讲解了每个步骤的代码实现,包括模型配置、API调用、批量处理等功能,适合开发者学习参考。 🎯 最终效果让人惊艳 - 连emoji表情、引用格式、模糊文字都能准确提取,成功率极高!
00:00 / 09:31
连播
清屏
智能
倍速
点赞
175
麻雀虽小智能庆哥
3周前
本地化部署与推理轻量化开源大模型 Qwen3-VL-Embedding Qwen3-VL-Reranker 多模态信息检索与跨模态理解 我很傲娇玩技术很开心 #科研 #日常 #武汉 #大模型
00:00 / 05:37
连播
清屏
智能
倍速
点赞
23
HalfAI
6天前
一键部署 Moltbot(Clawdbot),新手也能搞定! 那么如何部署一个属于自己的Moltbot(Clawdbot)呢?本地部署的话会比较复杂,新手不太友好,而且有可能会产生一系列的安全问题。对于小白来说,通过云服务部署一个Moltbot是最快最安全的办法。像是阿里云、腾讯云等国内的云服务商都推出了一键部署的功能。今天呢,我来教给大家如何通过腾讯云快速简单的一键部署Moltbot,并且将它接入飞书。 *本期视频全程无广,请放心食用
00:00 / 07:52
连播
清屏
智能
倍速
点赞
1680
老吴聊技术
1年前
Dify借助Qwen2-VL多模态模型识别发票信息实战 #图像识别 #dify工作流 #Qwen2VL #多模态 #识别发票
00:00 / 08:46
连播
清屏
智能
倍速
点赞
57
智驭导师授AI
2月前
本地最新版本Ollama跑Qwen3-VL,扫CT片、工单 本地最新版本Ollama跑Qwen3-VL,扫CT片、工单、瑕疵,本地搭配不二选择
00:00 / 01:24
连播
清屏
智能
倍速
点赞
5
玉七零【教程👀简介】
3月前
Qwen2.5-VL:微调多模态大模型!实现目标检测任务~ 环境配置+模型微调+模型部署+效果展示详细教程!大模型|LLM|多模态大模型 #大模型 #多模态模型 #模型微调 #AI #人工智能
00:00 / 36:21
连播
清屏
智能
倍速
点赞
449
磊哥聊AI
5天前
零成本!手把手教你5分钟部署Clawdbot顶配助手! 本地部署+免F模型+某书=24小时真工作助手!
00:00 / 13:46
连播
清屏
智能
倍速
点赞
7864
程序员孙旭
10月前
用Qwen-VL + DeepSeek,搭建智能监控系统! #ai #人工智能 #程序员 #大模型 #deepseek
00:00 / 08:40
连播
清屏
智能
倍速
点赞
2376
Ai刘秘书
5天前
超详细本地部署Moltbot操作指南 全球都在聊的Moltbot,安装教程来啦 本视频详细介绍了 Moltbot 的安装 #moltbot #clawdbot #moltbot安装部署 #AI刘秘书 #AI
00:00 / 08:19
连播
清屏
智能
倍速
点赞
193
是但求其发
2周前
参数越大越强?聊聊大模型里的 8B 32B 120B 普通用户如何通过 FlowyAIPC 将 Qwen、DeepSeek、ChatGPT 等主流大模型 快速部署到本地电脑运行,无需复杂配置,数据全程本地可控。 #大模型 #chatgpt #千问 #deepseek #科普
00:00 / 02:33
连播
清屏
智能
倍速
点赞
91
小天
1周前
去年做的Qwen3VL测评 做的Qwen3VL测评,发上来给抖音的伙伴们看看 ##qwen3##qwen3vl##多模态
00:00 / 09:55
连播
清屏
智能
倍速
点赞
147
AI探秘人
1年前
阿里最新视觉模型:Qwen2-VL 实时画面理解、逻辑推理。#爱情 #人工智能 #通用人工智能 #AI工具 #大模型 #大语言模型 #视觉模型 #Qwen2-VL #实时画面理解 论文地址:https://qwenlm.github.io/blog/qwen2-vl/
00:00 / 00:12
连播
清屏
智能
倍速
点赞
57
DK数据工作室
6月前
通义千问Qwen2.5-VL-7B 多模态大模型本地Windows10系统部署展示
00:00 / 02:54
连播
清屏
智能
倍速
点赞
3
熊猫王
1天前
RTMP服务器V2发布 RTMP服务器V2发布啦,增加了网页直接打开播放地址播放的功能,性能更好,硬件要求更低,操作更简单。而且支持WindowsPhone手机。#windowsphone #lumia #windows手机
00:00 / 07:27
连播
清屏
智能
倍速
点赞
14
DK数据工作室
6月前
通义千问Qwen2.5-VL-7B 多模态大模型本地部署展示
00:00 / 02:54
连播
清屏
智能
倍速
点赞
3
李哈利
4天前
ClawdBot最近爆红,但你真的用对了吗? ClawdBot 最近爆红,但你真的用对了吗?这样装=电脑可能已被入侵 ClawdBot 最近非常火,但安全性问题其实被很多人忽略。 如果你是直接照网路随便的教学安装, 你的电脑、API Key、甚至整个系统,很可能已经暴露在风险中。 这支影片我会完整教你: ClawdBot 最常见、也最危险的错误安装方式 为什么很多人「看起来能用」,其实已经被开后门 正确、安全的 ClawdBot 安装流程 使用时一定要注意的安全设定与最佳实践 不管你是新手还是已经在用 ClawdBot, 这支影片都建议一定要看完一次。 影片内容使用了AI生成技术 #ai #aiagent #AI工作流 #n8n #AI智能体 #无编程 #ClawdBot #看一看长视频
00:00 / 09:11
连播
清屏
智能
倍速
点赞
59
AI-KSK
6天前
洗图变体神器:反推+4K放大一条龙 ,Z-Image Base开源实测:Qwen3-VL反推一键洗图变体,分块放大冲近4K!支持局部重绘,简单生图测评与结论 #ZImage #高清放大 #局部重绘 #ComfyUI #RunningHub
00:00 / 04:16
连播
清屏
智能
倍速
点赞
42
titan909
1年前
Qwen2.5-VL多模态模型实时调用摄像头进行图像识别 #Qwen多模态模型
00:00 / 06:18
连播
清屏
智能
倍速
点赞
45
Ai剪辑助手
8月前
万物识别,可做机器人了,本地部署和Qwen2.5VL整合包 今天给大家带来一个本地部署的开源多模态整合包,Qwen2.5-VL。它支持处理文本、图像、视频和文档, 能精准识别常见物体、深度解析图像中的文本与图表;在视频理解上,可定位超 1 小时长视频中的关键事件。 它的应用领域超广泛,安全监控精准预警、电商智能推荐、文档信息快速提取。更惊艳的是,在机器人领域, 它助力机器人精准识别环境与指令,实现灵活导航与交互,让智能自动化再升级! 开源地址:https://github.com/QwenLM/Qwen2.5-VL 整合包链接:https://pan.quark.cn/s/1f87386b4226@DOU+小助手
00:00 / 01:47
连播
清屏
智能
倍速
点赞
13
电磁波Studio
1月前
快速生图三剑客:Z-Image、ControlNet、Qwen3-VL,支持姿势/深度/边缘控制生图! 🎬 结合Z-Image、ControlNet与Qwen3-VL三大模型,上传参考图即可通过姿势、深度、边缘等控制条件,快速生成神似原图的图片。无需高端设备,消费级显卡也能流畅运行! ✅ 工作流核心: 1️⃣ Qwen3-VL:自动分析图片,生成详细描述词。 2️⃣ ControlNet:提供姿势/深度/边缘等控制生图。 3️⃣ Z-Image:接收指令,快速生成高清大图。 👉 跟着教程,轻松玩转Z-Image生态,实现“模仿生图”。 #ai新星计划 #comfyui #comfyui教程 #zimage #runninghub
00:00 / 04:07
连播
清屏
智能
倍速
点赞
2831
Ai剪辑助手
1年前
程序可以识别图片视频了,分享最新视觉理解大模型 分享Qwen2-Vl本地整合包。AI图片、视频理解,图片、视频对比,基于图片、视频的问答、对话、内容创作等方式 我根据开源代码制作了Qwen2-Vl本地整合包 2B 整合包,该整合包修改了装入大图片和视频显存就溢出的bug,优化了部分代码。有需要源代码的朋友请私信:视频识别,无法私信的请留言,我手动发您。 官方项目地址:https://github.com/QwenLM/Qwen2-VL 72B线上体验:https://huggingface.co/spaces/Qwen/Qwen2-VL@DOU+小助手
00:00 / 02:05
连播
清屏
智能
倍速
点赞
55
皮哥不是猪
6天前
#ai #clawdbot 一行代码搞定大龙虾和本地ollama,不要再傻傻的去浪费你的token 啦,快来搭建你的第一个贾维斯吧#ai助理
00:00 / 00:30
连播
清屏
智能
倍速
点赞
44
新手NAS入坑指南
4天前
最新 飞牛 nas 2月安全漏洞 #飞牛
00:00 / 02:15
连播
清屏
智能
倍速
点赞
34
夫夫pay
1周前
Gemini3pro电脑手机使用教程 使用Gemini3pro的平替方法 #Gemini
00:00 / 01:31
连播
清屏
智能
倍速
点赞
59
王知风
11月前
本地部署大模型千问2.5详细教程 #qwen #qwen2.5 #千问2.5 #整合包 #本地部署
00:00 / 08:11
连播
清屏
智能
倍速
点赞
38
北京王律团队
1天前
自己用VPN“翻墙”看外面信息,违法吗? #王双启律师 #北京刑事律师
00:00 / 00:40
连播
清屏
智能
倍速
点赞
2
人工智能培训咨询老师叶梓
7月前
多模态大模型实践入门(其它部分在同名视频号里) 叶梓老师将带您从零开始,结合实际案例,快速理解多模态大模型技术的核心要点。1小时课程涵盖Stable Diffusion、LLaVA、Qwen-VL等模型及其应用效果,帮助学员掌握文生图、视觉问答等核心技能,开启人工智能的创新实践之旅。#ai #编程 #人工智能培训 #人工智能讲师
00:00 / 16:13
连播
清屏
智能
倍速
点赞
4
五分钟懂论文
5天前
🚀炸裂! Google放出核弹,本地也能跑Gemini3! Google 开放“核弹级”模型权重:Gemma 3 Technical Report!这不仅是参数的升级,更是本地部署、长文本处理的一次革命!🚀 🌟 一眼看清:Gemma 3 与 Gemini 3 的血缘关系 : Gemini 3 是 Google 闭源的“旗舰母舰”,代表 AI 算力的天花板,只能花钱调 API。 Gemma 3 是 Gemini 3 技术研究成果的开放权重(Open Weights)版。 Google 像“教导主任”一样,把 Gemini 3 的核心秘籍通过知识蒸馏,完美压缩进了 Gemma 的小身材里。 📌 核心点: 显存焦虑终结者! 独家 5:1 混合注意力机制(局部:全局 = 5:1),让 128K 超长文本不再是“显存杀手”,KV-cache 占用直降 80%。 4B 参数,27B 智商! 凭借顶级的蒸馏操作,4B 版本的性能竟能追平前代 Gemma 2 #google #gemini #gemini3 #大模型 #chatgpt #人工智能 #AI #Google #Gemma3 #Gemini3 #本地部署AI #开放权重 #多模态大模型 #显存优化 #程序员 #人工智能 #技术干货 #科普
00:00 / 03:51
连播
清屏
智能
倍速
点赞
20
大东学长
3周前
PyCharm配置本地运行的DeepSeek模型,从此再无代码报错!#pycharm #pycharm配置环境 #Python #编程
00:00 / 02:00
连播
清屏
智能
倍速
点赞
32
WANGZER|AI
3月前
2025年10月23日AI新闻速递 1. OpenAI 发布 AI 浏览器 Atlas!改变你的上网方式。 2. iOS 26.1 测试版发布!液态玻璃效果新增调节选项。 。3. 手机也能跑视觉大模型!阿里通义 Qwen2-VL 上新。 4. 谷歌推 Vibe Coding!非技术人员也能轻松开发 AI 应用。 5. 腾讯开源混元世界模型 1.1!单卡秒速生成 3D 场景。 6. 顶流 BLACKPINK 破圈!Jennie 发布免费韩文字体 ZEN SERIF。 7. 百川 M2Plus 医疗大模型发布!高分通过 USMLE 医师资格考试。 8. 奇瑞机器人突破 L3 级别!剑指全球 13 万台销量。
00:00 / 01:03
连播
清屏
智能
倍速
点赞
13
龙哥紫貂智能
5月前
qwen-image开源,MMDiT架构 使用flow-grpo强化学习 直接使用mllm语义提取器 晚上10点龙哥直播间手搓
00:00 / 00:59
连播
清屏
智能
倍速
点赞
108
大模型知识分享
9月前
用DeepSeek+Qwen-VL,搭建医学肿瘤诊断系统! #Deepsek #AI #大模型 #大模型即将改变世界 #AI医学
00:00 / 10:39
连播
清屏
智能
倍速
点赞
64
太公の望ミ
6天前
Tripool 在台湾绝对别用!用Uber! 含泪说实话#旅行
00:00 / 00:15
连播
清屏
智能
倍速
点赞
1
KeyVox效率实验室
6天前
Clawdbot被Anthropic制裁!KeyVox崛起 震惊! Clawdbot 被 Anthropic 制裁, 改名 MoltBot - KeyVox 崛起成新宠! KeyVox全新改版上线啦,升级语音效率助手 语音输入法+PC本地Agent 可以说是国内可用的语音版cowork 大家赶紧升级吧 https://keyvox.ai #ai #cowork #Clawdbot #MoltBot #KeyVox
00:00 / 01:33
连播
清屏
智能
倍速
点赞
0
简介:
您在查找“
qwen-vl-ocr本地能用吗
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-02-04 06:29
最新推荐:
离开游戏挂机无畏契约怎么解除惩罚
恋与星空歌曲
先回眼神再回头无论怎么讲
穿越火线判官的答案是什么
新艾比要怎么演奏然后刷新?
萧湖千灯会门票
陈长生得了什么病
怎么装配沙锤演奏艾比
粉尾猫音符玩具怎么使用
苏里南怒兆火山可以把装备放进冰箱
相关推荐:
你说你不懂为何在这时牵手dj版
允恩秘书怎么了
梦幻新门派弥勒山怎么去
完美的焊接
这个年纪最好玩
我的性格情报为什么打不开
他说他打不开
涵涵和杨天宇成了嘛
叶伊德专属撤离点怎么拉
蛋仔派对怎么可以把艾米放在背包里
热门推荐:
boss直聘微信搜不到对方怎么办
手机电子税务局密码明明正确总是错误
千川乘方上线时间
超自然怎么看解封时间
生产总览在哪
野草助手里面党辈的口令是多少
抖音商城天天领福利
主页简介长文案怎么改
支付宝黄金没支付怎么取消
新大红暗影燃料单元为什么电脑按不了