00:00 / 12:45
连播
清屏
智能
倍速
点赞854
00:00 / 01:10
连播
清屏
智能
倍速
点赞2
AI 自动给视频起名?这个开源工具太强了 你的视频文件夹是不是长这样?一百个视频全叫 IMG_零几零几,完全分不清哪个是哪个。手动改名?改完人疯了。 今天介绍一个开源项目叫 AI Video Rename,它做的事情很简单:指向一个文件夹,一键运行,所有视频自动获得有意义的名字和描述。 这个工具的能力可以拆成七个要点。第一,多模态内容理解,不仅看视频画面,还提取音频做语音转写,同时截取多张关键帧。第二,并发 流水线架构,GPU 只跑 Whisper 语音转写,其他任务全部并行,处理一百个长视频吞吐量拉满。第三,零拷贝极速元数据写入,用 ExifTool 就地重写,毫秒级完成,几十 GB 不用等半天。第四,精确时间戳保留,通过 Windows 底层 kern32 API 和 UTC+8 时区校正,重命名后的视频完全保留原始创建和修改时间。第五,开箱防乱码,专门针对中文 Windows 环境处理了所有 subprocess 管道通信、ExifTool 中文路径、GBK 终端的乱码问题。第六,多模型后端,默认 Google Gemini,也支持 OpenAI 兼容接口,GPT-4o、通义千问、智谱 GLM 随便切换。第七,软水印防重复处理,二次运行时毫秒级跳过已处理的视频,不会浪费 Token。 技术架构方面,工作流程分四个阶段。初始化探测阶段用 ffprobe 快速提取时长和音量信息。解耦并发阶段将带音频的视频推送到 GPU 专用 Whisper 转写队列,同时 CPU 队列并行提取关键帧。合并交接阶段用双锁同步机制,听觉和视觉材料全部凑齐后立即推进。最后 AI 判断收尾阶段调用多模态模型生成标题描述,再用 ExifTool 无损注入元数据。 安装使用也很简单。Python 3.11 以上,一行 pip install 搞定所有依赖。AI 后端支持 Gemini 和 OpenAI 兼容接口两种配置方式。运行就是一行命令加文件夹路径,想先预览效果可以加 --dry-run 参数。 项目地址:github.com/cuicui-V5/video_ai_rename,觉得有用请给项目点个 Star,也欢迎在评论区告诉我你的使用体验。#vibecoding
00:00 / 05:38
连播
清屏
智能
倍速
点赞2
00:00 / 03:37
连播
清屏
智能
倍速
点赞250
00:00 / 00:13
连播
清屏
智能
倍速
点赞34
00:00 / 00:46
连播
清屏
智能
倍速
点赞16
00:00 / 01:23
连播
清屏
智能
倍速
点赞6
00:00 / 01:30
连播
清屏
智能
倍速
点赞1041
00:00 / 03:51
连播
清屏
智能
倍速
点赞NaN
00:00 / 03:22
连播
清屏
智能
倍速
点赞454