大家好!今天给大家分享一个非常实用的工作流——一键将视频转换成文本,并进行润色排版的 N8N 工作流。
备注:本篇文章也是用此工作流生成的,有简单的修改和完善,比如这段话和里面的配图。
视频演示
https://www.bilibili.com/video/BV12L1YBnEEk/
工作流特点
- 支持多种视频源
- 本地视频文件。
- 抖音在线短视频。
- 不限时长
- 无论视频长短都能处理。
- 完全免费
- 音频转文本无需付费。
工作流展示

执行时间
工作流的执行时间和视频的时长大概是 1:1,例如我处理的视频时长是 5 分钟多,执行的时间也大概是 5 分钟多一点,以下是这个视频执行的日志统计时间:

核心实现流程
1.视频源判断
- 网络地址:通过 MCP 获取无水印视频下载地址。
- 本地地址:直接使用现有文件。
- 格式转换
- 使用 FFmpeg 将视频转换为 MP3 格式。
- 将文件转换为二进制格式。
- 文本转换
- 调用硅基流动的免费 AI 服务。
- 将音频转换为文本。
- 润色排版
- 大模型对文本进行润色。
- 自动排版优化。
- 转换为二进制保存。
技术要点
- FFmpeg:本地需要安装 FFmpeg 插件。
- API 服务:使用硅基流动的免费音频转文本 API,免费且无并发限制。
最终成果
工作流最终在 d:\videos 文件夹中生成:
- 音频文件
- 排版精美的文本文件(video.txt)
这个工作流真正实现了从视频到高质量文案的自动化处理,无论是内容创作还是信息整理都非常实用!赶快动手试试吧!
我是磊哥,每天分享一个干货内容。
特殊说明
以上内容来自我的《AI大模型应用开发》 系列课,这些课程为视频+图文版,深入浅出学习了大模型应用开发的各种技术,例如系统学习了 LangChain、N8N、Python、Spring AI、Spring AI Alibaba、LangChain4j、Dify、Agent、AI 实战项目、AI 常见面试题等,其中包含:MCP、Function Call、RAG(简单、原生、高级应用)、向量数据库(Milvus、RedisStack)、Prompt工程、多模态、向量数据库、嵌入模型、100+ AI 实战案例。手把手教你快速、系统掌握大模型应用开发的核心技术。
如果对此课程感兴趣,请加我微信:vipStone【备注:LLM】
