大家好!今天给大家分享一个非常实用的工作流——一键将视频转换成文本,并进行润色排版的 N8N 工作流。

备注:本篇文章也是用此工作流生成的,有简单的修改和完善,比如这段话和里面的配图。

视频演示

https://www.bilibili.com/video/BV12L1YBnEEk/open in new window

工作流特点

  1. 支持多种视频源
    • 本地视频文件。
    • 抖音在线短视频。
  2. 不限时长
    • 无论视频长短都能处理。
  3. 完全免费
    • 音频转文本无需付费。

工作流展示

执行时间

工作流的执行时间和视频的时长大概是 1:1,例如我处理的视频时长是 5 分钟多,执行的时间也大概是 5 分钟多一点,以下是这个视频执行的日志统计时间:

核心实现流程

1.视频源判断

  • 网络地址:通过 MCP 获取无水印视频下载地址。
  • 本地地址:直接使用现有文件。
  1. 格式转换
  • 使用 FFmpeg 将视频转换为 MP3 格式。
  • 将文件转换为二进制格式。
  1. 文本转换
  • 调用硅基流动的免费 AI 服务。
  • 将音频转换为文本。
  1. 润色排版
  • 大模型对文本进行润色。
  • 自动排版优化。
  • 转换为二进制保存。

技术要点

  • FFmpeg:本地需要安装 FFmpeg 插件。
  • API 服务:使用硅基流动的免费音频转文本 API,免费且无并发限制。

最终成果

工作流最终在 d:\videos 文件夹中生成:

  • 音频文件
  • 排版精美的文本文件(video.txt)

这个工作流真正实现了从视频到高质量文案的自动化处理,无论是内容创作还是信息整理都非常实用!赶快动手试试吧!


我是磊哥,每天分享一个干货内容。

特殊说明

以上内容来自我的《AI大模型应用开发》 系列课,这些课程为视频+图文版,深入浅出学习了大模型应用开发的各种技术,例如系统学习了 LangChain、N8N、Python、Spring AI、Spring AI Alibaba、LangChain4j、Dify、Agent、AI 实战项目、AI 常见面试题等,其中包含:MCP、Function Call、RAG(简单、原生、高级应用)、向量数据库(Milvus、RedisStack)、Prompt工程、多模态、向量数据库、嵌入模型、100+ AI 实战案例。手把手教你快速、系统掌握大模型应用开发的核心技术。

如果对此课程感兴趣,请加我微信:vipStone【备注:LLM】