disgare 的博客
首页
博客
分类
标签
首页
博客
分类
标签
  • 网络

    • 计算机网络学习笔记
    • 网络安全相关
    • 域名和子网掩码
    • CORS 跨域资源共享
    • DNS、HTTP 与 HTTPS
    • Server-Sent Events (SSE)
    • WebSocket 长连接
  • 计算机基础

    • 操作系统 IO 相关知识
    • 操作系统学习笔记
    • 程序的机器级表示
    • 音频文件基础
    • 正则表达式相关概念
    • ffmpeg 的安装以及实现音频切分功能
      • 关于 ffmpeg 的安装
        • mac 下安装 ffmpeg
        • docker 和 linux 下安装 ffmpeg
      • 关于 ffmpeg 使用
        • 在命令行使用
        • 在 java 代码中使用
      • 关于 javacv、ffmpeg-platform 的使用
    • Hex 和 Base64 编码
    • XML 的使用
  • 数据结构与算法

    • 动态规划算法学习笔记
    • 基于比较的排序算法的最坏情况下的最优下界为什么是O(nlogn)
    • 集合与数据结构学习笔记
    • 面试常见算法总结
    • 算法导论第二部分排序学习笔记
    • 算法导论第一部分学习笔记
  • Java

    • 对象之间的映射与转换
    • 反射学习笔记
    • 泛型相关概念
    • 关于 boolean 类型的坑
    • 如何使用 lambda 表达式实现排序
    • CompletableFuture 相关用法
    • CompletableFuture 源码浅要阅读
    • FutureTask 源码阅读
    • Guava 常用 API
    • Guava 源码阅读:Multimap 相关
    • Jackson 的各种使用
    • Java 的 Excel 相关操作
    • java 的常见性能问题分析以及出现场景
    • java 基础知识
    • JAVA 枚举的基础和原理
    • Java 图片文件上传下载处理
    • Java 序列化
    • Java 异常
    • Java 语法糖
    • Java 中关于字符串处理的常用方法
    • Java 中强、软、弱、虚引用
    • JAVA 注解小结
    • Java Http 访问框架
    • Java Stream 的使用
    • Java8 新特性
    • netty 学习笔记
    • Scanner 的各种用法
    • Servlet 学习笔记
    • String、StringBuffer、StringBuilder 学习笔记
  • JVM

    • 虚拟机执行子系统
    • JVM 自动内存管理
    • Linux 中 JVM 常用工具以及常见问题解决思路
  • Linux

    • crontab 表达式
    • Linux 常见命令
    • Linux 文件系统
  • 中间件

    • 关于定时任务原理
    • 详解 kafka
    • ES 搜索引擎
    • flink 提交流程
    • Grape-RAG
    • Hadoop 基础原理
  • 多线程

    • 多线程基础学习笔记
    • 简单了解并发集合
    • 如何手写单例
    • 深入理解 java 多线程安全
    • 生产者消费者问题
    • 线程池作用、用法以及原理
    • AQS 组件
    • ThreadLocal 原理以及使用
  • 非关系型数据库

    • Redis 集群
    • Redis 数据结构、对象与数据库
    • Redis 学习笔记
  • 关系型数据库

    • B+ 树的插入、删除和数据页分裂机制
    • MySQL 的 binglog、redolog、undolog
    • MySQL 的记录存储结构、存储引擎与 Buffer Pool
    • MySQL 基本的特性
    • MySQL 开发规范
    • MySQL 事务与锁与 MVCC
    • MySQL 数据类型、字符集相关内容
    • MySQL 索引与索引优化
    • PostgreSQL 更新数据时 HOT优化
    • PostgreSQL 相关用法
  • Python

    • Python 基础语法
    • Python 学习
  • Spring 项目

    • Lombok 的常用注解
    • maven 小结
    • MyBatis 框架的使用
    • MyBatis 重要知识点总结
    • MybatisPlus 的使用
    • Spring 框架基础使用
    • Spring 事务相关
    • Spring IOC 的原理及源码
    • Spring AOP 的使用和原理
    • SpringBoot 的原理
    • SpringBoot 基础使用
    • SpringWeb 重要知识点
  • 分布式

    • 初步了解 docker
    • 从 ACID 到 BASE 事务处理的实现
    • 访问远程服务
    • 分布式 id
    • 分布式缓存相关问题
    • 分布式集群理论和分布式事务协议
    • 分布式架构的观测
    • 分布式一致性算法
    • 负载均衡 Load Balancing
    • 关于分布式系统 RPC 中高可用功能的实现
    • 集群间数据同步的目的
    • 三高问题下的系统优化
    • 数据库分库分表
    • 详解 Spring Cloud
    • Dubbo 基础概念
    • Gossip 协议
    • nginx 学习笔记
    • Protobuf 通信协议
    • Zookeeper 基础学习
  • 架构设计

    • 参数校验与异常处理
    • 抽象方法与设计模式
    • 代码整洁之道
    • 权限系统设计
    • 用低内存处理大量数据
    • 设计模式——策略模式
    • 设计模式——过滤器模式在 Spring 中的实践
    • 状态模式
    • 统一结果返回
    • 为什么要打日志?怎么打日志?打什么日志?
    • 运维监控常见指标含义
    • 资深研发进阶
    • DDD 架构学习笔记
    • Java 常用的规则引擎
    • MVC 架构学习笔记
  • AI

    • 如何编写 Prompt
    • Agent 工程架构
    • LLM 相关内容
    • NLP 相关知识
    • vibe coding 最佳实践
    • windows 下 ollama 迁移到 D 盘
  • 开发工具

    • 如何画时序图、流程图、状态流转图
    • excel 关于 =vlookup 的用法
    • git 的学习以及使用
    • IDEA 插件推荐
    • IDEA 常用快捷键以及调试
    • Shell 脚本
    • swagger 的使用
  • 前端

    • 简单了解前端页面开发
    • 伪静态是什么
    • GitHub Pages 部署教程
    • Vercel 部署教程
    • vue-admin-template 简单使用
    • VuePress 博客搭建指南
  • 项目

    • 面试刷题网——技术方案
    • 影视资源聚合站——技术方案
  • 问题记录

    • 定时任务单线程消费 redis 中数据导致消费能力不足
    • 提供可传递的易受攻击的依赖项
    • Liteflow 在 SpringBoot 启动时无法注入组件问题 couldn‘t find chain with the id[THEN(NodeComponent)]
  • 金融

    • 股票分析——关于电力
    • 股票技术面——量价关系
    • 股票技术面——盘口
    • 股票技术面——基础
    • 基础的金融知识
    • 基金与股票
    • 韭菜的自我总结
    • 聊聊价值投资
  • 其他

    • 程序员职场工作需要注意什么
    • 创业全链路SOP:从灵光一现到系统化增长的实战指南
    • 观罗翔讲刑法随笔
    • 价格和价值
    • 立直麻将牌效益理论
    • 梅花易数学习笔记
    • 压力管理
2024-09-17
计算机基础
目录

ffmpeg 的安装以及实现音频切分功能

背景是需要在 java 项目中实现一个音频切分的功能,比如用户上传了一个100分钟的视频,我们需要将该音频的前10分钟和最后10分钟切出来,需要切的音频格式包含 mp4、mp3、wav 等常见的压缩文件格式

经过调研发现 ffmpeg 比较适合处理这个,在 java 中有提供对应的封装库 javacv、ffmpeg-platform,当然 java 中也提供了其他的组件去切音频,但是他们的泛用性不如 ffmpeg

本文将从 ffmpeg 的安装介绍起,包含 linux、mac、docker 下的各种安装方式,和该工具在命令行模式、java 代码中的使用,以及该工具对应的封装库 javacv 的使用方式

# 关于 ffmpeg 的安装

# mac 下安装 ffmpeg

在 mac 下安装 ffmpeg,推荐使用 brew 命令。Brew 全称叫 Homebrew,是 Mac 系统上的软件包管理工具。这里的软件并不是指从 AppStore 或从网上下载的 dmg 文件,而是开发所需要用的一些工具软件,如 gawk 等。 只需要一个命令, 安装和卸载它们非常方便

Homebrew 最初是为 macOS 设计的,但后来也被移植到了 Linux 上,使得在类 Unix 的操作系统上也能使用 Homebrew 来管理软件包。虽然 Homebrew 在 macOS 上非常流行,因为它能很好地与 macOS 的系统结构集成,但 Homebrew 在 Linux 上同样有用,尤其是在那些没有强大的包管理系统的发行版上,或者当用户想要在标准包之外安装额外的软件时

安装 brew 方式:MAC 安装 Homebrew (opens new window)

安装完毕后输入:

brew install ffmpeg
1

# docker 和 linux 下安装 ffmpeg

下面说的都是 docker 安装镜像的操作,在 linux 下安装只需要去掉 RUN 即可

对于 Debian 或 Ubuntu 镜像

RUN apt-get update && apt-get install -y ffmpeg
1

Alpine Linux 镜像使用 apk 包管理器,安装 FFmpeg 的方式略有不同

RUN apk add --no-cache ffmpeg
1

如果你使用的是基于 CentOS 的镜像,可以使用以下命令安装 FFmpeg:

RUN yum install -y epel-release && yum install -y ffmpeg
1

后续就是通用的构建镜像并且使用的流程

docker build -t docker-with-ffmpeg .
docker run -it --rm docker-with-ffmpeg bash
1
2

# 关于 ffmpeg 使用

# 在命令行使用

在终端中输入以下命令检查 ffmpeg 是否已经安装

ffmpeg -version
ffmpeg
1
2

操作 ffmpeg 切分视频

ffmpeg -i tempAudio.wav -ss 00:00:00 -t 00:00:10 -c copy splitAudio.wav
1

解释命令参数:

-i tempAudio.wav:指定输入文件为tempAudio.wav。-i参数后面跟的是要处理的输入文件 -ss 00:00:00:设置截取的起始时间。这里的时间是00:00:00,即从音频的开始位置开始截取。-ss参数允许你指定截取片段的起始时间点 -t 00:00:10:设置截取的持续时间。这里的00:00:10意味着截取时长为10秒的音频片段 -c copy:指定编码方式为复制模式。这意味着 FFmpeg 不会重新编码音频数据,而是直接从源文件复制音频流到目标文件 splitAudio.wav:这是输出文件的名称。经过截取后的音频片段将被保存到这个文件中

获取音频文件的时长:

ffprobe -i "path/to/audio_file.mp3" -show_entries format=duration -v quiet -of csv="p=0"
1

解释命令参数:

-i: 指定输入的音频文件路径 -show_entries format=duration: 显示格式中的“duration”条目,即音频文件的持续时间 -v quiet: 设置日志级别为 quiet,只显示错误信息 -of csv="p=0": 设置输出格式为 CSV 格式,其中 p=0 表示不使用管道分隔符,只输出数字

# 在 java 代码中使用

我们可以通过 ProcessBuilder 来调用 ffmpeg 功能。这种方式需要保证我们的机器里已经安装了 ffmpeg,并且 ffmpeg 已经配置到了环境变量里

ProcessBuilder 是 Java 中的一个类,位于 java.lang 包下,用于创建和启动新的系统进程。它是 Java 平台标准库的一部分,提供了高级别的抽象来控制和启动外部进程,允许你在 Java 应用程序中执行操作系统命令或运行其他可执行程序

    private void splitAudio(File file) {
        try {
            String[] command = {
                    "ffmpeg",
                    "-i", file.getName(),
                    "-ss", "00:00:00",
                    "-t", "00:00:10",
                    "-c", "copy",
                    "splitAudio.wav"
            };

            ProcessBuilder pb = new ProcessBuilder(command);
            // 设置执行命令的目录
            pb.directory(file.getParentFile());
            pb.redirectErrorStream(true);
            Process process = pb.start();
            // 确保进程结束
            process.waitFor();
        } catch (Exception e) {
            LOGGER.error("splitAudio error e = ", e);
        }
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

# 关于 javacv、ffmpeg-platform 的使用

javacv 是一个封装了多个计算机视觉和多媒体处理库(包括 OpenCV、FFmpeg 等)的 Java 绑定库,它允许开发者在 Java 中方便地使用这些底层库的功能。导入了 javacv 后,在 java 中使用 ffmpeg 的功能,就不用安装 ffmpeg 了,因为该库已经自带了二进制的 ffmpeg

maven 导入方式

        <dependency>
            <groupId>org.bytedeco</groupId>
            <artifactId>javacv</artifactId>
            <version>1.5.6</version>
        </dependency>
        <dependency>
            <groupId>org.bytedeco</groupId>
            <artifactId>ffmpeg-platform</artifactId>
            <version>4.4-1.5.6</version>
        </dependency>
        <dependency>
            <groupId>org.bytedeco</groupId>
            <artifactId>javacpp</artifactId>
            <version>1.5.3</version>
        </dependency>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

我们主要会使用该库中的 FFmpegFrameGrabber 类,FFmpegFrameGrabber 类提供了从各种来源(如视频文件、摄像头、网络流等)捕获音频和视频帧的能力。它利用 FFmpeg 库的强大功能来处理媒体数据,从而使得在 Java 中进行媒体文件的读取、处理和分析变得相对简单

这里额外提一个坑点,由于使用 ffmpeg 必须要使用 cpp,如果使用 javacpp 这个包,并且 javacpp 如果只放在子包中,在使用的时候会找不到。会出现 java.lang.ClassNotFoundException: org.bytedeco.javacpp.presets.javacpp 问题

这个问题可能的原因是 javacpp 并非传统的 jar 包,它导入的其实是二进制的 cpp 文件,导致依赖传递失效

下面给一个使用 javacv 将音频文件切分的例子:

    public static void audioClip() throws Exception {
        FFmpegFrameGrabber grabber = new FFmpegFrameGrabber("/Users/yfx/Documents/getFile.wav");
        grabber.start();

        FFmpegFrameRecorder recorder = new FFmpegFrameRecorder("/Users/yfx/Documents/getFileOut.wav", grabber.getAudioChannels());
        recorder.setAudioCodec(grabber.getAudioCodec());
        recorder.setAudioBitrate(grabber.getAudioBitrate());
        recorder.setSampleRate(grabber.getSampleRate());
        recorder.start();

        double endTime = 10;

        Frame frame;
        while ((frame = grabber.grabFrame()) != null) {
            if (frame.samples == null) {
                break;
            }

            double timestamp = grabber.getTimestamp() / 1000000.0;
            if (timestamp >= 0 && timestamp <= endTime) {
                recorder.record(frame);
            }
        }

        grabber.stop();
        recorder.stop();
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

这里额外提一点就是,用户上传的文件我们一般是通过 MultipartFile 接受的,而 FFmpegFrameGrabber 可以操作的只是 File 类,因此我们需要先将 MultipartFile 转化成 File 才可以使用 FFmpegFrameGrabber,代码如下:

    public static FFmpegFrameGrabber convertMultipartFileToFFmpegFrameGrabber(MultipartFile file) throws IOException {
        // 创建一个临时文件来存储上传的文件内容
        File tempFile = File.createTempFile("temp_video", ".mp4");
        tempFile.deleteOnExit(); // 确保应用程序退出时删除临时文件

        // 将 MultipartFile 写入到临时文件中
        try (FileOutputStream fos = new FileOutputStream(tempFile)) {
            fos.write(file.getBytes());
        }

        // 使用 FFmpegFrameGrabber 打开临时文件
        FFmpegFrameGrabber grabber = new FFmpegFrameGrabber(tempFile.getAbsolutePath());
        grabber.start();

        return grabber;
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#ffmpeg
最后更新: 1/17/2026, 2:51:21 AM
正则表达式相关概念
Hex 和 Base64 编码

← 正则表达式相关概念 Hex 和 Base64 编码→

最近更新
01
vibe coding 最佳实践
02-24
02
立直麻将牌效益理论
02-23
03
伪静态是什么
02-08
更多文章>
Theme by Vdoing
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式