转自:http://blog.csdn.net/gavinr/article/details/7183499
1.获取数据
ffmpeg读取mp4中的H264数据,并不能直接得到NALU,文件中也没有储存0x00000001的分隔符。下面这张图为packet.data中的数据
从图中可以发现,packet中的数据起始处没有分隔符(0x00000001), 也不是0x65、0x67、0x68、0x41等字节,所以可以肯定这不是标准的nalu。
其实,前4个字0x000032ce表示的是nalu的长度,从第5个字节开始才是nalu的数据。所以直接将前4个字节替换为0x00000001即可得到标准的nalu数据。
2.获取pps及sps
pps及sps不能从packet获得,而是保存在AVCodecContext的extradata数据域中。如下:
如何从extradata中解析出sps及pps呢?ffmpeg中提供了一个流过滤器"h264_mp4toannexb"完成这项工作,关键代码如下
- //h264_mp4toannexb_bsf.c
- static int h264_mp4toannexb_filter(AVBitStreamFilterContext *bsfc,
- AVCodecContext *avctx, const char *args,
- uint8_t **poutbuf, int *poutbuf_size,
- const uint8_t *buf, int buf_size,
- int keyframe) {
- H264BSFContext *ctx = bsfc->priv_data;
- uint8_t unit_type;
- int32_t nal_size;
- uint32_t cumul_size = 0;
- const uint8_t *buf_end = buf + buf_size;
- /* nothing to filter */
- if (!avctx->extradata || avctx->extradata_size < 6) {
- *poutbuf = (uint8_t*) buf;
- *poutbuf_size = buf_size;
- return 0;
- }
- //
- //从extradata中分析出SPS、PPS
- //
- /* retrieve sps and pps NAL units from extradata */
- if (!ctx->extradata_parsed) {
- uint16_t unit_size;
- uint64_t total_size = 0;
- uint8_t *out = NULL, unit_nb, sps_done = 0, sps_seen = 0, pps_seen = 0;
- const uint8_t *extradata = avctx->extradata+4; //跳过前4个字节
- static const uint8_t nalu_header[4] = {0, 0, 0, 1};
- /* retrieve length coded size */
- ctx->length_size = (*extradata++ & 0x3) + 1; //用于指示表示编码数据长度所需字节数
- if (ctx->length_size == 3)
- return AVERROR(EINVAL);
- /* retrieve sps and pps unit(s) */
- unit_nb = *extradata++ & 0x1f; /* number of sps unit(s) */
- if (!unit_nb) {
- goto pps;
- } else {
- sps_seen = 1;
- }
- while (unit_nb--) {
- void *tmp;
- unit_size = AV_RB16(extradata);
- total_size += unit_size+4;
- if (total_size > INT_MAX - FF_INPUT_BUFFER_PADDING_SIZE ||
- extradata+2+unit_size > avctx->extradata+avctx->extradata_size) {
- av_free(out);
- return AVERROR(EINVAL);
- }
- tmp = av_realloc(out, total_size + FF_INPUT_BUFFER_PADDING_SIZE);
- if (!tmp) {
- av_free(out);
- return AVERROR(ENOMEM);
- }
- out = tmp;
- memcpy(out+total_size-unit_size-4, nalu_header, 4);
- memcpy(out+total_size-unit_size, extradata+2, unit_size);
- extradata += 2+unit_size;
- pps:
- if (!unit_nb && !sps_done++) {
- unit_nb = *extradata++; /* number of pps unit(s) */
- if (unit_nb)
- pps_seen = 1;
- }
- }
- if(out)
- memset(out + total_size, 0, FF_INPUT_BUFFER_PADDING_SIZE);
- if (!sps_seen)
- av_log(avctx, AV_LOG_WARNING, "Warning: SPS NALU missing or invalid. The resulting stream may not play.\n");
- if (!pps_seen)
- av_log(avctx, AV_LOG_WARNING, "Warning: PPS NALU missing or invalid. The resulting stream may not play.\n");
- av_free(avctx->extradata);
- avctx->extradata = out;
- avctx->extradata_size = total_size;
- ctx->first_idr = 1;
- ctx->extradata_parsed = 1;
- }
- *poutbuf_size = 0;
- *poutbuf = NULL;
- do {
- if (buf + ctx->length_size > buf_end)
- goto fail; //buf为NULL时,以下代码将不再执行
- //
- //用于保存数据长度的字节数,是在分析原extradata计算出来的
- //
- if (ctx->length_size == 1) {
- nal_size = buf[0];
- } else if (ctx->length_size == 2) {
- nal_size = AV_RB16(buf);
- } else
- nal_size = AV_RB32(buf);
- buf += ctx->length_size;
- unit_type = *buf & 0x1f;
- if (buf + nal_size > buf_end || nal_size < 0)
- goto fail;
- /* prepend only to the first type 5 NAL unit of an IDR picture */
- if (ctx->first_idr && unit_type == 5) {
- //
- //copy IDR 帧时,需要将sps及pps一同拷贝
- //
- if (alloc_and_copy(poutbuf, poutbuf_size,
- avctx->extradata, avctx->extradata_size,
- buf, nal_size) < 0)
- goto fail;
- ctx->first_idr = 0;
- } else {
- //
- //非IDR帧,没有sps及pps
- if (alloc_and_copy(poutbuf, poutbuf_size,
- NULL, 0,
- buf, nal_size) < 0)
- goto fail;
- if (!ctx->first_idr && unit_type == 1)
- ctx->first_idr = 1;
- }
- buf += nal_size;
- cumul_size += nal_size + ctx->length_size;
- } while (cumul_size < buf_size);
- return 1;
- fail:
- av_freep(poutbuf);
- *poutbuf_size = 0;
- return AVERROR(EINVAL);
- }
一般情况下,extradata中包含一个sps、一个pps 的nalu, 从上面的代码中容易看出extradata的数据格式。分析后的sps及pps依然储存在extradata域中,并添加了起始符。从代码中还可以看出,上面的函数会将sps、pps及packet中的数据,都copy到poutbuf指示的内存中,如果不需要copy到指定内存,直接给buf参数传入空值即可。
3.使用ffmpeg的流过滤器获取sps及pps
流过滤器"h264_mp4toannexb", 在av_register_all()函数中会被注册。用法示例如下:
- int ParseH264ExtraDataInMp4(int stream_id)
- {
- uint8_t *dummy = NULL;
- int dummy_size;
- AVBitStreamFilterContext* bsfc = av_bitstream_filter_init("h264_mp4toannexb");
- if(bsfc == NULL)
- {
- return -1;
- }
- av_bitstream_filter_filter(
- bsfc, format_ctx_->streams[stream_id]->codec, NULL, &dummy, &dummy_size, NULL, 0, 0);
- av_bitstream_filter_close(bsfc);
- return 0;
- }
相关推荐
MP4 格式及在 MP4 文件中提取 H264 的 SPS、PPS 及码流 MP4 格式基本概念 MP4 格式对应标准 MPEG-4 标准(ISO/IEC14496),是 ISO/IEC14496-12(信息技术 视听对象编码的第 12 部分:ISO 基本媒体文件格式/...
FFmpeg是一款强大的开源多媒体处理工具,能够处理多种格式的音频和视频,包括从RTSP流中提取和保存h264码流。下面将详细介绍如何利用FFmpeg完成这个任务。 首先,我们需要理解RTSP(Real-Time Streaming Protocol)...
NAL单元(Network Abstraction Layer Unit)是H264编码的基本传输单位,它将原始的视频数据进行打包,便于在网络上传输。本主题将深入探讨如何使用C++封装一个功能,从文件中读取H264的NAL单元。 首先,我们需要...
以下是一段基于C语言实现的FFmpeg代码片段,展示了如何从输入文件中提取H.264裸码流: ```c #include <libavformat/avformat.h> #include <stdio.h> int GetH264Stream() { int ret; AVFormatContext *ic = NULL...
在Android平台上,调用FFmpeg库来拉取RTSP流并获取H264原始压缩数据(NAL单元数据)是一项常见的任务,特别是在实时视频处理和流媒体应用中。FFmpeg是一个强大的开源多媒体处理框架,它支持多种音频、视频编码解码...
总之,解析PS流以提取H264数据涉及多个步骤,包括理解PS流的结构、识别NAL单元、处理SPS和PPS信息以及利用解码库进行解码。在C#和VS2017环境下,你可以构建一个高效且可靠的解析器,参考提供的博客链接进行更深入的...
一、网络抽象层单元 - NALU ( Network Abstraction Layer Unit ) ...二、H.264 封装模式 - annexb模式 / MP4 模式 1、Annex B 模式 2、MP4 模式 3、Annex B 和 MP4 模式的对比 三、将 MP4 模式 转为 Annex B 模式
在"simplest_ffmpeg_decode"这个例子中,我们可以假设它包含了一个简单的FFmpeg解码示例,可能是一个命令行脚本或者源代码,演示了如何使用FFmpeg库从H.264编码的视频中解码出YUV帧。通过学习这个示例,开发者可以更...
本篇文章将详细探讨如何从H264码流中解析出视频的宽和高。 H264码流是由多个NAL单元(Network Abstraction Layer units)组成的,每个NAL单元包含了一段视频数据或者关键的配置信息。在这些NAL单元中,SPS...
NALU(Network Abstraction Layer Unit,网络抽象层单元)是SVC和H.264/AVC编码中的基本数据单位,用于在网络上传输和解码视频信息。以下是对"nalu.rar_SVC video coding_nalu_svc"中涉及的知识点的详细阐述: 1. ...
这个“GetSliceType”函数可能是从FFmpeg源代码中提取出来的一个实用部分,用于分析H264数据流并确定切片类型。 指数哥伦布编码(Exponential-Golomb coding)是一种无符号整数编码方式,常用于H264等视频编码标准...
当处理H264流时,我们需要识别这些NAL单元并提取其内容,以便FFmpeg的解码器可以正确解析它们。 `av_parser_parse2`是FFmpeg的解析器接口,它允许你分析媒体流并获取解码器需要的信息。这个函数接收输入缓冲区,...
在播放时,如VLC播放器,会首先根据RTP协议解析出H.264原始码流,接着使用解码器(如FFmpeg)对NAL单元进行解码。 H.264原始码流的组织通常遵循特定的顺序,如SPS(Sequence Parameter Sets)—PPS(Picture ...