期待你的分享

0%

音视频技术笔记(1)

本系列主要记录音视频处理技术相关的内容,供参考。

常见文件与编码格式

WAV

RIFF格式存储、44.1K采样率、音频格式为PCM,16位采样位数,文件大小=采样率x采样位数x时间x省道(除以8,1Byte=8Bit)

  • RIFF:Resource Interchange File Format
  • 采样率:每秒从连续信号中提取并组成离散信号的采样个数,单位Hz,采样率越高,音质还原的越好

MP3

原名MPEG-1或MPEG-2 Audio Layer 3,相比WAV,进行了大量压缩,主要是舍弃人类听觉不重要的部分,常见速率有128kbit/s、192kbit/s、320kbit/s

RM、RMVB、RV、RA

RM:RealMedia,RealNetworks公司创建的专用多媒体容器格式,文件扩展名多为’.rm’,一般是CBR(固定码率)编码

RMVB:支持可变码

不需要下载完整文件即可播放,可以根据不同的网络传播速率制定不同的压缩比率

支持的Chunk类型:.RMF(文件头)、PROP(文件属性)、MDPR(流属性)、CONT(内容描述)、DATA、INDEX(文建索引)

RV:RealNetworks独有的视频编码格式,RA是公司专有的音频编码格式

MPG

文件后缀:“.mpg“或”.mpeg“,内含两种文件格式:PS(节目流)、TS(传输流),后缀名可能是”m2p“、”.ps“、”.ts“

PS:由一个或多个PES组成,其中每个流有一个时间基准,用来存储

TS:一个TS(或传输流)文件包含一组SubStream(PES),可以是视频、音频、MJPEG或JPEG2000的图片、字幕或EPG。每个流都被分解组装到288字节大小的包中(EPG:Electrionic Program Guide)

WMV、WMA、ASF、MMS、AVI

WMV:后缀可能为”.asf”或”.wmv”

WMA:后缀为”.wma”

AVI:Audio Video Interleaved,支持非常广泛的音视频编码格式,包括较新的H.264、HE-AAC等。AVI由RIFF格式衍生,文件结构分为头部、主题、索引三部分

MOV、MP4、3GP

MOV:QuickTime File Format,苹果公司创建,可以包含一个或多个Track,每个Track存储:视频、音频、字幕中的一种类型的数据,每个Track又由一个层次分明的Object结构组成(每个Object又叫Atom)。

MP4:几乎完全基于QuickTime文件格式,还有另外一些文件名后缀,如”.mpa”、”.m4v”等

3GP:常被称为3GPP文件,由3GPP组织定义的文件格式。

FLV、F4V

随着Flash发展而发布的,适用于流媒体传输的视频格式

MKV

后缀名多为”.mkv”,另有适用于单一音频的”.mka”文件和独立的字幕文件”.mks”

AC3

Dolby Digital格式,又称作AC3,是杜比公司开发的一系列有损或无损音频格式中的一种,标准名称为ATSC A/52,俗称5.1,因为音频内容包含5个不同的基础声道(右前、中、左前、右后、左后)以及一个低频声道,常见码率有384kbit/s,448kbit/s。

近年来杜比又开发了全景声技术,但和AC3/EAC3技术不兼容。

H.263、MPEG4

H.263:ITU-T为视频会议设计的低码率视频编码标准,与MPEG4编码格式的设计存在很多相似之处,目前被认为已经过时

H.264

MPEG-4 AVC

H.265

High Efficiency Video Coding,简称HEVC,支持最高8K分辨率

AAC

德国Fraunhofer-Gesellschaft协会下设80多个研究所,为了比MP3得到更好的压缩性能,联合AT&T、杜比公司、索尼和诺基亚一起,设计了AAC格式。

WEBM、VP9、OGG、Vorbis

WEBM:Google资助,采用Matroska格式为基础进行封装,内部采用On2 Technologies开发的VP8和后续版本VP9视频编码器以及Vorbis、Opus音频编码器。

Vorbis:有损音频编码格式,由Xiph.Org基金会领导开发,通常以Ogg作为容器格式,所以也被常称作为OGG音频

APE

无损音频编码格式,可以保证解码出来的音频和原文件听起来完全一样