本系列主要记录音视频处理技术相关的内容,供参考。
常见文件与编码格式
WAV
RIFF格式存储、44.1K采样率、音频格式为PCM,16位采样位数,文件大小=采样率x采样位数x时间x省道(除以8,1Byte=8Bit)
- RIFF:Resource Interchange File Format
- 采样率:每秒从连续信号中提取并组成离散信号的采样个数,单位Hz,采样率越高,音质还原的越好
MP3
原名MPEG-1或MPEG-2 Audio Layer 3,相比WAV,进行了大量压缩,主要是舍弃人类听觉不重要的部分,常见速率有128kbit/s、192kbit/s、320kbit/s
RM、RMVB、RV、RA
RM:RealMedia,RealNetworks公司创建的专用多媒体容器格式,文件扩展名多为’.rm’,一般是CBR(固定码率)编码
RMVB:支持可变码
不需要下载完整文件即可播放,可以根据不同的网络传播速率制定不同的压缩比率
支持的Chunk类型:.RMF(文件头)、PROP(文件属性)、MDPR(流属性)、CONT(内容描述)、DATA、INDEX(文建索引)
RV:RealNetworks独有的视频编码格式,RA是公司专有的音频编码格式
MPG
文件后缀:“.mpg“或”.mpeg“,内含两种文件格式:PS(节目流)、TS(传输流),后缀名可能是”m2p“、”.ps“、”.ts“
PS:由一个或多个PES组成,其中每个流有一个时间基准,用来存储
TS:一个TS(或传输流)文件包含一组SubStream(PES),可以是视频、音频、MJPEG或JPEG2000的图片、字幕或EPG。每个流都被分解组装到288字节大小的包中(EPG:Electrionic Program Guide)
WMV、WMA、ASF、MMS、AVI
WMV:后缀可能为”.asf”或”.wmv”
WMA:后缀为”.wma”
AVI:Audio Video Interleaved,支持非常广泛的音视频编码格式,包括较新的H.264、HE-AAC等。AVI由RIFF格式衍生,文件结构分为头部、主题、索引三部分
MOV、MP4、3GP
MOV:QuickTime File Format,苹果公司创建,可以包含一个或多个Track,每个Track存储:视频、音频、字幕中的一种类型的数据,每个Track又由一个层次分明的Object结构组成(每个Object又叫Atom)。
MP4:几乎完全基于QuickTime文件格式,还有另外一些文件名后缀,如”.mpa”、”.m4v”等
3GP:常被称为3GPP文件,由3GPP组织定义的文件格式。
FLV、F4V
随着Flash发展而发布的,适用于流媒体传输的视频格式
MKV
后缀名多为”.mkv”,另有适用于单一音频的”.mka”文件和独立的字幕文件”.mks”
AC3
Dolby Digital格式,又称作AC3,是杜比公司开发的一系列有损或无损音频格式中的一种,标准名称为ATSC A/52,俗称5.1,因为音频内容包含5个不同的基础声道(右前、中、左前、右后、左后)以及一个低频声道,常见码率有384kbit/s,448kbit/s。
近年来杜比又开发了全景声技术,但和AC3/EAC3技术不兼容。
H.263、MPEG4
H.263:ITU-T为视频会议设计的低码率视频编码标准,与MPEG4编码格式的设计存在很多相似之处,目前被认为已经过时
H.264
MPEG-4 AVC
H.265
High Efficiency Video Coding,简称HEVC,支持最高8K分辨率
AAC
德国Fraunhofer-Gesellschaft协会下设80多个研究所,为了比MP3得到更好的压缩性能,联合AT&T、杜比公司、索尼和诺基亚一起,设计了AAC格式。
WEBM、VP9、OGG、Vorbis
WEBM:Google资助,采用Matroska格式为基础进行封装,内部采用On2 Technologies开发的VP8和后续版本VP9视频编码器以及Vorbis、Opus音频编码器。
Vorbis:有损音频编码格式,由Xiph.Org基金会领导开发,通常以Ogg作为容器格式,所以也被常称作为OGG音频
APE
无损音频编码格式,可以保证解码出来的音频和原文件听起来完全一样