RIFF | это... Что такое RIFF? (original) (raw)

RIFF (англ. Resource Interchange File Format) — один из форматов файлов-контейнеров для хранения потоковых мультимедиа-данных (видео, аудио, возможно текст). Наиболее известными форматами, использующими RIFF в качестве контейнера, являются: AVI (видео), WAV (аудио), RMI (MIDI-треки).

Формат RIFF использует little-endian порядок байтов (младший байт идёт первым). Для машин с форматом данных big-endian предлагался формат RIFX, однако из-за существенно меньшей в бытовом секторе популярности компьютеров с таким форматом данных, RIFX не прижился, в настоящее время формат RIFF воспроизводится и на машинах с big-endian порядком байтов.

Изначально RIFF имел принципиальное ограничение размера данных в 4 ГБ (точнее, максимальный размер файла 2^{32}+7 байт). В силу особенностей ряда популярных программ по созданию и воспроизведению файлов (в большой степени из-за медиастека в Microsoft Windows) ограничение усилилось до 2 ГБ (из-за замены в парсерах RIFF’а DWORD на signed int32). Для поддержки файлов больше 4 ГБ формат AVI был расширен до AVI-DV, выходящего за рамки контейнера RIFF. На базе RIFF предложено расширение RF64, позволяющее работать с 64-битными числами для размеров chunk'ов, разработанное European Broadcasting Union.

Формат RIFF является адаптацией формата IFF для little-endian компьютеров (в основном, ради PC на 80x86). Разработан он был в 1991 году компаниями Microsoft и IBM. (IFF был создан в 1985 году).

Содержание

chunk

Основной концепцией RIFF-формата является chunk, порция данных с заголовком и сигнатурой, указывающей на содержимое chunk’а.

Формат chunk’а:

FOURCC ckID сигнатура chunk'а
DWORD ckSize размер данных chunk'а
BYTE[] ckData сами данные chunk'а

Если chunk содержит нечётное количество байт, то после него добавляется один байт. Таким образом chunk’и всегда выравнены на границу в 2 байта.

FOURCC

FOURCC (от англ. Four Character Code) — последовательность из четырёх символов, используемая для идентификации каких-либо данных. В отношении RIFF — это ckID (идентификаторы chunk’ов) и типы форм. В отношении видеопотока FOURCC обычно используется для идентификации кодека (например, «XVID», «DIV3», «MP43»). FOURCC занимает 4 байта; это размер 32-битного числа, так что иногда FOURCC записывают в виде числа (представления числа в ASCII little-endian).

Например:

FOURCC число (шестнадцатеричное) число (десятичное)
'RIFF' 0x46464952 1179011410
'AVI ' 0x20495641 541677121
'XVID' 0x44495658 1145656920
'idx1' 0x31786469 829973609

Два типа chunk’ов RIFF и LIST могут содержать внутри себя вложенные chunk’и. Весь файл представляет собою единый RIFF-chunk (это одна из причин ограничения размера файла).

ckID для chunk’ов самого формата RIFF всегда записываются большими буквами ASCII. В chunk’ах внутренних форматов (использующих RIFF), таких как AVI или WAV, ckID записывается маленькими буквами. Если ckID содержит две или три буквы, недостающие до 4-х символов байты заменяются пробелами (AVI → 'AVI ').

Форма записи

Для удобства записи в спецификациях используется следующая форма записи формата chunk’а:

ckID( ck)

Например, запись для AVI-файла: RIFF('AVI ' LIST('hdrl' avi_header) LIST ('movi' movi) [idx1]). (Квадратные скобки указывают на необязательность элемента.)

Стандартные chunk’и

RIFF

Chunk с ckID = 'RIFF' имеет следующую структуру ckData:

FOURCC FormType тип содержимого
BYTE[] ck содержимое

Наиболее распространённые типы:

Другие типы:

LIST

Chunk 'LIST' имеет формат, аналогичный RIFF, первые 4 байта содержат ListType (тип вложенного chunk’а), далее до конца чанка следуют вложенные chunk’и. В рамках формата AVI внутри LIST содержатся chunk’и с заголовком файла, заголовками потоков. Так же chunk LIST используется для хранения информации о содержимом.

JUNK и PAD

Для выравнивания блоков данных по размеру сектора на носителе для обеспечения скорости перемотки и доступа существуют два chunk’а: 'JUNK' и 'PAD' , которые «ничего не значат» и пропускаются программами воспроизведения. Изначально предполагалось, что при создании файла эти chunk’и будут просто заполнены нулями, однако некоторые программы редактирования видео хранят там свою сигнатуру. (Например, так поступает Virtual Dub).

Запись chunk’ов в сокращённой нотации:

JUNK (filler) PAD (filler)

INFO

INFO — специальный ListType для хранения информации о содержимом файла. INFO не влияет на то, как программы работают с файлом, эта информация (большей частью) показывается пользователю. Назначение INFO подобно назначению mp3-тегов. Список chunk’ов для INFO:

Ссылки

Просмотр этого шаблона Медиаконтейнеры
Видео/аудио 3GPASFAVIBink • DMF • DPX • EVO • FLVMatroska (MKV) • WebM • MPEG-PS • MPEG-TSMP4MXF • NUT • OggOgg MediaQuickTimeRealMediaSmackerRIFFVOBсравнениесжатие
Аудио AIFFAPE • AU • DSDDXDMLPMP3FLAC • SHN (англ.) WAVWMAсравнениесжатие
Графические форматы (сжатие)
Растровые Без потерь: BMPFPXGIFICOILBMJBIGPCXPNGPNMPSDRAWTGAWBMPXCFВключая сжатие с потерями: EXRICERJBIG2JPEG / JP2 / JPEG-LSJPEG XR (HD Photo) • PGF (англ.) • TIFFWebPАнимационные: APNGGIFMNG
Векторные AICDREMFEPSPSSVGWMFXPSАнимационные: SVGSWF3D: 3DSVRMLX3D
Комплексные CGMDjVuPDF