AAC-LCの意味や定義 わかりやすく解説 Weblio辞書 (original) (raw)

この項目では、音声圧縮の方式について説明しています。その他の用法については「AAC (曖昧さ回避)」をご覧ください。

AAC

拡張子 .3gp .3g2 .aac .avi .m2ts .m4a .m4b .m4p .m4r .mov .mp4 .wav .mkv .mka
MIMEタイプ audio/aac, audio/aacp, audio/3gpp, audio/3gpp2, audio/mp4, audio/MP4A-LATM, audio/mpeg4-generic
種別 非可逆圧縮
包含先 AVI MP4 MPEG-2システム MOV WAV Matroska
国際標準 ISO/IEC 13818-7, ISO/IEC 14496-3

Advanced Audio Coding(略称: AAC、先進的音響符号化)は、不可逆のデジタル音声圧縮を行う音声符号化規格のひとつである。1997年ISO/IEC JTC 1Moving Picture Experts Group (MPEG) において規格化された。MP3の後継フォーマットとして策定され、一般的にAACは同程度のビットレートであればMP3より高い音声品質を実現している。

AACはISOIECにより、MPEG-2およびMPEG-4仕様の一部として標準化された。MPEG-4 Audio内のHE-AACとして知られるAACの一部は、DAB+やDigital Radio Mondiale、モバイルテレビジョン規格のDVB-やATSC-M/Hのようなデジタル無線規格においても採用されている。

AACは一つのストリームに、48の全帯域幅(最大96kHz)音声チャンネルを持たせることができ、さらに、16の低周波効果音(LFE、120Hzまで)チャンネルと16の対話チャンネル、および16のデータストリームも含めることができる。ステレオの音質は96kbpsのジョイントステレオモードで適度な要件を満たすことができるが、Hi-Fi透明性(低雑音性)のためには、少なくとも128kbpsのデータレート(VBR)が必要である。MPEG-4 Audioによる検証では、AACが128kbpsのステレオおよび320kbpsの5.1チャンネルオーディオにおいてITUが「透明的」として規定している要件を満たしていることが示されている。

AACはYouTubeiPhoneiPodiPadNintendo DSiNintendo 3DSiTunesDivX Plus Web Player、PlayStation 3ノキアのSeries 40携帯電話における既定もしくは標準の音声フォーマットである。PlayStation VitaWiiソニーウォークマンMP3シリーズとその後継機種でもサポートされている。AACはインダッシュの車載オーディオシステムのメーカによってもサポートされている。

概要

MP3等のMPEG-1 Audioや、MPEG-2 Audio BC (Backward Compatible) を超える高音質・高圧縮を目的に標準化された方式である。

MPEG-2 Audio BCとは異なり、符号化アルゴリズムにおいてMPEG-1 Audioとの互換性はない。ファイルに格納した場合の拡張子は、「*.mov,*.mp4,*m2ts,*.m4a,*.m4b,*.m4p,*.3gp,*.3g2」または「*.aac」。なお、放送ではADTS (Audio Data Transport Stream) と呼ばれるヘッダ形式で伝送されることが多い。サンプリング周波数はMP3が最大48kHzまでだったのに対し、AACは最大96kHzまで対応している。また、ビットレートはMP3が最大320kbpsなのに対し、AACは最大((チャンネル数)×(サンプリングレート)×6[1])bpsである[2]

種類

MPEG-2 AACとMPEG-4 AAC

AACにはMPEG-2 AAC (ISO/IEC 13818-7) とMPEG-4 AAC (ISO/IEC 14496-3, Subpart 4) とが存在する。MPEG-4 AACは、MPEG-2 AACにPNSやLTPといった追加技術を利用可能としたものであるが、基本的なアルゴリズム自体に違いはなく、追加技術を使用しなければヘッダの一部分が1ビット異なるだけであり、通常の使用では区別する必要はほとんどない。

PNS (Perceptual Noise Substitution)

PNSは、エンコード時に低減されたノイズを記録する追加技術である。

LTP (Long Term Prediction/長期予測)

LTPは、低周波帯域の波形を記録する追加技術である。

AACプロファイルと追加技術

プロファイル

AACにも拡張機能が使用可能かどうかによって幾つかの種類があるが、一般的に利用されているのはAAC-LC (AAC Low Complexity) と呼ばれる基本機能だけを用いるものである。

MPEG-2/4 AAC-Main

メインのAACとして開発された方式。AAC-LCと比べると、圧縮率は高いものの演算量が多く、再生負荷が大きい。

WEBブラウザGoogle Chrome[3]が対応しているものの、Windows[4]Android[5]iOS[6]といったプラットフォームでは標準では対応しておらず(もしくはMainプロファイルについての情報が公開されていない)、あまり普及しているとは言えない。

MPEG-2/4 AAC-LC (Low Complexity)

AAC-Mainから後方予測 (backward prediction) の機能を除いた方式。AAC-Mainよりも音質は劣化するが、再生負荷が小さい。

MPEG-2/4 AAC-SSR (Scalable Sample Rate)

周波数によって4つのブロックに分解し、それぞれを符号化する方式。

さらにMPEG-4 AAC-LTP(後述)をプロファイルに数える場合がある。

追加技術

MPEG-4 AAC v3においては、SBR (Spectral Band Replication) やパラメトリックステレオ (Parametric Stereo) 技術によって64 kbpsを下回るような超低ビットレートにおける品質を改善する**HE-AAC** (High-Efficiency AAC) が追加承認されている (AAC-LC, HE-AAC (aacPlus, AAC+SBR), HE-AAC Version 2 (aacPlus Version 2, Enhanced aacPlus, AAC+SBR+PS))。

MPEG-2/4 HE-AAC (High-Efficiency AAC)

AAC-LCにSBRの機能を追加したもの。SBRは高周波域の波形を補完するツールである。SBRを利用することで低ビットレートでも中~高音質の再生を可能としている。

バージョン2が開発されて以降、区別のため、名前の後ろに”version 1”などを付ける場合がある。

MPEG-2/4 HE-AAC v2 (High-Efficiency AAC version 2)

AAC-LCにSBRとPSの機能を追加したもの。PS (Parametric Stereo) はモノラルの音声を擬似的にステレオに復元するツールであり、HE-AACよりもさらに低いビットレートで中 - 高音質の再生を行えるようにする。

MPEG-4 xHE-AAC (eXtended High-Efficiency AAC)

AAC-LCにSBRとPS、USACの機能を追加したもの。USAC (Unified Speech and Audio Coding) は声と音楽のどちらの音質にも重きが置かれるよう作られたツールであり、HE-AAC v2より低いビットレートでもある程度の音質が確保される。

MPEG-4 AAC-LTP

AACにLTPの機能を追加したもの。LTPはすべてのMPEG-4 AACに付加することが可能である。

MPEG-4 AAC-LD (Low Delay)

エンコードなどによる延滞時間を減少させたAAC。テレビ電話などで使用することを目的としている。

MPEG-4 AAC-ELD (Enhanced Low Delay)

MPEG-4 AAC-ELD v2 (version 2)

AAC-LDを改良した方式。

MPEG-4 SLS (Scalable Lossless Coding)

MPEG-4の可逆圧縮の一種。AACと組み合わせたものをHD-AACと呼ぶ場合がある。

利用状況

MPEG-2 AACは主に日本のBS/110度CS 2Kデジタル放送地上デジタル波放送ISDB規格やSD-AudioのAACフォーマット、ヨーロッパ圏のDVDなどで利用できる。北米や日本のDVDでは、AACではなくAC-3DTSが採用されている。

MPEG-4 AACはiPodなどのデジタルオーディオプレーヤーPlayStation PortableDSiなどのゲーム機、日本のBS/110度CS 4K/8Kデジタル放送、携帯電話等、多くの機器やソフトウェアがサポートしている。また、第三世代携帯電話用の動画フォーマットである3GPP3GPP2音声圧縮方式としても採用されている。

音楽配信サービスでは、パソコン、iPod向けの**iTunes Storeや携帯電話向けの着うた**でAACが採用されている。ただし、これらのファイルの一部にはDRMが導入され、同じAACであるが互換性がないものがある[7]。デジタルオーディオプレーヤーの代表格であるiPodおよびiTunes(標準でAACを使用する)がAACに対応していることもあり、以前はAACに対応していなかったソニーやパナソニックケンウッド(現・JVCケンウッド)などのデジタルオーディオプレーヤーも現在ではAACに対応している。

またアップルでは前述のiTunesでの音楽配信のほか、ワイヤレスイヤホンマイクAirPodsスマートスピーカーHomePodや、FaceTime(AAC-ELD系)[8]などで使用している。

符号化アルゴリズム

AAC (AAC-LC) の符号化処理は以下の流れで行われる。

  1. MDCTによる直交変換
    • 入力は窓長 2048 もしくは 256 のMDCTを用いてそれぞれ 1024 点 (long block)、128 点 (short block) の周波数領域のデータに変換される。MP3が一旦時間領域のフィルタで 32 サブバンドに分割した後にMDCTを行っていたのに対し、AACでは入力サンプルに対してそのままMDCTが行われる。
    • 変換長は、入力信号の性質によって切り替えられる(アタック音など時間領域で急峻な変化を見せる信号にはshort blockが使われる)。long blockが576点相当(32 サブバンド × 18 点)、short blockが 192 点相当(32 サブバンド × 6 点)であったMP3と比較してlong blockをより長くすることで周波数解像度の向上による符号化効率の改善がshort blockをより短くする事で時間解像度の向上によるプリエコー抑制力の改善がなされている。
  2. TNS
    • 周波数領域の信号を、時間軸のものと見なした線形予測を行う。
    • 周波数領域でのARモデル化は時間領域でのノイズ特性を持ち、人間の聴覚の持つ継時マスキング特性を再現するのに都合が良い。
    • この処理は省く事ができる。
  3. ステレオ・コーディング
    • 入力信号がステレオの場合は、ステレオ特有の性質を利用した符号化が行われる。
    • なおステレオ・コーディングはサブバンド毎に利用しなかったり、どちらか片方だけを利用したりすることができる。両方同時に使用することはできない。
    1. インテンシティ・ステレオ
      • 左右の信号を、単一の信号と定位情報のみに削減して符号化する。
    2. MSステレオ
      • 左右の信号を和/差信号とする。
  4. 量子化
    • 聴覚心理モデルで決定した許容量子化雑音エネルギーと量子化雑音エネルギーが比例するようにスケールファクタ・バンド(近い周波数のMDCT係数をまとめたグループ)毎に量子化を行う。long blockのスケールファクタ・バンドの数は49 (44.1kHz) であり、21 であったMP3と比較して細かい制御が可能になっている。
  5. ハフマン符号
    • 量子化された値を固定ハフマン符号化する。符号帳は 11 種類の中からサブバンド毎に選択される。

コンテナ対応

備考

AACはドルビーラボラトリーズも共同開発の一員で、AACロゴはドルビーラボラトリーズの登録商標である(日本国特許庁商標登録番号:第4693750号)。AACにはドルビーのほかAT&TFraunhofer IISソニーノキアの特許技術が使用されている[9]ためソフトウェアメーカーなどから納付されたライセンス料はこれらの企業に分配されている。また、ライセンス管理はドルビーの子会社Via Licensingが行っている。

なおMPEG-4 AACが含まれるMPEG-4 AudioのカテゴリにはNTTサイバースペース研究所が開発したTwinVQが存在するが、これはAACとは別物である。

利用例

AACやHE-AACは下記に採用されており、実際に利用されている。

脚注

  1. ^ AACの仕様では1024サンプル当たり最大6144bpsと決められているので、1サンプル当たり6144÷1024=6bpsという計算になる。
  2. ^ 例えばCD音質の場合、最大2×44100×6=529200bps=529.2kbpsである。
  3. ^Audio/Video - The Chromium Projects”. www.chromium.org. 2021年5月29日閲覧。
  4. ^Supported Media Formats in Media Foundation, AAC Decoder”. Microsoft. 2021年5月29日閲覧。
  5. ^サポートされているメディア形式 | Android デベロッパー”. Android Developers. 2021年5月29日閲覧。
  6. ^[iPhone/iPad]再生できる音楽ファイル形式を教えてください。 | よくあるご質問(FAQ) | サポート”. ソフトバンク. 2021年5月29日閲覧。
  7. ^ 例えばiTunes Storeでは以前、拡張子が .m4p のAACが配信フォーマットとして用いられていたが、これにはiTunes Store独自のFairPlayというDRMが付加されていたため携帯電話で再生することができなかった。2009年にはiTunes Storeにおいて大半の曲がDRMフリーでリリースされた。ただし一部のメタ情報やデータコンテナの相違から、そのままのオーディオファイルを使用する場合に非互換性が残る場合がある。
  8. ^ 海上忍「いまさら聞けないiPhoneのなぜ 格安SIMでもFaceTimeオーディオは快適に使える?」『マイナビニュース』 マイナビ、2016年1月25日
  9. ^米Dolby、音声圧縮技術「MPEG-4 AAC」特許の一括ライセンスプログラムを開始”. 2002年4月4日時点のオリジナルよりアーカイブ。2002年3月27日閲覧。

関連項目

外部リンク

解説サイト

マルチメディア圧縮フォーマット
動画ファイルフォーマット ISO/IEC MJPEG Motion JPEG 2000 MPEG-1 MPEG-2 Part 2(英語版MPEG-4 Part 2/ASP(英語版Part 10/AVC MPEG-H Part 2/HEVC MPEG-IVVC MPEG-5 ITU-T H.120(英語版H.261 H.262 H.263 H.264 H.265 DV H.266 H.267 SMPTE VC-1 VC-2 (Dirac) VC-3 VC-5(英語版) VC-6 AOMedia AV1 IETF VP8 SAC AVS(英語版) その他 Apple Video(英語版) Bink(英語版) DVI(英語版) EVC(英語版GIFアニメーション Microsoft Video 1(英語版) MSU Lossless(英語版) OMS Video(英語版ProRes 422 ProRes 4444 RTVideo(英語版) SheerVideo(英語版) Smacker(英語版Snow Sorenson Video, Spark(英語版VP6 VP9 WMV YULS(英語版) XVC Xvid 可逆圧縮 FFV1(英語版Ut Video Codec Suite 開発停止 Zlib Cinepak Daala Huffyuv Lagarith(英語版RealVideo RMP4 Indeo Microsoft MPEG-4 QuickTimePixlet Animation(英語版) Graphics(英語版Theora Thor VP3 VP7 XEB XVD
音声ファイルフォーマット ISO/IEC MPEG-1 Layer III (MP3) MPEG-1 Layer II Multichannel(英語版) MPEG-1 Layer I(英語版) AAC HE-AAC AAC-LD(英語版) MPEG Surround(英語版MPEG-4 ALS MPEG-4 SLS MPEG-4 DST MPEG-4 HILN MPEG-4 HVXC MPEG-4 CELP MPEG-D USAC(英語版) MPEG-H 3D Audio(英語版ITU-T G.711 (A-law, µ-law) G.718 G.719 G.721 G.722 G.722.1 G.722.2 G.723 G.723.1 G.726 G.728 G.729 G.729.1 IETF Opus iLBC Vorbis 3GPP AMR AMR-WB AMR-WB+ EVRC EVRC-B(英語版EVS GSM-HR GSM-FR GSM-EFR ETSI AC-3 AC-4(英語版DTS SAC AVS(英語版) DRA(英語版) その他 ADPCM ALAC Codec 2(英語版FLAC Monkey's Audio OptimFROG(英語版PCM WavPack TAK MQA(英語版) 開発停止 ACELP Asao(英語版ATRAC CELT iSAC(英語版La Musepack MT9(英語版) OSQ(英語版PASC QCELP(英語版RealAudio RCELP RTAudio(英語版SD2 SHN SILK(英語版) Siren(英語版SMV Speex SVOPC(英語版VMR-WB TTA TwinVQ VSELP(英語版WMA Bluetooth SBC (codec)(英語版aptX LDAC LC3
画像ファイルフォーマット IEC, ISO,ITU-T, W3C, IETF CCITT Group 4(英語版GIF HEIF HEVC JBIG JBIG2 JPEG JPEG-LS JPEG 2000 JPEG XR JPEG XS(英語版) JPEG XT(英語版JPEG XL Lossless JPEG PNG TIFF TIFF/EP(英語版) TIFF/IT(英語版) その他 APNG AVIF BPG DjVu DNG EXR FLIF(英語版) ICER(英語版ILBM JPEG Network Graphics MNG PCX PGF(英語版) QTVR(英語版TGA WBMP WebP
マルチメディアコンテナフォーマット ISO/IEC MPEG-ES(英語版) MPEG-PES(英語版) MPEG-PS(英語版MPEG-TS ISO base media file format(英語版MPEG-4 Part 14 (MP4) Motion JPEG 2000 MPEG-21 Part 9 MPEG media transport(英語版ITU-T H.222.0 T.802 IETF RTP Ogg SMPTE GXF(英語版MXF 3GPP 3GP and 3G2(英語版) 3GP 3G2 その他 AMV ASF AIFF AVI AU BPG Bink(英語版) Smacker(英語版BMP DivX Media Format DPX DSM EVO(英語版Flash Video (FLV) IFF M2TS(英語版Matroska WebM QuickTime File Format(英語版) (MOV) RatDVD RealMedia RIFF WAV MOD and TOD(英語版) VOB, IFO and BUP(英語版
団体 NETVC(英語版) MPEG LA(英語版
圧縮技術についてはデータ圧縮を、コーデックについてはデータ圧縮・伸張を行うコーデックを参照