これからの楽音圧縮符号化技術に必要なもの



前回、「これ以上の圧縮は難しいんじゃないか?」って事を俺は書いた。
参考リンク
俺は、これからの楽音圧縮符号化に主に必要なものは

  • 低遅延化
  • パケットロス耐性

だと思っている。
平たく言えば、今までの楽音圧縮符号化は主に
「効率的な記録」に対する側面から研究が行われてきた。
つまり、MDみたいに記録メディアに対して
「いかに少ないビットレートで質の良い音楽を作れるか」って事だよね。
このために、様々な技術が考案された。
例えば、ブロックノイズ等の
フーリエ変換の弱点を克服するための信号分解法として、
「フィルタバンク」、「MDCT」、「ウェーブレット」が開発された。
それに関連して、マスキング現象を利用して聞こえない音の成分を
カットする人間の聴覚特性の利用。
あとは、周波数信号の包絡を少ないビット数で表す
「線形予測法」の一種である「LSP」とか「PARCOR」。
あるいは、圧縮の理論限界である
エントロピーに限りなく近づける「ベクトル量子化」等、
ここ20年で、とてつもなくこの分野は進歩した。


しかし、これらの技術はすべてある仮定している。それは、

  • 圧縮プロセスに対して、どれだけ遅延が出ても構わない。
  • 圧縮ビット列に対して、パケットロスやバースト誤りはない。

って事だ。
この条件って、楽音の記録って面に対してはいいんだろうけど
リアルタイムに双方向通信しようとすると、なかなか難しい。
遅延が大きければ、相手に届くまでに時間差が生じるし
パケットロスがあると、著しく音質が悪くなる。
これをどうにかすることで、CD品質の双方向通信を達成できないもんかね?