今さらながらにLameでMP3エンコード

音データをMP3形式にエンコードしようとしている。何を今さら、という声ごもっとも。ただ、自分の場合、MP3よりも圧縮効率がよい、しかも低ビットレートでの音質が比較的よい、という理由で今まではWindows Media Audio (WMA)形式でエンコードしてきたので、まじめにMP3でエンコードするのは初めて。

音データのエンコードはWMAで、というのは、「歌詞データのMP3形式音ファイルへの埋め込み」にも書いたが、2001年、ちょうどWMA8が登場した頃に自分なりに調べて出した結論だ。その後WMA9が登場したが、情勢は変わってないように思える。まぁMP3の仕様に変更があったわけじゃないのだから、進歩するWMAがよりよくなるのは当たり前といえば当たり前だ。

ところが。MP3には歌詞データを埋め込めることや、なんといってもMP3の普及率が高く、DVDプレーヤのような家電製品でもCD-R(W)メディア上のMP3ファイルを再生できるようになって、MP3に浮気したくなった。やはり、デ・ファクト・スタンダードは強い。潰しがきく。なんといっても、友人が去年の誕生日のお祝いにくれた、安物の中古の中国製DVDプレーヤにも、同じ友人が拾ってきてくれたこんなのばっか)TVセットに内蔵されているDVDプレーヤも、MP3ファイル再生をサポートしているのが決め手になった。「長いものには巻かれろ」ともいうことなのかも。

 

さて、CDからのリッピングには、Windows用アプリケーションとしては定番とされるCD2WAVを採用することにした。CD2WAVの現時点での最新版3.25jpは、午後のこ~だというMP3エンコード・エンジンを同梱しているが、CD2WAVの設定ダイアログでの指定が午後のこ~だに正しく伝わっているか今ひとつ確信を持てなかったので、代わりにLameを採用することに決定。
非公式バイナリ配布サイトで配布しているものを利用したが、K-Lite Codec Packを既に利用している場合Lameもあわせてインストールされているかもしれない。

 

ところで、私が自分用にリッピングするときは、語学の教材の音声データであることが大半である。音楽データの場合に比べて、MP3にエンコードするときの要求に関して大きな違いがある。まず、仮にオリジナルがステレオ録音であってもそれを維持する意味がほとんどない。モノーラルで十分。また、高い音質を維持する意味もあまりない。

MP3エンコーディングをする際には、どのようにビットレート、サンプリングレートをはじめさまざまなパラメータを設定するかが重要になる。音楽データに関しては、そういった議論が盛んに行われているのはざっとオンライン検索すればわかるのだが、こういった低音質でいいような音データの扱いについてはほんとど見つからなかった。

唯一参考になったのは、"FMを聞く"。これを読んで、目からウロコの瞬間が。自分でいろいろビットレート、サンプリングレートをいじるのではなく、VBRを選択し、その相対音質パラメタだけ選んで「後はLameにお任せ」という方法があった。

そこで、その作者様と同じく、自分でもテストしてみた。結果が以下の表。テストのベースに使ったのは、CD2WAVでリッピングしたさるフランス語教材の一部で、リッピング時にモノーラルにしてある。44.1kHz, 16bit。Lameでエンコードする際には、-v (VBRを指定)、-V n (nはVBRの質を指定する。0から9で、0が最高、9が最低)、といった当たり前のパラメタ以外に指定したのは -m m (モノーラル指定。この場合入力ファイルがモノーラルなので冗長かも知らないが、念のため)、-h (エンコーディングに時間かけてもいいからなるたけ音質よくしてね、というお願い)の二つ。-V の引数を4以上にしているのは、4がデフォルトだからだ。Lameのコマンドライン・オプションを説明した文書では-Vの引数に5以上を指定するのはお勧めしない、と断ってはいるのだが。

データ

ビットレート
(kbps)

サンプリングレート
(KHz)

ファイルサイズ
(KB)

オリジナル (PCM)

705

44.1

1,506

変換後の
MP3

-V
4

86

44.1

186

-V 5

76

44.1

165

-V
6

65

44.1

142

-V 7

53

32.0

116

-V
8

44

32.0

96

-V 9

64

24.0

66

-V の引数で比較すると、自分の耳と自分の環境(安物の、サブウーハつき小型ステレオ・スピーカ・セット)では、4から7の範囲では、よほど注意して聞かない限り違いが聞き取れなかった。いや、注意して聞いても、判別できるか正直自信がない。8では若干落ちる。だが、この用途に限れば十分すぎる音質だと思った。9になると、音の響き方が機械的に感じられるのと、音の厚みが薄くなったような印象を受けた。理想的とはいえないまでも、この用途に関してはまだ使える。

ファイルサイズに目を向けると、9の場合、8の場合に比べてほぼ1/3減。4の場合に比べるなら、実に1/3だ。ここまでファイルサイズに顕著な差が出るとなると、9も切り捨てるわけには行かない。

自分なりの結論としては、-V の引数としては通常8、で、特にファイルサイズをケチる必要があるときに9、ということだろうか。

広告
カテゴリー: Computers and Internet パーマリンク

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中