MP3歌詞抽出＆タグ一括書き出し術

はじめに

音楽図書館員やアーカイブ担当者、大量のMP3コレクションを管理する熟練ユーザーにとって、埋め込み歌詞はただの飾りではなく、保存すべき一次テキストデータです。近年、ローカル所有のライブラリへと回帰する流れが強まり、歌詞表示をストリーミングサービスだけに頼るのはリスクがあります。ライセンスやエンコードが変わると、ストリーミング側で歌詞が知らぬ間に改変・削除・ずれを起こすことがあるからです。だからこそMP3ファイルから歌詞を抽出する方法、特にID3の UNSYNCEDLYRICS（USLTフレーム）から抜き出す技術は、コレクションのメタデータを長期的に守るために欠かせません。

このガイドでは、埋め込み歌詞の検出・書き出し・検証を大量に行うための手順を詳しく解説します。Mp3tagなどのGUIタグエディタ、Pythonによるコマンドラインやスクリプト処理、安全なファイル名テンプレート、サイドカーファイルの戦略、欠落歌詞を検出して文字起こしに回す方法までカバーします。さらに、コンプライアンスや保存のベストプラクティスを踏まえながら、SkyScribe のような現代的な文字起こしツールを活用し、欠落部分を埋めたり歌詞を扱いやすい形式へ変換するワークフローの組み込み方法も考えます。

埋め込み歌詞を理解する

UNSYNCEDLYRICS とオンライン取得歌詞の違い

よくある誤解として、「プレイヤーに歌詞が表示されているなら埋め込まれているはず」というものがあります。実際は、プレイヤーがオンラインの歌詞を取得し、埋め込みタグと混在表示している場合があります。表示ソースがどちらか分からないことも多いです。確認するには以下の方法があります。

中立的なタグインスペクタで開く – Mp3tag、Kid3、またはバイナリエディタで USLT フレームを探し、実際のテキストが存在するか確認する。
オフライン再生 – ネット接続を切って再生し、表示が消えるかを確認。消えるなら埋め込みではありません。
プレイヤー出力との比較 – 一部のプレイヤーは同期された歌詞（SYLT）や独自クラウド歌詞をUSLTより優先して表示することがあります。

USLTフレームは言語コード（eng や deu など）や説明文（「karaoke」や「booklet」など）で複数存在でき、ツールによっては最初の1つしか表示しない場合があります。これを誤解すると、フォーマット変換の際に歌詞が失われたと勘違いすることもあります。

ID3タグバージョンの落とし穴

ID3タグのバージョンやエンコードの違いは歌詞の見え方に大きく影響します。

ID3v2.3 と ID3v2.4：v2.4でUTF‑8の歌詞は、ISO‑8859‑1を想定するv2.3専用ツールでは表示されないことがあります。
複数タグの併存：同じファイルにID3v1、ID3v2、APEタグが共存し、読み取りが不一致になるケース。
FLACとMP3の違い：FLACはID3ではなくVorbisコメント（LYRICS）を使うため、形式を混在させると特定の環境でしか見えない“幽霊歌詞”が発生します。

書き出し前に可能な限りタグバージョンを統一し、全ツールで安定して抽出できる状態にしておくことが重要です。

タグエディタで一括書き出し

Mp3tagの手順

Mp3tagはタグフィールドをもとにしたカスタムファイル名テンプレートで書き出しができます。例えば：

```
%artist% - %title%.txt
```

とすると、MP3のタグにもとづきテキストファイルを作成し、同じ階層に保存します。歌詞が USLT にある場合は %unsyncedlyrics% を使います。バージョンや設定によっては %lyrics% が別のフィールドにマッピングされる場合もあります。

注意点：

文字の安全化：ファイル名に使えない文字（/、\`、:, `?, *）は削除・置換する。
衝突回避：同じ曲名がある場合 %track% や %album% を付加する。
タグ保持：書き出しは読み取り専用に設定し、埋め込みメタデータは変更しないこと。

Mp3tagの書き出し機能は数千ファイルを一度に処理できますが、まず少数でテストし、フィールドの対応や改行の保持を確認しましょう。

Pythonによるスクリプト書き出し

より細かく自動化したい場合は、mutagen や eyeD3 のようなPythonライブラリでUSLTフレームを読み取ります。スクリプトなら以下のようなことが可能です。

言語コード指定：複数言語がある場合、好みのフレームだけ選択。
バージョン対応：タグを解析・再エンコードして統一。
ログ記録：欠落や壊れたタグを記録して後で確認。
バッチ処理：全コレクションに再実行可能なロジックで適用。

例（mutagen使用）:

```python
from mutagen.mp3 import MP3
from mutagen.id3 import USLT
import os

def export_lyrics(mp3_path, out_folder):
audio = MP3(mp3_path)
lyrics_frames = audio.tags.getall('USLT')
for frame in lyrics_frames:
if frame.lang == 'eng':
filename = f"{audio.tags['TPE1'].text[0]} - {audio.tags['TIT2'].text[0]}.txt"
filename = filename.replace('/', '_')
with open(os.path.join(out_folder, filename), 'w', encoding='utf-8') as f:
f.write(frame.text)
```

こうしたスクリプトなら、欠落歌詞の検出や自動的な文字起こしツール（例：SkyScribe）への連携も容易に行えます。

欠落歌詞の検出

どれほど丁寧に集めたコレクションでも、インスト曲や“N/A”などのプレースホルダー、フレームそのものの欠如など、抜けはあります。検出には以下の簡単な基準が有効です。

USLTフレームなし：USLT が全くない場合をフラグ。
最低文字数：一定文字数未満ならプレースホルダーの可能性大。
パターンマッチ：正規表現で明らかなダミーを検出。

検出結果を文字起こしのキューとして活用できます。オンラインソースやAVコンテンツからの安全な抽出には、SkyScribeの即時文字起こしのようなツールを使えば、メディア全体をダウンロードせずに直接アップロードやリンク処理が可能です。

書き出し形式とサイドカーファイル戦略

埋め込み歌詞は以下のような外部形式で保存できます。

TXT形式：人間が読める、アーカイブや全文検索に適した形式。
LRC/SRT/VTT：タイムコード付きでカラオケや同期表示に対応。USLTから変換するには時間情報が必要ですが、なくても整列メタデータを保持可能。
並列ディレクトリ構造：artist/album/track.txt のように、音声ライブラリと同じ構成で保存して再リンクを容易にする。

USLTを“マスター”として扱い、メタデータ編集後にサイドカーを自動生成するアーカイブ管理者もいます。即座にカラオケ用字幕が欲しい場合は、SkyScribeの自動セグメント化などを使って、生テキストから一貫性のあるタイムスタンプ付き字幕フラグメントに整形することができます。

大量書き出しの検証

自動化しても検証は必要です。スケールに対応するチェックリストは以下の通りです。

抜き取り検査：ランダムなサイドカーファイルを埋め込み歌詞と比較して忠実性を確認。
整合性チェック：処理したMP3数と書き出しファイル数を一致させ、1曲1ファイルになっているか確認。
チェックサム・サイズ：ファイルサイズやハッシュで切り捨てやエンコードエラーを発見。
エラーログ：読み飛ばしたファイルや失敗を記録し、スクリプトが成功済み項目をスキップできるようにする。
エンコード確認：互換性のため、書き出しはUTF‑8（または選択した標準）に統一。

こうした検証で、歌詞を検索可能データベースに取り込む際にも信頼できるテキストから開始できます。

フォルダ構造と後処理

計画的なフォルダ構成は後々の混乱を防ぎます。

ミラー構造：/lyrics/ 以下に音声ディレクトリ構造をそのまま再現。
形式別フォルダ：/lyrics/txt/ と /lyrics/srt/ や /lyrics/lrc/ を分ける。
言語コード分類：多言語の場合は /lyrics/eng/, /lyrics/deu/ のように分類。

後処理の例：

SRT/VTT変換：カラオケや字幕プロジェクト向け。
検索インデックス化：TXTファイルをローカル検索エンジンやアーカイブカタログに組み込み。
同期監査：埋め込みテキストとサイドカーを比較し、内容の乖離を検出。

これらをスケジュール実行すれば、メタデータ更新に合わせて歌詞書き出しを常に最新に保てます。

まとめ

MP3ファイルからUSLT/UNSYNCEDLYRICSフレームを抽出できる技術は、音楽図書館員やアーカイブ担当者にとって文化的データの一次層を保存する力となります。ストリーミングの不安定さに備え、全文検索や同期表示に活かせる正確な歌詞データは非常に価値があります。タグの精査、一括書き出し、スクリプト、欠落検出を組み合わせれば、完全で検索可能な歌詞アーカイブを構築し、コレクションの完全性を守れます。欠落データや構造化形式への変換、字幕同期には、SkyScribe のようなコンプライアンス準拠の文字起こし環境を利用すれば、原データから整形された再利用可能なテキストへの移行がスムーズになります。

よくある質問

1. UNSYNCEDLYRICS（USLT）と同期歌詞（SYLT）の違いは？ USLTはタイミング情報のないテキストで、閲覧や保存に向いています。SYLTは各行にタイムスタンプがあり、カラオケや同期再生に対応します。

2. 他のタグを変更せずに歌詞を書き出せますか？ 可能です。GUIタグエディタもスクリプトライブラリも読み取り専用で歌詞を抽出し、アルバムアートなど他のメタデータは保持できます。

3. プレイヤーに表示されるのに埋め込まれていない歌詞があるのはなぜ？ 一部のプレイヤーはオンラインDBから歌詞を取得します。埋め込みを確認するにはタグエディタでファイルを検査し、オフライン再生してみましょう。

4. USLTフレームに複数言語がある場合どう扱いますか？ 書き出しの際に希望する言語コード（例：eng）を選ぶか、バイリンガル出力にしたい場合はフレームを統合します。多くのツールは最初に見つけたフレームしか表示しません。

5. 大規模に欠落歌詞を検出する最適な方法は？ USLTフレームがない、またはプレースホルダーがあるMP3を自動で検出するスクリプトが有効です。それらをコンプライアンス準拠の文字起こしツールに回し、メタデータの空白を埋めます。