Back to all articles
Taylor Brooks

AudacityでAU形式音声ファイルを作成する方法

AudacityでAU形式に書き出す手順を解説。レガシー環境向けの設定やサンプルレート、トラブル対処も網羅。

実際に必要な条件を理解してからエクスポートを

個人開発者、音声技術者、古いシステムを扱う研究者などにとって、現代の録音から正しい Sun/NeXT形式の .au ファイル を作成する必要は、たいていレガシー環境との互換性要件から生まれます。 しかし作業に入る前に、Sun .au 形式と Audacity の内部 .au ブロックファイル をきちんと区別しておくことが重要です。

Audacity の内部 .au ファイルは、.AUP.AUP3 プロジェクトの一部として _DATA フォルダ内に保存されますが、標準ヘッダーのない生 PCM の断片にすぎません。プロジェクトファイルなしでは他のソフトで直接読み込むことはできません。 一方、Sun/NeXT の .au 形式は 24 バイトのヘッダーを持つ標準化されたファイル形式で、冒頭のマジックバイト(0x2e736e64)によって旧UNIXやNeXTシステムでも読み取ることができます。タイムスタンプ同期された非圧縮音声を期待する音声認識プラットフォームでも動作します。

混同を避けるための簡易チェックリスト:

  • ヘッダー確認: ffprobe や HEX ビューアで Sun .au に特有の .snd マジックバイトを確認
  • 保存とエクスポートの違い: Audacityでプロジェクト保存をしても内部 .au ブロックファイルしか作られません。Sun .au を作るには「オーディオの書き出し」が必要
  • Audacity外で再生できるか: 標準プレーヤーで再生できない場合は内部ブロックファイルの可能性大

Sun .au が必要かどうかを事前に確認することで、後のインポート失敗や文字起こしのズレを防げます。特にタイムスタンプ付き音声を使う音声認識パイプラインに組み込む場合、この確認は必須です。SkyScribeのようなプラットフォームならリンクやアップロードで直接取り込みが可能で、面倒なダウンロード作業無しにメタデータを保ったまま処理できます。


音声認識精度を高める入力フォーマットの選び方

入力の音声フォーマットは、レガシー互換性だけでなく認識精度にも影響します。特に電話アーカイブや最新のASR向けに構築された音声認識サービスは、タイムスタンプや話者識別精度を左右するサンプルレートやチャンネル構成を求めています。

おすすめ設定の例:

  • 8000 Hz モノラル: 古くからの電話回線やレガシー環境での標準。歴史的データセットや電話録音を Sun .au 化する際に最適
  • 16000 Hz モノラル: 現代のASRエンジン向けの標準。高精度と適度なファイルサイズの両立が可能
  • 非圧縮音声: 圧縮するとチャンネル情報やタイムスタンプが崩れ、認識精度が落ちるため必ず非圧縮で

用途によっては書き出し前にモノラルへミックスダウンする必要があります。Audacityでは [トラック] > [ミックス] > [ステレオをモノラルにミックス] を使うと確実です。

これらの設定はシステム側の期待値に合致し、文字起こしツールがタイムスタンプを正確に保てるため、インタビューや講演、研究 datasets などの精密な対話分析にも適しています。


AudacityでSun/NeXT形式 .au に書き出す手順

Audacityでは、一度操作に慣れれば .au 書き出しは簡単です。以下の手順を守れば、フォーラムやドキュメントでよく見かける失敗を回避できます。

  1. Audacityで編集済みのプロジェクトを開く
  2. 必要ならステレオをモノラルに変換(トラック > ミックス > ステレオをモノラルにミックス
  3. ファイル > 書き出し > オーディオの書き出し を選択
  4. 書き出しダイアログで:
  • ファイルタイプ: その他の非圧縮ファイル
  • ヘッダー: AU (Sun)
  • エンコード: 適切なPCM方式を選択(電話用途なら Unsigned 8 bit、最新ASRなら Signed 16 bit
  1. サンプルレートを設定:
  • 左下のプロジェクトレートで選択、もしくは トラック > サンプリング周波数の変更 で変更
  1. 保存OK

「プロジェクト保存」ではなく「オーディオを書き出す」を使うことで、内部ブロックファイルではなくSunヘッダー付きの正しい .au が出来上がります。


Hexビューアやffprobeでの .au ファイル確認

古いフォーマットを扱う場合、確認作業は必須です。Audacityにはヘッダー確認機能がないため、外部ツールでの検証が必要になります。

ffprobeを使う場合:

```bash
ffprobe -v quiet -print_format json -show_format input.au
```

確認ポイント:

  • format_name"au" になっているか
  • サンプルレート(8000や16000)が正しいか
  • モノラルチャンネルか
  • 選んだエンコード方式に見合ったビットレートになっているか

HEXビューアを使う場合:

  • 先頭4バイトが 0x2e736e64 (.snd)か
  • ヘッダー長が最低24バイトあるか
  • ペイロードの開始位置がヘッダーの仕様に合っているか

この確認を怠ると、エンディアンの不一致やヘッダーの誤りによって、認識パイプラインで読み込みに失敗する原因になります。


よくあるトラブルと対処法

Audacityの書き出し設定は柔軟ですが、レガシー環境は癖が強い場合があります。注意すべきポイントは以下の通りです。

  • エンディアンの違い: Sun .au の一部エンコードはビッグエンディアンを要求。Audacityは多くの場合リトルエンディアンなので要確認
  • ステレオで書き出し: モノラル必須のパイプラインでは読めず、事前にミックスダウンが必要
  • ファイルサイズの不整合: 実際のサイズが (長さ × サンプルレート × バイト数 × チャンネル数) + ヘッダー と一致しない場合は書き出し不良
  • プロジェクトの混同: 保存と書き出しを勘違いすると、.aup ファイルなしでは復元不可能な内部 .au が残ってしまう

大量ファイルの確認には自動検証スクリプトが有効です。バッチ処理では音声を必要な長さに再分割してからASRへ渡すと効率的。私自身も SkyScribeの文字起こし再セグメント機能を利用して、レガシー .au を完璧に整列させてから処理しています。


現代の文字起こしワークフローに .au を組み込む

適切に作ったSun形式 .au が手に入ったら、次はそれを文字起こしに組み込む段階です。 従来は一度ローカルにダウンロードしてから処理することが多かったですが、この方法はストレージ容量の制限やプラットフォームのコンプライアンス問題、手作業の後片付けなどの面倒が付きまといます。

そこでおすすめなのが、リンクやアップロードを直接受け付ける文字起こしサービスへの投入です。

  • メタデータ保全: ヘッダーやタイムスタンプが保持される
  • すぐに処理可能: 中間変換なしで即読み込み可能
  • 大量処理に強い: 巨大アーカイブも一括で同時処理でき、ストレージ負担がない

SkyScribeのリンクベース文字起こしならダウンロード工程を省き、講演録音やUNIXアーカイブ、ASR用の最新録音など、どんな源泉の .au ファイルでも即座にラベルやタイムスタンプ入りで文字起こし結果が返ってきます。これにより後処理の手間が大幅に減ります。


まとめ

レガシー環境向けに .au 音声ファイルを正しく作る には、「Audacityで書き出せば終わり」ではありません。内部形式ではなくSun .au が必要かどうかを確認し、入力フォーマットとサンプルレートを正しく設定し、書き出しダイアログで適切なオプションを選び、外部ツールでヘッダーやデータ部を検証することが不可欠です。 よくある落とし穴を避ければ、アーカイブ再生や最新の文字起こしパイプラインでも安心して利用できます。

この .au をクラウドのリンク/アップロード型文字起こしサービスに渡すことで、ASRが必要とするタイムスタンプやチャンネル構成を保ったまま処理可能になります。レガシー互換の書き出しと、SkyScribeのような現代的ツールの組み合わせは、古い技術と新しい技術を両立させながら効率的に運用する強力な手段です。


FAQ

1. Sun/NeXT .au と Audacity内部の .au ブロックファイルの違いは? Sun .au は標準化ヘッダー付きでAudacity外でも使える形式。内部 .au はヘッダーのないPCM断片で、Audacityの .aup プロジェクトがないと使えません。

2. .au からの文字起こしに最適なサンプルレートは? 古い電話システムは8000 Hz モノラル、最新ASRなら精度向上のため16000 Hz モノラルが推奨です。

3. 書き出した .au を確認する方法は? ffprobe でフォーマット、サンプルレート、チャンネルをチェック。HEXビューアなら .snd マジックバイトと正しいヘッダー長を確認できます。

4. 文字起こし用に .au をステレオからモノラルにする理由は? モノラルがほとんどの電話・ASRワークフローの前提。ステレオは不要にサイズを増やし、互換性を損なうことがあります。

5. 文字起こしの再セグメント化はどう役立つ? 字幕や会話単位など用途に合わせて区切り直すことで最適化されたテキストが得られます。SkyScribeならレガシー .au の整列も自動で行えます。

6. リンクベースの文字起こしは本当に速い? はい。ダウンロード待ちがなく、ローカル保存の制約も回避でき、ファイル操作でのヘッダーやタイムスタンプ破損の心配もありません。

7. Audacityはビッグエンディアンの .au を書き出せる? 一部エンコードでは「その他の非圧縮ファイル」ヘッダー選択でビッグエンディアン書き出しが可能ですが、デフォルトは異なる場合があるため出力後のエンディアン確認は必須です。

Agent CTA Background

効率的な文字起こしを始めよう

無料プラン利用可能クレジットカード不要