Back to all articles
Taylor Brooks

英語音声から中国語字幕へ|完全作成ガイド

英語音声・動画を中国語字幕に変換する手順を解説。制作から公開まで使えるノウハウをクリエイター・編集者向けに紹介します。

はじめに

英語音声から中国語への文字起こしと字幕作成は、コンテンツ制作者や映像編集者、プロジェクトコーディネーターにとって、見た目以上に厄介なローカライズ作業です。一見すると、英語音声を文字起こしして中国語に翻訳するだけのシンプルな二段階作業に見えます。しかし実際には、タイムコードのズレ、動画のダウンロードによる保存やポリシー違反のリスク、言語による文字数差による字幕のオーバーフロー、YouTubeやBilibiliなど配信先ごとの仕様制限などが複雑に絡み合います。

多くの制作者は今もまず動画ファイルをローカルにダウンロードし、手作業で字幕を抽出します。しかしこの方法は問題が増えており、特にチーム制作やクライアント案件では、プラットフォーム規約やコンプライアンスによりオフラインでの原動画保存が禁止されている場合があります。リンクベースでの文字起こし・翻訳ワークフローならこのリスクを回避でき、音声から配信可能なバイリンガル字幕までの工程を大幅に効率化できます。

このガイドでは、タイムコード・話者ラベル・書式を最初から最後まで保持しつつ、グローバル配信に対応した字幕ファイル(SRT/VTT)を作る、ポリシー準拠の一連の手順を解説します。2つの確実なワークフロー、プラットフォーム別の書式ルール、再分割のコツ、そして公開前の品質チェックまで順を追って紹介します。


英語→中国語字幕制作でよくある課題

動画ローカライズチームで繰り返し起こる悩みのひとつが、翻訳後のタイムコードずれです。英語の文字起こしが正確でも、中国語に変換すると文字数や文のまとまり、テンポが変わり、音声と字幕の同期が崩れます。翻訳がどれだけ正しくても、タイミングが合っていなければ結果的に質は落ちます。

もうひとつ見過ごされがちな問題が、作業方法とコンプライアンスです。文字起こしのために動画をダウンロードすると、保存やポリシー面でのリスクが発生します。規制のあるコンテンツを扱うプロチームでは単なる効率の問題ではなく、ガバナンス上の重大な懸念となります。リンクベースのワークフローなら、ホスト上の動画を直接扱いながら元のタイムコードを保持できます。

手作業の方法では、話者ラベルや使えるタイムコードが欠けた乱雑な字幕になることもしばしば。その修正と再同期に時間を取られ、ポストプロダクション作業が大幅に増えてしまいます。


信頼できる2つのワークフロー

最適な文字起こし~字幕化の流れは、コンテンツタイプや視聴対象、リソースによって異なります。ここでは基本となる2つの方法を紹介します。

パターンA:リンク入力 → 自動文字起こし → 機械翻訳

インタビューや講演、単一話者のプレゼンなど比較的シンプルな内容なら、リンク入力対応の文字起こしツールが便利です。YouTubeやホストされた動画のリンクをリンク入力型文字起こしツールに貼るだけで、話者分け・正確なタイムコードを備えた英語の原稿が取得できます。そのままタイムコードを保持したまま機械翻訳すれば、瞬時に英中併記の字幕が完成します。

例えば、こちらのワークフローに動画リンクを貼ると、整った英語原稿が時間合わせ済みで生成されます。そこからAI字幕翻訳機能で中国語化し、SRT/VTTファイルを作成すれば同期は維持されたまま。小さな翻訳の違和感はレビュー時に直せますが、タイムコードはいじる必要がありません。

この方法が向いているのは、

  • 話者が明確に分かれていて重複が少ない場合
  • 画面内テキストが少ない、または別途翻訳不要な場合
  • 複雑なニュアンスより安定した出力を重視する場合

Fluen AIでも似た処理は可能ですが、SRTをダウンロードして入力する必要がある場合があります。リンク入力型なら工程もポリシー対応もすっきりします。

パターンB:英語文字起こし → 人による編集 → 中国語字幕化

映画や座談会、画面内テキストの翻訳も含める必要がある内容では、翻訳前に編集者が原稿を整えるステップを入れる方が効果的です。英語の文字起こし後に、文の切り分け、話者ラベルの追加、画面内要素の注記を行い、それを中国語に翻訳します。この際、それぞれの字幕の長さについても明確な指示があると読みやすくなります。

この方法の利点は、

  • 文化的ニュアンスや慣用表現のローカライズができる
  • ユーモアや言葉遊び、地域特有の用語への対応が可能
  • 音声以外の画面内テキストも適切に処理できる

時間はかかりますが、字幕全体が文脈豊かで画面上のバランスも良くなり、後半でタイムコード調整に追われることがなくなります。


ファイル形式とプラットフォーム別の仕様

字幕形式の理解は配信成功の鍵です。多くの制作者はSRTを使いますが、これはプラットフォームに依存せず編集も容易。VTTはスタイル指定も可能、STLは放送用途では一般的ですがオンライン配信では不要です。

YouTubeでは、SRTで1行目に英語、2行目に中国語を入れたバイリンガル表示が可能。ただしこれは標準仕様ではないため、必ず動作確認を行う必要があります。BilibiliではSRTインポートは可能ですが、英中併記の扱いがYouTubeとは異なるため、手動編集になる場合があります。

中国語配信では次を忘れずに:

  • 簡体字:中国本土、シンガポールで使用
  • 繁体字:台湾、香港、海外コミュニティで使用

動画によっては簡体字と繁体字の両対応が必要です。プラットフォームと視聴者層に応じて、どちら/両方を用意するか判断しましょう。


再分割とローカライズの実践ポイント

中国語は英語より1字幕あたりの文字が多くなりがちなので、単純に同じ区切りで移すと読みにくくなります。理想は翻訳後ではなく、文字起こし時点で再分割を行い、中国語でも収まりが良い長さにしておくことです。

手作業での再分割は時間がかかるため、一括再分割機能の利用が効率的です。私のワークフローでは、自動再分割ツールで事前ルールに沿って再構成し、タイムコードを保ったまま最適な文字数に調整しています。

その他のポイント:

  • 話者ラベルは各セグメントの先頭に統一して入れ、必要に応じて名前も翻訳
  • 画面内の画像や文字は別途字幕化し、会話字幕に詰め込まない
  • プラットフォーム推奨文字数を守る(YouTubeは35〜40字程度、Bilibiliはやや短めを推奨)
  • 簡体字・繁体字は別ファイルでエクスポートし、変換時の文字化けを防ぐ

公開前の品質チェック

字幕公開前には、タイムコードの同期を条件として必ず確認します。特に見るべきは:

  • 各セグメントの開始~終了までのタイムコードが正しいか
  • 行の改行や孤立文字がないか
  • 日付・単位・人名などが適切にローカライズされているか
  • 実際の動画再生で可読性が保たれているか
  • 英中両行が同じ音声タイミングで表示されているか

チーム作業では、ファイルの所有やバージョン管理も重要です。共有ワークスペースやバージョン管理ツールを使えば、同期済みファイルの上書き事故を防げます。共同編集機能を活用すれば、複数編集者での競合や重複作業も減らせます。


事例紹介:30分インタビューを中国語字幕化

最近の案件で、ある制作チームは30分の英語インタビュー動画を中国国内向けに配信する必要がありました。原動画をダウンロードせずに行った方法は以下の通りです。

  1. ホスト動画リンクをタイムコード保持型文字起こしツールに入力し、話者ラベル付きの英語原稿を作成。
  2. 中国語で読みやすくなるよう再分割ルールを適用し、行長を調整。
  3. 原稿を簡体字中国語に機械翻訳し、その後人手で自然な言い回しに修正。
  4. 英語1行・中国語1行のバイリンガルSRTファイルを出力。
  5. YouTubeとBilibiliでテストし、プラットフォームによる改行仕様に合わせて調整。

結果、タイムコードが完全に一致した字幕を両プラットフォームに即日公開でき、メディアポリシー違反や保存管理の負担もゼロでした。


まとめ

英語から中国語への文字起こしは、単なる翻訳ではなく、タイムコード・文の区切り・二言語の文字密度の違いを考えた画面上の可読性を保つ作業です。完全自動のリンク入力型ワークフローでも、人手を加える編集中心の方法でも、重要なのは再分割や配信先の仕様を早期に取り入れることです。

ポリシー準拠でタイムコードを保持できる文字起こしツールを使えば、ダウンロードや乱雑な字幕、同期崩れの悩みを避けられます。体系的な編集とローカライズ戦略を組み合わせれば、簡体字・繁体字どちらの字幕も視聴者に自然に届き、最後まで音声と同期が保たれます。


よくある質問(FAQ)

1. なぜ文字起こしのために動画をダウンロードしない方がいいのですか? プラットフォーム利用規約違反や不要な保存負担、コンプライアンス問題につながる恐れがあります。リンク入力型のワークフローならこれらを回避できます。

2. 翻訳後にタイムコードを崩さずに済ませるには? 翻訳前に再分割しておくことが大切です。翻訳後の手作業調整はズレの原因になります。

3. 簡体字と繁体字両方の字幕は必要ですか? 中国本土と台湾・香港など両方に配信する場合は必要です。両方揃えることで理解の幅も広がります。

4. 機械翻訳は英語の慣用表現も対応できますか? スピードと一貫性には優れますが、複雑な表現や文化的ニュアンス、ユーモアは人による確認で補う方が安心です。

5. YouTubeとBilibiliではどの字幕形式が最適ですか? YouTubeは英中併記のSRTで同時表示可能ですが、Bilibiliでは併記の処理を確認し、必要なら言語別でアップロードする方法も検討しましょう。

Agent CTA Background

効率的な文字起こしを始めよう

無料プラン利用可能クレジットカード不要