🔊

Remotionオーディオ & 字幕 — サウンドとビジュアルの同期

<Audio>、<OffthreadVideo>、useAudioData()でオーディオ/ビデオソースをフレームに同期

ビデオにおけるサウンドとビジュアルの同期は核心的な要素です。

: MP3/WAVファイルをビデオに挿入します。startFrom/endAt propでオーディオの特定区間のみ使用したり、volume propに関数を渡してフレームごとの音量を制御できます。Sequenceの中に入れると該当シーンでのみ再生されます。

useAudioData() + getWaveformPortion(): オーディオファイルの波形データを抽出して現在のフレームの振幅をビジュアルに反映します。音楽に合わせてバーが踊るオーディオビジュアライザーを実装できます。

: 既存のMP4ファイルをRemotionビデオに合成します。通常の

@remotion/captions: TTSエンジンやWhisperで生成された字幕データ（タイムスタンプ付き）をフレーム単位で同期して字幕を表示します。

動作フロー

<Audio src={audioUrl} />でビデオにオーディオトラックを挿入（Sequence内に配置可能）

volume propに(f) => interpolate(f, [0, 30], [0, 1])を渡してフェードイン効果

useAudioData()で波形をロード → getWaveformPortion()で現在のフレームの振幅を抽出

振幅データをSVG/CSSスタイルに反映してオーディオビジュアライザーをレンダリング

@remotion/captionsで字幕JSONをパースし現在のフレームに合った字幕テキストを表示

ポッドキャストビデオ: オーディオに合わせた波形ビジュアライザー + 自動字幕ミュージックビデオ: 音楽のビートに合わせてグラフィックが反応するモーショングラフィックス TTSベースコンテンツ: AI音声 + 自動生成字幕 + ビジュアル同期