要約
ByteDance製のAI動画生成モデル「Seedance 2.0」がComfyUIパートナーノードに追加されました。I2V(画像から動画を生成する手法)との相性が抜群で、アクション動画の生成クオリティに驚かされました。この記事では、Seedance 2.0 ComfyUIでの使い方として、実際に試した手順・使ったプロンプト全文・クレジット消費の実測値を公開します。
はじめに
2026年4月13日、ComfyUIパートナーノードに「Seedance 2.0」が追加されました。
ByteDance製の動画生成モデルで、マルチモーダル入力・ネイティブ音声同期・シネマティックなカメラコントロールといった特徴を持つ注目作です。ComfyUIでのAI動画生成に興味がある方向けに、手順とプロンプトをまとめて公開します。
Seedance 2.0とは
Seedance(シーダンス)はByteDanceが開発した動画生成モデルです。
バージョンは1.0→1.5 Pro→2.0と進化しており、現在の最新版が2.0です。
主な特徴
Seedance 2.0の大きな強みはマルチモーダル入力に対応していることです。テキスト・画像・動画・音声を組み合わせてインプットできるため、より細かいコントロールが可能になっています。
主な特徴をまとめると以下の通りです。
- 参照入力: 画像最大9枚、動画3本、音声3ファイルを同時に指定可能
- ネイティブ音声同期: プロンプトに音声指定を書くだけで、音響効果や音楽を生成に反映できる
- シネマティックなカメラコントロール: カメラワークをプロンプトで細かく指定できる
ComfyUIパートナーノードでのスペック
ComfyUIのパートナーノードで使えるSeedance 2.0のスペックは以下の通りです。
| 項目 | 内容 |
|---|---|
| 利用可能ノード | Text to Video / Reference to Video / First-Last Frame to Video |
| 参照画像 | 最大9枚 |
| 参照動画 | 最大3本 |
| 参照音声 | 最大3ファイル |
| 最大解像度 | 720p |
| アスペクト比 | 指定可能(16:9 / 9:16など) |
| 動画尺 | 最大15秒 |
| クレジット消費 | 約46クレジット/秒(7秒=320cr、15秒=685cr) |
| クレジット単価 | $10 = 2,110クレジット(約0.47円/cr) |
ローカルで動かすわけではなく、クレジットを使ってクラウド上で生成する仕組みです。10秒動画を1本生成するとおおよそ320〜460クレジット前後かかります。
3種類のノードの使い分け
Seedance 2.0には用途別に3つのノードがあります。
Text to Video(T2V)
テキストプロンプトだけで動画を生成するノードです。参照素材がなくてもすぐ試せますが、キャラクターの見た目のコントロールは難しいです。

Reference to Video(I2V)
画像・動画・音声を参照素材として渡して動画を生成するノードです。キャラクターの見た目を固定したまま動かせるため、今回のようなアクション動画に最適です。

First-Last Frame to Video
最初のフレームと最後のフレームを指定して、その間をつなぐ動画を生成するノードです。「この構図からこの構図へ動かしたい」という用途に使えます。クレジット消費が少なめなのも特徴です。

実際に試した手順
ComfyUIにSeedance 2.0を追加する
まずローカルのComfyUIを起動し、左サイドバーのNodesをクリックします。検索ボックスに「Seedance」と入力すると、PARTNER NODESのカテゴリ下にSeedance 2.0の3種類のノードが表示されます。

今回はI2V(画像から動画を生成する手法)を使いたいので、Reference to Videoを選んでキャンバスに配置しました。
ノードの設定
配置したノードに以下を設定しました。
- 参照画像: 3枚をセット(銀髪鎧の女の子キャラクター)
- アスペクト比: 16:9(横動画)
- 動画尺: 10秒
実際に組んだワークフローはこんな感じです。Load Imageノード3つで参照画像をセットし、Reference to Videoノードに接続、出力をSave Videoに繋げるだけとシンプルです。

使ったプロンプト(全文公開)
今回使ったプロンプトはこちらです。ダンジョンでアクションを繰り広げるシーンを想定して書きました。
A silver-armored girl with short white hair and
piercing blue eyes charges forward through a dark
stone dungeon. She swings her glowing sword in a
wide arc, sending a burst of orange fire energy
slashing through the air. A large red demon lunges
at her from the left — she sidesteps instantly and
drives her blade through it, sparks and embers
exploding on impact. A second smaller red monster
leaps from the right — she spins and backhands it
away with her gauntlet, cracking the stone floor
on impact. She lands in a low combat stance,
sword raised, surrounded by dissipating flames.
Debris and embers rain down. Camera starts wide,
then cuts to a fast low-angle push-in as she
strikes. Dynamic action cut editing. Epic
orchestral battle music, clashing metal, monster
roars, crackling fire.
プロンプト作成のポイント
このプロンプトで意識したことが3つあります。
1. 動きを時系列で記述する
「〜して→〜して→ポーズ」という流れで動きを順番に書いていくのがコツです。「魔物に突進して、横から来た敵をかわして、二体目を弾き飛ばして、戦闘ポーズで着地」という一連の流れをそのまま文章にしました。
2. カメラワークを明示する
Camera starts wide, then cuts to a fast low-angle push-in as she strikesのように、カメラの動き・アングルを具体的に書くと映像的なメリハリが出ます。Seedance 2.0はカメラコントロールの精度が高く、ここをしっかり書くほど意図通りの絵になります。
3. 音声指定を入れると雰囲気が出る
Seedance 2.0はネイティブ音声生成に対応しているため、Epic orchestral battle music, clashing metal, monster roars, crackling fireのような音響の指定もプロンプトに含めます。生成された動画に音が乗って、より映像作品っぽい仕上がりになりました。
生成結果
クレジット消費は458クレジット(約$2.17 / 約320円)で10秒動画1本でした。
実際に生成してみた所感として、キャラクターの動きのキレが良く、炎や火花のエフェクトも自然に馴染んでいます。特に感心したのが剣を振った瞬間の流体的な動き。以前試したSeedance 1.5 Proと比べると、動きのコントロール精度が明らかに上がっていて、プロンプトに書いた「一撃→かわし→二撃目→着地」という流れをしっかり再現してくれました。
~476.4-700.6 credits/Run のように消費クレジットの目安がリアルタイムで表示されます。解像度・秒数を変えると数値が変わるので、生成前にコストを確認できます。縦動画(9:16)への変換
YouTube ShortsやInstagram ReelsはShortsとして認識させるために9:16の縦型アスペクト比が必要です。
対応方法は2つあります。
方法1: 最初から9:16でSeedanceに生成させる(推奨)
ノードのアスペクト比設定で9:16を選択するだけです。最初から縦型で生成されるため、クオリティ面でも有利です。参照画像も縦型で用意しておくとより自然な仕上がりになります。
方法2: AviUtlで縦キャンバスに配置する
横動画を縦に変換する場合は、AviUtlで縦型(1080×1920)のキャンバスを作り、元動画を中央に配置します。上下に余白ができるため、同じ動画をぼかしてバックに敷く「ぼかし背景」で埋めると見栄えが良くなります。
AviUtlを開き、プロジェクトの解像度を1080×1920に設定します。
元の横動画を縦いっぱいに拡大配置し、「ガウスぼかし」フィルターをかけます(強度30〜50程度)。
同じ動画クリップをもう1枚重ねて、中央・元のサイズで配置します。上下にぼかし背景が見える状態になればOKです。
BGMの乗せ方
Seedance 2.0の音声生成を活用する
前述の通り、プロンプトに音声の指定を書くことでSeedance 2.0が音声付きで動画を生成してくれます。BGMの雰囲気・効果音の種類をテキストで指定するだけなので、手軽に試せます。
外部BGMを使う場合
より凝ったBGMを使いたいときは、フリー音源サイトを活用するのがおすすめです。
DOVA-SYNDROMEは無料・商用利用可能なBGMが揃っていて、クリエイター向けの利用規約が整っているため安心して使えます。
今回の動画には「Baring Their Fangs」(作:shimtone)を使用しました。アクション系のオーケストラBGMで、ダンジョンバトルの映像にぴったりでした。
よくある質問
ローカルのComfyUIから利用できますが、生成はクラウド上で行われます。クレジットを消費する仕組みで、ローカルのGPUは使いません。
約46クレジット/秒が目安です。10秒動画で約460クレジット(約220円)、15秒で約685クレジット(約325円)になります。ノード右上にリアルタイムで消費見込みが表示されるので、生成前に確認できます。
ComfyUIパートナーノードでも最大9枚まで使えます。画像のほかに動画3本・音声3ファイルも参照素材として指定できます。
作れます。ノードのratioを9:16に設定するだけです。最初から縦型で生成する方がクオリティ面でも有利なので、Shorts・Reels用途には縦型での生成をおすすめします。
まとめ
Seedance 2.0のI2Vを実際に試してみて、アクション動画との相性の良さを実感しました。
クレジット消費は10秒動画で458クレジット(約320円)とそこそこのコストですが、生成されるクオリティを考えると十分な価値があると感じます。特にカメラワークの指定精度が高く、「wide → low-angle push-in」という動きもしっかり再現されていたのが印象的でした。
次は以下を試してみる予定です。
- Seedance 2.0の音声生成機能をもっと活用する(BGM・効果音の細かい指定)
- 9:16で最初から生成してYouTube Shorts向けコンテンツを作る
- FastモードとStandardモードの品質比較をして結果を記事にする
ComfyUIでAI動画生成に挑戦したい方は、ぜひSeedance 2.0のパートナーノードを試してみてください。
関連記事




コメント