Seedance 2.0をComfyUIで試してみた──I2Vアクション動画の生成手順と使ったプロンプト全公開

生成AI

要約

ByteDance製のAI動画生成モデル「Seedance 2.0」がComfyUIパートナーノードに追加されました。I2V(画像から動画を生成する手法)との相性が抜群で、アクション動画の生成クオリティに驚かされました。この記事では、Seedance 2.0 ComfyUIでの使い方として、実際に試した手順・使ったプロンプト全文・クレジット消費の実測値を公開します。


はじめに

2026年4月13日、ComfyUIパートナーノードに「Seedance 2.0」が追加されました。

ByteDance製の動画生成モデルで、マルチモーダル入力・ネイティブ音声同期・シネマティックなカメラコントロールといった特徴を持つ注目作です。ComfyUIでのAI動画生成に興味がある方向けに、手順とプロンプトをまとめて公開します。

モチベル
Seedance 2.0ってどんなモデルなの?
クーラット
ByteDanceが作ったAI動画生成モデルだよ。ComfyUIのパートナーノード経由でそのまま使えるようになったから、ローカル環境でも簡単に試せるんだ

Seedance 2.0とは

Seedance(シーダンス)はByteDanceが開発した動画生成モデルです。

バージョンは1.0→1.5 Pro→2.0と進化しており、現在の最新版が2.0です。

主な特徴

Seedance 2.0の大きな強みはマルチモーダル入力に対応していることです。テキスト・画像・動画・音声を組み合わせてインプットできるため、より細かいコントロールが可能になっています。

主な特徴をまとめると以下の通りです。

  • 参照入力: 画像最大9枚、動画3本、音声3ファイルを同時に指定可能
  • ネイティブ音声同期: プロンプトに音声指定を書くだけで、音響効果や音楽を生成に反映できる
  • シネマティックなカメラコントロール: カメラワークをプロンプトで細かく指定できる
情報
2026年4月時点での最新版は2.0になります。

ComfyUIパートナーノードでのスペック

ComfyUIのパートナーノードで使えるSeedance 2.0のスペックは以下の通りです。

項目 内容
利用可能ノード Text to Video / Reference to Video / First-Last Frame to Video
参照画像 最大9枚
参照動画 最大3本
参照音声 最大3ファイル
最大解像度 720p
アスペクト比 指定可能(16:9 / 9:16など)
動画尺 最大15秒
クレジット消費 約46クレジット/秒(7秒=320cr、15秒=685cr)
クレジット単価 $10 = 2,110クレジット(約0.47円/cr)

ローカルで動かすわけではなく、クレジットを使ってクラウド上で生成する仕組みです。10秒動画を1本生成するとおおよそ320〜460クレジット前後かかります。

3種類のノードの使い分け

Seedance 2.0には用途別に3つのノードがあります。

Text to Video(T2V)

テキストプロンプトだけで動画を生成するノードです。参照素材がなくてもすぐ試せますが、キャラクターの見た目のコントロールは難しいです。

Seedance 2.0 Text to Videoノード。プロンプト入力欄・resolution・ratio・durationの設定項目がシンプルに並んでいる
Text to Video:プロンプトだけで動画生成。右上に約410crの消費目安が表示される

Reference to Video(I2V)

画像・動画・音声を参照素材として渡して動画を生成するノードです。キャラクターの見た目を固定したまま動かせるため、今回のようなアクション動画に最適です。

Seedance 2.0 Reference to Videoノードの設定画面。image×9・video×3・audio×3の入力ソケットと、resolution・ratio・durationなどの設定項目が並んでいる
Reference to Video:画像・動画・音声を参照して生成。右上に約476〜700crの消費目安が表示される

First-Last Frame to Video

最初のフレームと最後のフレームを指定して、その間をつなぐ動画を生成するノードです。「この構図からこの構図へ動かしたい」という用途に使えます。クレジット消費が少なめなのも特徴です。

Seedance 2.0 First-Last-Frame to Videoノード。first_frameとlast_frameの2入力で動画を生成する。右上に148.5 credits/Runと表示されている
First-Last Frame to Video:最初と最後のフレームを指定して補間生成。約148crと3つの中でもっとも消費が少ない

実際に試した手順

ComfyUIにSeedance 2.0を追加する

まずローカルのComfyUIを起動し、左サイドバーのNodesをクリックします。検索ボックスに「Seedance」と入力すると、PARTNER NODESのカテゴリ下にSeedance 2.0の3種類のノードが表示されます。

ComfyUI左サイドバーのNodesパネルでSeedanceを検索した結果。PARTNER NODESにText to Video・Reference to Video・First-Last Frame to Videoの3ノードが表示されている
左サイドバーの「Nodes」→検索ボックスに「Seedance」と入力するとPARTNER NODESに3種類が表示される

今回はI2V(画像から動画を生成する手法)を使いたいので、Reference to Videoを選んでキャンバスに配置しました。

ノードの設定

配置したノードに以下を設定しました。

  • 参照画像: 3枚をセット(銀髪鎧の女の子キャラクター)
  • アスペクト比: 16:9(横動画)
  • 動画尺: 10秒

実際に組んだワークフローはこんな感じです。Load Imageノード3つで参照画像をセットし、Reference to Videoノードに接続、出力をSave Videoに繋げるだけとシンプルです。

ComfyUIのI2Vワークフロー全体図。Load Imageノード3つからSeedance 2.0 Reference to Videoノードに接続し、Save Videoに出力している
今回のI2Vワークフロー全体図。Load Image×3 → Reference to Video → Save Videoとシンプルな構成
モチベル
参照画像って、何枚まで入れられるの?
クーラット
ComfyUIパートナーノードでも最大9枚まで入れられるよ。動画・音声も参照できる。入れるほどキャラクターの一貫性が上がる感じがするよ

使ったプロンプト(全文公開)

今回使ったプロンプトはこちらです。ダンジョンでアクションを繰り広げるシーンを想定して書きました。

A silver-armored girl with short white hair and 
piercing blue eyes charges forward through a dark 
stone dungeon. She swings her glowing sword in a 
wide arc, sending a burst of orange fire energy 
slashing through the air. A large red demon lunges 
at her from the left — she sidesteps instantly and 
drives her blade through it, sparks and embers 
exploding on impact. A second smaller red monster 
leaps from the right — she spins and backhands it 
away with her gauntlet, cracking the stone floor 
on impact. She lands in a low combat stance, 
sword raised, surrounded by dissipating flames. 
Debris and embers rain down. Camera starts wide, 
then cuts to a fast low-angle push-in as she 
strikes. Dynamic action cut editing. Epic 
orchestral battle music, clashing metal, monster 
roars, crackling fire.

プロンプト作成のポイント

このプロンプトで意識したことが3つあります。

1. 動きを時系列で記述する

「〜して→〜して→ポーズ」という流れで動きを順番に書いていくのがコツです。「魔物に突進して、横から来た敵をかわして、二体目を弾き飛ばして、戦闘ポーズで着地」という一連の流れをそのまま文章にしました。

2. カメラワークを明示する

Camera starts wide, then cuts to a fast low-angle push-in as she strikesのように、カメラの動き・アングルを具体的に書くと映像的なメリハリが出ます。Seedance 2.0はカメラコントロールの精度が高く、ここをしっかり書くほど意図通りの絵になります。

3. 音声指定を入れると雰囲気が出る

Seedance 2.0はネイティブ音声生成に対応しているため、Epic orchestral battle music, clashing metal, monster roars, crackling fireのような音響の指定もプロンプトに含めます。生成された動画に音が乗って、より映像作品っぽい仕上がりになりました。


生成結果

クレジット消費は458クレジット(約$2.17 / 約320円)で10秒動画1本でした。

実際に生成してみた所感として、キャラクターの動きのキレが良く、炎や火花のエフェクトも自然に馴染んでいます。特に感心したのが剣を振った瞬間の流体的な動き。以前試したSeedance 1.5 Proと比べると、動きのコントロール精度が明らかに上がっていて、プロンプトに書いた「一撃→かわし→二撃目→着地」という流れをしっかり再現してくれました。

ヒント
ノード右上に ~476.4-700.6 credits/Run のように消費クレジットの目安がリアルタイムで表示されます。解像度・秒数を変えると数値が変わるので、生成前にコストを確認できます。

縦動画(9:16)への変換

YouTube ShortsやInstagram ReelsはShortsとして認識させるために9:16の縦型アスペクト比が必要です。

対応方法は2つあります。

方法1: 最初から9:16でSeedanceに生成させる(推奨)

ノードのアスペクト比設定で9:16を選択するだけです。最初から縦型で生成されるため、クオリティ面でも有利です。参照画像も縦型で用意しておくとより自然な仕上がりになります。

方法2: AviUtlで縦キャンバスに配置する

横動画を縦に変換する場合は、AviUtlで縦型(1080×1920)のキャンバスを作り、元動画を中央に配置します。上下に余白ができるため、同じ動画をぼかしてバックに敷く「ぼかし背景」で埋めると見栄えが良くなります。


1
縦型プロジェクトを作成

AviUtlを開き、プロジェクトの解像度を1080×1920に設定します。

2
元動画をぼかしてバックに配置

元の横動画を縦いっぱいに拡大配置し、「ガウスぼかし」フィルターをかけます(強度30〜50程度)。

3
元動画を中央に重ねる

同じ動画クリップをもう1枚重ねて、中央・元のサイズで配置します。上下にぼかし背景が見える状態になればOKです。


BGMの乗せ方

Seedance 2.0の音声生成を活用する

前述の通り、プロンプトに音声の指定を書くことでSeedance 2.0が音声付きで動画を生成してくれます。BGMの雰囲気・効果音の種類をテキストで指定するだけなので、手軽に試せます。

外部BGMを使う場合

より凝ったBGMを使いたいときは、フリー音源サイトを活用するのがおすすめです。

DOVA-SYNDROMEは無料・商用利用可能なBGMが揃っていて、クリエイター向けの利用規約が整っているため安心して使えます。

今回の動画には「Baring Their Fangs」(作:shimtone)を使用しました。アクション系のオーケストラBGMで、ダンジョンバトルの映像にぴったりでした。

情報
DOVA-SYNDROMEのBGMを使う際は、各楽曲の利用規約を確認してください。商用利用可能でも、一部楽曲はYouTube収益化に制限がある場合があります。

よくある質問


QSeedance 2.0はComfyUIのローカル環境で使えますか?
A

ローカルのComfyUIから利用できますが、生成はクラウド上で行われます。クレジットを消費する仕組みで、ローカルのGPUは使いません。

QSeedance 2.0のクレジット消費はどのくらいですか?
A

約46クレジット/秒が目安です。10秒動画で約460クレジット(約220円)、15秒で約685クレジット(約325円)になります。ノード右上にリアルタイムで消費見込みが表示されるので、生成前に確認できます。

Q参照画像は何枚まで使えますか?
A

ComfyUIパートナーノードでも最大9枚まで使えます。画像のほかに動画3本・音声3ファイルも参照素材として指定できます。

QSeedance 2.0で縦動画(9:16)は作れますか?
A

作れます。ノードのratioを9:16に設定するだけです。最初から縦型で生成する方がクオリティ面でも有利なので、Shorts・Reels用途には縦型での生成をおすすめします。


まとめ

Seedance 2.0のI2Vを実際に試してみて、アクション動画との相性の良さを実感しました。

クレジット消費は10秒動画で458クレジット(約320円)とそこそこのコストですが、生成されるクオリティを考えると十分な価値があると感じます。特にカメラワークの指定精度が高く、「wide → low-angle push-in」という動きもしっかり再現されていたのが印象的でした。

次は以下を試してみる予定です。

  • Seedance 2.0の音声生成機能をもっと活用する(BGM・効果音の細かい指定)
  • 9:16で最初から生成してYouTube Shorts向けコンテンツを作る
  • FastモードとStandardモードの品質比較をして結果を記事にする

ComfyUIでAI動画生成に挑戦したい方は、ぜひSeedance 2.0のパートナーノードを試してみてください。

ComfyUIパートナーノードの詳細はこちら



関連記事

【2026年版】ComfyUIインストール方法|AI画像生成ローカル環境構築ガイド
AI画像生成をローカルPCで始めるならComfyUIがおすすめ。Windows版のインストール方法を初心者向けに解説。Python・Git不要のポータブル版で簡単セットアップ。推奨GPU・必要スペックから初めての画像生成まで手順をスクショ付きで紹介。
【2026年版】ローカルAI画像生成 初心者完全ガイド|ComfyUI・SDWEBUI どっちを使う?学習ロードマップ
ComfyUI・Stable Diffusion WebUI どちらを使えばいい?ローカルAI画像生成の始め方を初心者向けに解説。ツール選びからインストール・モデル準備・LoRA・ControlNetまで、学ぶべき順番と各記事へのリンクをまとめました。

コメント