Seedance 2.0をComfyUIで試した──I2V手順とプロンプト全公開

要約

ByteDance製のAI動画生成モデル「Seedance 2.0」がComfyUIパートナーノードに追加されました。I2V（画像から動画を生成する手法）との相性が抜群で、アクション動画の生成クオリティに驚かされました。この記事では、Seedance 2.0 ComfyUIでの使い方として、実際に試した手順・使ったプロンプト全文・クレジット消費の実測値を公開します。

はじめに

2026年4月13日、ComfyUIパートナーノードに「Seedance 2.0」が追加されました。

ByteDance製の動画生成モデルで、マルチモーダル入力・ネイティブ音声同期・シネマティックなカメラコントロールといった特徴を持つ注目作です。ComfyUIでのAI動画生成に興味がある方向けに、手順とプロンプトをまとめて公開します。

モチベル

Seedance 2.0ってどんなモデルなの？

クーラット

ByteDanceが作ったAI動画生成モデルだよ。ComfyUIのパートナーノード経由でそのまま使えるようになったから、ローカル環境でも簡単に試せるんだ

Seedance 2.0とは

Seedance（シーダンス）はByteDanceが開発した動画生成モデルです。

バージョンは1.0→1.5 Pro→2.0と進化しており、現在の最新版が2.0です。

主な特徴

Seedance 2.0の大きな強みはマルチモーダル入力に対応していることです。テキスト・画像・動画・音声を組み合わせてインプットできるため、より細かいコントロールが可能になっています。

主な特徴をまとめると以下の通りです。

参照入力: 画像最大9枚、動画3本、音声3ファイルを同時に指定可能
ネイティブ音声同期: プロンプトに音声指定を書くだけで、音響効果や音楽を生成に反映できる
シネマティックなカメラコントロール: カメラワークをプロンプトで細かく指定できる

情報

2026年4月時点での最新版は2.0になります。

ComfyUIパートナーノードでのスペック

ComfyUIのパートナーノードで使えるSeedance 2.0のスペックは以下の通りです。

項目	内容
利用可能ノード	Text to Video / Reference to Video / First-Last Frame to Video
参照画像	最大9枚
参照動画	最大3本
参照音声	最大3ファイル
最大解像度	720p
アスペクト比	指定可能（16:9 / 9:16など）
動画尺	最大15秒
クレジット消費	約46クレジット/秒（7秒=320cr、15秒=685cr）
クレジット単価	$10 = 2,110クレジット（約0.47円/cr）

ローカルで動かすわけではなく、クレジットを使ってクラウド上で生成する仕組みです。10秒動画を1本生成するとおおよそ320〜460クレジット前後かかります。

3種類のノードの使い分け

Seedance 2.0には用途別に3つのノードがあります。

Text to Video（T2V）

テキストプロンプトだけで動画を生成するノードです。参照素材がなくてもすぐ試せますが、キャラクターの見た目のコントロールは難しいです。

Seedance 2.0 Text to Videoノード。プロンプト入力欄・resolution・ratio・durationの設定項目がシンプルに並んでいる — Text to Video：プロンプトだけで動画生成。右上に約410crの消費目安が表示される

Reference to Video（I2V）

画像・動画・音声を参照素材として渡して動画を生成するノードです。キャラクターの見た目を固定したまま動かせるため、今回のようなアクション動画に最適です。

Seedance 2.0 Reference to Videoノードの設定画面。image×9・video×3・audio×3の入力ソケットと、resolution・ratio・durationなどの設定項目が並んでいる — Reference to Video：画像・動画・音声を参照して生成。右上に約476〜700crの消費目安が表示される

First-Last Frame to Video

最初のフレームと最後のフレームを指定して、その間をつなぐ動画を生成するノードです。「この構図からこの構図へ動かしたい」という用途に使えます。クレジット消費が少なめなのも特徴です。

実際に試した手順

ComfyUIにSeedance 2.0を追加する

まずローカルのComfyUIを起動し、左サイドバーのNodesをクリックします。検索ボックスに「Seedance」と入力すると、PARTNER NODESのカテゴリ下にSeedance 2.0の3種類のノードが表示されます。

ComfyUI左サイドバーのNodesパネルでSeedanceを検索した結果。PARTNER NODESにText to Video・Reference to Video・First-Last Frame to Videoの3ノードが表示されている — 左サイドバーの「Nodes」→検索ボックスに「Seedance」と入力するとPARTNER NODESに3種類が表示される

今回はI2V（画像から動画を生成する手法）を使いたいので、Reference to Videoを選んでキャンバスに配置しました。

ノードの設定

配置したノードに以下を設定しました。

参照画像: 3枚をセット（銀髪鎧の女の子キャラクター）
アスペクト比: 16:9（横動画）
動画尺: 10秒

実際に組んだワークフローはこんな感じです。Load Imageノード3つで参照画像をセットし、Reference to Videoノードに接続、出力をSave Videoに繋げるだけとシンプルです。

ComfyUIのI2Vワークフロー全体図。Load Imageノード3つからSeedance 2.0 Reference to Videoノードに接続し、Save Videoに出力している — 今回のI2Vワークフロー全体図。Load Image×3 → Reference to Video → Save Videoとシンプルな構成

モチベル

参照画像って、何枚まで入れられるの？

クーラット

ComfyUIパートナーノードでも最大9枚まで入れられるよ。動画・音声も参照できる。入れるほどキャラクターの一貫性が上がる感じがするよ

使ったプロンプト（全文公開）

今回使ったプロンプトはこちらです。ダンジョンでアクションを繰り広げるシーンを想定して書きました。

A silver-armored girl with short white hair and 
piercing blue eyes charges forward through a dark 
stone dungeon. She swings her glowing sword in a 
wide arc, sending a burst of orange fire energy 
slashing through the air. A large red demon lunges 
at her from the left — she sidesteps instantly and 
drives her blade through it, sparks and embers 
exploding on impact. A second smaller red monster 
leaps from the right — she spins and backhands it 
away with her gauntlet, cracking the stone floor 
on impact. She lands in a low combat stance, 
sword raised, surrounded by dissipating flames. 
Debris and embers rain down. Camera starts wide, 
then cuts to a fast low-angle push-in as she 
strikes. Dynamic action cut editing. Epic 
orchestral battle music, clashing metal, monster 
roars, crackling fire.

プロンプト作成のポイント

このプロンプトで意識したことが3つあります。

1. 動きを時系列で記述する

「〜して→〜して→ポーズ」という流れで動きを順番に書いていくのがコツです。「魔物に突進して、横から来た敵をかわして、二体目を弾き飛ばして、戦闘ポーズで着地」という一連の流れをそのまま文章にしました。

2. カメラワークを明示する

Camera starts wide, then cuts to a fast low-angle push-in as she strikesのように、カメラの動き・アングルを具体的に書くと映像的なメリハリが出ます。Seedance 2.0はカメラコントロールの精度が高く、ここをしっかり書くほど意図通りの絵になります。

3. 音声指定を入れると雰囲気が出る

Seedance 2.0はネイティブ音声生成に対応しているため、Epic orchestral battle music, clashing metal, monster roars, crackling fireのような音響の指定もプロンプトに含めます。生成された動画に音が乗って、より映像作品っぽい仕上がりになりました。

生成結果

クレジット消費は458クレジット（約$2.17 / 約320円）で10秒動画1本でした。

実際に生成してみた所感として、キャラクターの動きのキレが良く、炎や火花のエフェクトも自然に馴染んでいます。特に感心したのが剣を振った瞬間の流体的な動き。以前試したSeedance 1.5 Proと比べると、動きのコントロール精度が明らかに上がっていて、プロンプトに書いた「一撃→かわし→二撃目→着地」という流れをしっかり再現してくれました。

ヒント

ノード右上に ~476.4-700.6 credits/Run のように消費クレジットの目安がリアルタイムで表示されます。解像度・秒数を変えると数値が変わるので、生成前にコストを確認できます。