文章に基づく画像作成

LaunchPad から ComfyUI Desktop を起動してください。

imaget2i1

はじめての画像生成

imaget2i2

メニュー左上のワークフローから開くを押してください。

imaget2i3

ComfyUI フォルダの workflows フォルダの『1.1.1.画像生成基本T2I.json』を開いてください。

imaget2i4

推奨モデルをダウンロードしている場合はそのまま実行できます。下の実行するを押してください。

金髪ツインテール青目で青ブレザー赤タイ青いスカートの制服を着た女の子が教室で口を開けてこちらを向いて微笑んでいるアニメ風の 896x1152 サイズの画像が 1 分程度で生成されるはずです。

imaget2i4

gen0001

生成画像への指示

imaget2i5

中央のポジティブプロンプトがどんな画像を生成するかの指示になります。文章(Text)から画像(Image)を生成するので、Text to Image(T2I)といいます。

今使用しているモデル(Illustrious-xl-v1.1)では英語で単語に区切って与えるのが通常です。

1girl, solo, blonde hair, blue eyes, two-side up, school uniform, 
blazer, blue jacket, red bowtie, pleated skirt, blue skirt, 
classroom, looking at viewer, standing, smile, open mouth, 
official art, anime coloring

1girl => 少女1人
solo => 他に人がいない
blonde hair => 金髪
blue eyes => 青い目
...

このように英単語で生成したい内容を記述します。

imaget2i6

ポジティブプロンプトを次のように変えて実行を押してください。

1girl, solo, black hair, brown eyes, long hair, school uniform, 
serafuku,  green neckerchief, pleated skirt, blue skirt, classroom, 
looking at viewer, standing, smile, open mouth, official art, anime coloring

黒髪ロング茶色目で緑タイ青スカートのセーラー服の女の子が教室でこちらを向いて微笑んでいるアニメ風の896x1152サイズの画像が生成されるはずです。

imaget2i7

gen0002

このように英語で生成したい画像に関する内容を記述することで画像を生成できます。このような英単語の羅列による生成画像への指示をプロンプト(prompt)をいいます。

この文書では基本的に英語プロンプトを使用します。

英語が苦手な方のために、日本語文章を英語プロンプトに翻訳するワークフローを用意してあり、のちほど説明します。

ComfyUI の基本操作

生成された画像等は ComfyUI フォルダの output フォルダに入ります。 Finder で開いて確認してください。

imaget2i71

実行するの右の数字で繰り返す回数を指定できます。未実行のものはキューに入ります。さらに隣の❌を押すと現在の処理を中止できます（すぐに止まらない場合もあります)。さらに右の🔲を押すとキューに入っている処理をクリアできます。

ノードのないところをドラッグするとワークフロー全体を移動できます。ホイールの回転か右下の＋ーでワークフローの拡大縮小ができます。

imaget2i72

右下のメニュー中央の🔲を押すとノードのある位置が中央になります。

ノードの解説

各ノードに生成したい画像に関する設定を行うことで自由に画像を生成できます。

ポジティブプロンプト

生成したい画像を記述するメインの内容を記述します。

ネガティブプロンプト

生成したい画像に入って欲しくない内容を記述します。

空の潜在画像

生成する画像の大きさを指定します。

imaget2i8

空の潜在画像で幅を1152、高さを896にし、ポジティブプロンプトに次の文を入れて実行するを押してください。

2girls, multiple girls, school uniform, classroom, looking at viewer, 
standing, smile, open mouth, official art, anime coloring

1152x896サイズの2人の少女の画像が生成されます。

imaget2i9

gen0003

K サンプラー

画像の生成に関する設定です。ステップを上げればより高画質になりますが、その分時間がかかります。生成を高速化する技術高速化 LoRA により少ないステップ数ででの生成を可能にしています。仕様上は4ステップで生成可能となっていますが、品質がいまいちなので 8 ステップに設定しています。必要に応じてステップ数を変更してください。

チェックポイントを読み込む

使用するモデルを指定します。

高速化LoRAを読み込む

高速化 LoRA を読み込みます。通常は変更する必要はありません。

追加LoRAを読み込む

LoRA を追加する場合に有効にします。詳しくはその他の追加LoRA使用方法で説明します。

モデルの変更

imaget2i10

『チェックポイントを読み込む』ノードで ckpk 名を fuduki_mix_v20.safetensorsに変更し、『空の潜在画像』ノードで幅を1024、高さを1024にし、ポジティブプロンプトを次のようにして実行するを押してください。

1girl, solo, school uniform, classroom, looking at viewer, 
standing, smile, open mouth, realistic, 4k, 8k

imaget2i11

gen0004

リアル調の制服少女の画像が生成されます。

imaget2i12

『空の潜在画像』ノードで幅を 896、高さを 1152 にし、ポジティブプロンプトを次のようにして実行するを押してください。

cat, walking, bedroom, looking at viewer, sheet, pillow, window, 
no person, realistic

リアル調の猫が寝室で歩いている画像が生成されるはずです。

imaget2i13

gen0005

モデルによって画風は大きく変わります。

ワークフロー

imaget2i14 imaget2i15

メニューのワークフローの保存を押すとワークフローを保存できます。 ComfyUI フォルダの user フォルダの default フォルダの workflows フォルダに保存されます。保存したワークフローは左側のメニューから直接開けます。

エクスポートするとファイルとしてワークフローを保存できます。ワークフローの開くから開けますし、ネットにアップロードして公開することもできます。

imaget2i16

ComfyUI が提供するワークフローがあり、メニューのワークフローのテンプレートを参照から選べます。カスタムノードによってはワークフローを提供しているので、ComfyUI フォルダの custom_nodes フォルダの各カスタムノードフォルダを開くと見つかる場合もあります。

civitaiでもさまざまなワークフローが公開されているので、必要に応じて参照してください。

生成のコツ

画像生成 AI では常にうまく生成されるとは限らないです。

何度も生成して良いと思った画像を採用する形になるのでよく『ガチャ』と言われます。

また、モデルによって得意分野が異なり、同じプロンプトでも生成画像が全く異なります。

推奨モデルの Illustrious-XL はアニメ・イラストが得意なモデルで、 fuduki_mix は写真のようなリアル調が得意なモデルです。

モデルはhuggingfaceやcivitaiなどにたくさんあるので、探してみてください。

画像生成 AI では、プロンプトを変えたり、モデルを変えたり、何度も生成するなど試行錯誤が必要なことを頭に入れてください。