「Midjourney」「にじジャーニー」のような高品質なSDXL画像生成を無料で使える #Fooocus で学ぶ!
「Fooocus By lllyasvil」の入門向け情報です
作者のGitHub: https://github.com/lllyasviel/Fooocus
「Fooocus」はControlNetを作ったスタンフォード大学のLvminさん(Lvmin Zhang)が作っている Stable Diffusion のオープンなWebUIで無料で利用できます。内部ではStable Diffusionの最新版『SDXL』を使用しており、シンプルで非常に高品質。GitHubで14kもスターが付いています。
使い勝手は、まさに「Midjourney」や「にじジャーニー」をWebUIで「一人で使う」という感じの環境を構築できます。非常に少ないプロンプトで品質の高い画像を作ってくれます。
今回は「Fooocus」の使い方の基本を通して「Midjourney」「にじジャーニー」の高度な使い方も同時に学べる記事になっています!
SDXLらしい立体感が素晴らしいですね。
ぜひ試してきたいと思ったあなた!
Fooocusのインストールがまだな方は、こちらの記事にまとめておきました。インストーラーでサクッとインストールできます。
Midjourney/にじジャーニー からの移行
もしあなたがテキスト画像生成の元祖「Midjourney」をお使いで、Fooocus を使い始めるなら、 Midjourney と同じくらい簡単、おそらく Midjourney より簡単です。
まず「Midjourney」が技術やパラメータチューニングに詳しくなくても、高品質のテキスト画像生成を行えるのですが、この内部はブラックボックスでした。「Fooocus」も同様にプロンプトエンジニアリングやパラメータチューニングをあまり必要としない、高品質のテキスト画像生成ができますが、GPT-2ベースのプロンプト処理エンジンを搭載して、サンプリングの改良を重ねており、非常に短いプロンプト、例えば「house in garden」といった短いワード列でも1000語ぐらいある長いプロンプトと同等に常に美しい結果が得られるようになっています。
Midjourneyと比較した基本操作
「Midjourney」の「V1 V2 V3 V4」は
Input Image -> Upscale or Variation -> Vary (Subtle) / Vary (Strong)
アップスケール/バリエーション→バリエーション(微妙)/バリエーション(強)
「U1 U2 U3 U4」は
Input Image -> Upscale or Variation -> Upscale (1.5x) / Upscale (2x)
入力画像→アップスケール/バリエーション→アップスケール(1.5倍)/アップスケール(2倍)といった流れで利用できます。
インペイントのパン機能「上下左右」は
Input Image -> Inpaint or Outpaint -> Inpaint / Up / Down / Left / Right
※Fooocusは独自のインペイントアルゴリズムとインペイントモデルを使用しているため、SDXL標準のインペイント方法やモデルを使用するよりもよい結果が得られるそうです。
[--ar] Advanced-> Aspect Ratios でアスペクト比を指定します。こちらは前回、16:9の画像を生成する方法を解説しました。
Midjourneyのオプションとの対比
[--style] Advanced -> Style で設定します
[--stylize] Advanced -> Advanced -> Guidance
[--niji] (にじジャーニーにあたるオプションはありませんが)実はFooocusはCivitaiで配布されているSDXLアニメ調モデルにも対応しています。
"run.bat"、"run_anime.bat"、"run_realistic.bat"を使って切り替えることができます。こちらについては別の機会があれば紹介します。
[--quality] Advanced -> Quality で設定できます
[--repeat] Advanced -> Image Number で設定できます
マルチプロンプト (::):Midjourneyでは「::」を使うことで概念を区切ることができます(例えば「hot :: dog」という感じ)。Fooocusでは改行を入れて複数行プロンプトを使うだけです。
プロンプトの重み: 「I am (happy:1.5)」という表現が使えます。
Fooocusは内部でAutomatic1111の重み付けアルゴリズムを使用しているため、Civitaiのプロンプトをそのままコピーした場合、比較対象としてComfyUIよりも良い結果が得られます。これは「ComifyUIのユーザはファイルをドラッグして利用するので、プロンプトテキストをコピーするよりもいい」という思想に基づいて設計されているそうです。
また埋め込み(embedding)を使用するには、"(embedding:file_name:1.1)" を使用って指定できます。
[--no](ネガティブプロンプト) Advanced -> Negative Prompt で指定します
画像プロンプト(Image Prompt):いわゆるimage2imageです。Fooocusは独自の画像プロンプトアルゴリズムを使用しているため、標準的なIP-AdaptersやRevisionsのような標準的なSDXLの技術を使う他のツールよりも、結果の品質とプロンプトの理解度が高いそうです。
無料でこれはすごいのでは…!
以上、「Fooocus」はまさに「Midjourney」や「にじジャーニー」をWebUIで「一人で使う」という感じの環境を構築できます。非常に少ないプロンプトで品質の高い画像を作ってくれます。しかも無料!
今回は「Fooocus」の使い方の基本を通して「Midjourney」「にじジャーニー」の高度な使い方も同時に学べる記事になりました。
オープンな技術として公開されているので「Midjourney」や「にじジャーニー」もどんどん進化していくでしょうね…!
次回は画像プロンプトについて解説していきます。
Fooocusを作ったlllyasvilさんの研究についても扱っていきたい!
関連記事
FooocusをGoogle Colabで使う方法、しかも日本語版です。
【いつものおしらせ】
AICUでは、「みんなで作るAI用語集」というプロジェクトを実施しています!AI用語とそれに関する解説を皆さんから募り、用語集を作成することが目的です。採用された方には報酬もご用意しています!ぜひチェックしてみてください。
https://note.com/aicu/membership
新しい用語、投稿歓迎! https://bit.ly/AIyougoEntry
メンバーシップ向けにGitHubで公開している
Fooocus 日本語アニメ特化版Google Colabへのリンクを紹介します
この記事が参加している募集
応援してくださる皆様へ!💖 いただいたサポートは、より良いコンテンツ制作、ライターさんの謝礼に役立てさせていただきます!