メインコンテンツへスキップ

ノイズ潜在成分合成の例

Ryan1分以内

これらの画像を ComfyUIopen in new window にロードして、完全なワークフローを取得できます。

これはノイズ潜在成分合成の例です。ノイズ潜在成分合成とは、画像が完全にデノイズされる前に、潜在成分がまだノイズ状態にある時にそれらを合成することを指します。ポーズや被写体などの一般的な形状は最初のサンプリングステップで既にデノイズされているため、例えば特定のポーズを持つ被写体を画像の任意の位置に配置しながら、非常に高い一貫性を維持することができます。

これは一例です。この例には4つの画像が合成されています。1つの背景と3つの被写体です。 合計ステップ数は16ステップです。潜在成分は4ステップでサンプリングされ、各ステップで異なるプロンプトが使用されます。背景のサイズは1920x1088で、各被写体のサイズは384x768です。これら4ステップの後、画像はまだ非常にノイズの多い状態です。その後、被写体が背景に合成(貼り付け)され、いくつかのフェザリング効果が適用されます。そして、この合成画像に対して残りのサンプリングステップが実行されます。

これらの例はWD1.5 beta 3幻覚モデルを使用して作成されました。

例

被写体の位置を変更した後:

例

異なるノイズ潜在画像から合成された被写体が実際に相互作用していることがわかります。これは、プロンプトに「手をつないで」と入れたためです。また、背景の一貫性がどれほど高いかに注目してください。これはこの手法の強力さを示しています。

この技術にはいくつかの制限があります。例えば、目の色などの被写体の細部を制御することはできませんが、被写体の位置、ポーズ、全体的な色に関しては非常にうまく機能しているようです。