一覧に戻る
Lv.3

拡散モデル

Diffusion Model

ノイズを少しずつ取り除いて新しいデータを作り出すAIの仕組み

簡単に説明すると

拡散モデルっていうのは、データに意図的にノイズを加えてから元のきれいな状態に戻す方法を学習するAIの仕組みのことだよ。 AIは画像に砂嵐のようなノイズを少しずつ足して、元の形がわからなくなるまで崩していくんだ。 そして今度は逆向きに、ノイズだらけの状態から少しずつノイズを取り除いてきれいな画像へ戻していく過程を何度も練習するよ。 この法則を身につけることで、ただのランダムなノイズからでも条件に沿った新しい画像を生成できるようになって、高品質な画像生成サービスを支える技術になっているんだ。

名前のヒミツ

英語表記は「Diffusion Model(ディフュージョン・モデル)」だよ。 Diffusion(拡散)とは、コップの水にインクを垂らした時に、色が少しずつ全体に散らばって混ざっていく現象のこと。 データに対して、このインクのようにノイズを徐々に広げていく処理を行うことから名付けられたんだ。

くわしく見てみよう!

拡散モデルとは、データに意図的にノイズを加えてから、それを元のきれいな状態に戻す方法を学習するAIの仕組みのことだよ。
主に画像生成の分野で活躍していて、画像生成AIを支える重要な技術の一つなんだ。

仕組みのベースには、ノイズを加える過程と、取り除く過程の2つがあるんだよ。
まず学習の段階では、AIにきれいな画像を見せて、そこに少しずつ砂嵐のようなノイズを足していく。
最後には元の形が全くわからない完全なノイズにしてしまうんだ。

次に、AIにはその逆の作業を練習させる。
つまり「ノイズだらけの状態から、少しずつノイズを取り除いて元のきれいな画像に戻す」という方法を何度も学習させるんだよ。
ノイズを減らして自然なデータに近づける法則を学習することで、AIはただのランダムなノイズからでも、入力された条件に沿った新しい画像を作り出せるようになるってことなんだ。

これまでの画像生成技術と比べて、本物と見間違えるほど高画質で、より複雑な表現ができるのが強みだね。
広く使われている高品質な画像生成サービスの多くは、この仕組みを取り入れて開発されているんだよ。

カテゴリAI