拡散モデルとは？ | TapUp デジタル用語辞典

拡散モデルとは、データに意図的にノイズを加えてから、それを元のきれいな状態に戻す方法を学習するAIの仕組みのことだよ。
主に画像生成の分野で活躍していて、画像生成AIを支える重要な技術の一つなんだ。

仕組みのベースには、ノイズを加える過程と、取り除く過程の2つがあるんだよ。
まず学習の段階では、AIにきれいな画像を見せて、そこに少しずつ砂嵐のようなノイズを足していく。
最後には元の形が全くわからない完全なノイズにしてしまうんだ。

次に、AIにはその逆の作業を練習させる。
つまり「ノイズだらけの状態から、少しずつノイズを取り除いて元のきれいな画像に戻す」という方法を何度も学習させるんだよ。
ノイズを減らして自然なデータに近づける法則を学習することで、AIはただのランダムなノイズからでも、入力された条件に沿った新しい画像を作り出せるようになるってことなんだ。

これまでの画像生成技術と比べて、本物と見間違えるほど高画質で、より複雑な表現ができるのが強みだね。
広く使われている高品質な画像生成サービスの多くは、この仕組みを取り入れて開発されているんだよ。

拡散モデル

簡単に説明すると

名前のヒミツ

くわしく見てみよう！