MoE（混合エキスパート）とは？ | TapUp デジタル用語辞典

MoEとは、巨大なニューラルネットワークの中に、それぞれ異なる役割を持った複数の小さなネットワークを用意して、入力されたデータに応じて適切なものだけを動かす技術のことなんだよ。
複数の専門的なネットワークが協力し合うことで、1つの巨大な知能として機能する構造になっているんだ。

従来のAIは、どんなに簡単な質問でもシステム全体を動かす必要があったから、AIを巨大にすればするほど計算コストが膨大になってしまうという課題があったんだよ。
そこでMoEでは、AIを「エキスパート」と呼ばれる多数の小さなパーツに分割して、司令塔役がどのエキスパートを使うべきかを瞬時に判断する仕組みを採用したんだ。

イメージとしては、100人の専門家がいる会議室で、全ての質問に全員で答えるのではなく、内容に合わせて最適な3人だけが答えるようなものだね。
こうすることで、AIの知識の細かさを表すパラメータの数は増やして賢さを上げつつ、実際に動かす時に使う計算パワーは最小限に抑えることができるんだ。