一覧に戻る
Lv.2

オーバーフィッティング(過学習)

Overfitting

AIが学習データに慣れすぎて、新しいデータで正しく予測できなくなる現象。

簡単に説明すると

オーバーフィッティングとは、AIが学習データに対して過剰に適応してしまい、新しいデータでの予測精度が落ちてしまう現象のことだよ。 機械学習でモデルを訓練する際に、データの細かなノイズまで学習してしまうことで発生するんだ。どれだけ学習データでの成績が良くても、実際の運用では正しく機能しないという特徴があるよ。

名前のヒミツ

Overfitting(オーバーフィッティング)は、Over(過剰に)とFitting(当てはめる)を組み合わせた言葉だよ。 AIが学習データに合わせようとしすぎる様子を表しているんだ。日本語では「過学習」という名前で広く知られているよ。

くわしく見てみよう!

オーバーフィッティングとは、AIが学習に使ったデータにだけ過剰に適合してしまい、未知のデータに対して正しく反応できなくなる現象のことだよ。
ざっくり言うと、AIが「練習」では満点なのに、「本番」ではボロボロになってしまうようなイメージなんだ。これを防ぐことは、精度の高いAIを作るために避けては通れない課題だね。

この現象が起きる主な原因は、学習に使うデータの量が足りなかったり、AIに複雑すぎる学習をさせたりすることにあるんだ。
AIがデータの中にあるたまたま含まれていたノイズまで重要なルールだと勘違いして覚えてしまうんだよ。そのせいで、新しいデータを見たときに、その無意味なルールに縛られて間違いを起こしてしまうんだ。

防ぐための対策としては、学習データを増やしたり、学習のステップを途中で止めたりする方法が一般的だよ。
また、学習用とは別のテスト用データを用意して、定期的に実力をチェックする手法もよく使われているんだ。AIが丸暗記ではなく共通する特徴を正しくつかめるように調整することが大切だね。

カテゴリAIデータ