強化学習とは？ | TapUp デジタル用語辞典

強化学習とは、AIがある環境の中で行動し、その結果として得られる報酬を最大にすることを目指す学習方法のことだよ。
AIは最初、何が正しい行動なのか全く分からない状態からスタートするんだ。

そこで、AIに具体的な正解を教える代わりに、行動の良し悪しをスコアや得点といった報酬で伝えていくよ。
AIは何度も試行錯誤を繰り返す中で、どのような順番で動けばより高い報酬がもらえるかを学んでいくんだ。

強化学習は「教師あり学習」のように正解のデータがあらかじめ与えられるわけではないため、AIが自発的に人間も気づかなかったような未知の戦略を編み出すこともあるよ。
また、目先の報酬だけでなく、最終的に得られる合計の報酬を最大化するために、あえて一時的に不利な行動を選ぶといった高度な判断も学習できるようになるんだ。

この仕組みは、ロボットの歩行訓練や囲碁などのボードゲーム、自動運転技術といった複雑な判断が必要な分野で活用されているよ。
あらかじめ全ての正解を用意するのが難しい場面でも、AIが自らより良いやり方を見つけ出せるのが大きな特徴なんだ。

強化学習

簡単に説明すると

名前のヒミツ

くわしく見てみよう！