一覧に戻る
Lv.3

RLHF(人間フィードバック強化学習)

Reinforcement Learning from Human Feedback

人間の判断をAIに学習させ、回答の質をより人間に近づける技術。

簡単に説明すると

RLHFは、AIが出した複数の答えを人間が採点し、その結果をもとにAIを鍛え直す仕組みだよ。 ChatGPTのような対話型AIが、より自然で安全な返答をするために使われているんだ。 人間が良いと感じる自然な言葉づかいや、正しい情報の選び方をAIに覚えさせる際に活用されているよ。

名前のヒミツ

RLHF(アールエルエイチエフ)は、Reinforcement Learning from Human Feedbackを略した言葉なんだ。Reinforcement Learningは「強化学習」、Human Feedbackは「人間からの評価」という意味だよ。AIが人間の「こっちの方が良い」という感覚を直接学べるようにした手法のことなんだよ。

くわしく見てみよう!

RLHFとは、人間がAIの回答を評価して、その評価をもとにAIの学習をさらに進める手法のことだよ。
これまでのAIは、大量のデータからパターンを見つけるのは得意だったけど、人間にとって「自然か」「正しいか」を判断するのは難しかったんだ。
そこでRLHFを使って、人間の感覚をAIに教え込むんだよ。

具体的には、まずAIにいくつかの回答を作らせて、人間がそれらを「良い・悪い」や「順位」でランク付けするんだ。
このランク付けのデータを別のAIに学習させて、人間の好みを覚えさせるよ。
最後に、メインのAIがこの「人間の好み」に沿った高い点数をもらえるように、何度も練習を繰り返すことで、人間にとって使い勝手の良い回答ができるようになるんだ。

この仕組みは、AIが差別的な発言をしたり事実と異なる回答をしたりするのを防ぐためにも有効な技術だよ。
人間の倫理観や常識をAIの学習に反映させることで、より安全性の高いツールとして運用することができるんだ。

カテゴリAIデータ