音声認識とは？ | TapUp デジタル用語辞典

音声認識とは、マイクなどで拾った人間の声を解析して、文字データに変換する技術のことなんだ。
特定の指示として受け取って、コンピュータを操作することにも使われるよ。

まず、コンピュータは取り込んだ音の波形を細かく分析して、音の特徴を抜き出すよ。
次に、その特徴がどの言葉に近いかを、あらかじめ学習した膨大なデータの中から探し出すんだ。

AIを活用した仕組みでは、周りの雑音や一人ひとりの話し方のクセを分析し、言葉を正確に読み取ることができるんだ。
ざっくり言うと、コンピュータの中に巨大な辞書と音のお手本があって、それらと照らし合わせることで言葉を特定しているんだ。

音声認識の技術は、私たちの身近なところでたくさん活躍しているんだ。
スマホの音声アシスタントやカーナビの操作、耳が不自由な人のためのリアルタイム字幕作成など、活用される場面は幅広く存在しているよ。

音声認識