Glossary

教師データ

教師データとは、機械に学習させるために作成した正解データ及び不正解データのこと。

機械学習は、AI(人工知能:Artificial Intelligence)を実現するための手法の1つで、その中でも、機械に正解のデータを教えていく学習手法が「教師あり学習」と呼ばれる。

この教師あり学習を実施するにあたっては、機械に正解データ及び不正解データをインプットしていく必要がある。機械が学習すればするほど、すなわち学習精度が高いデータを大量にインプットすればするほど、より精度が高い結果をアウトプットすることが可能となる。

身近な例で言うと、受信メールが迷惑メールかどうかを自動的に判定する仕組みは、過去の類似パターンを機械が学習しているため自動的に振り分けることが可能となる。万が一漏れがあった場合でも、受信者に迷惑メールだと報告してもらうことで新たなパターンを学習し、精度を高めていくサイクルが回っている。

また、画像内の物体を「人」「猫」「犬」などと判定し自動的に分類するという手法も、予め画像内の物体を線で囲ってラベル(注釈)を付与し、それらを大量に学習することで自動分類が可能となる。

このように、機械に学習させるために作成した正解データ及び不正解データを教師データと呼び、教師データを作成する業務をアノテーションと呼ぶ。