アノテーターとは、アノテーションを行う人材のこと。アノテーションワーカーという呼び名もある
アノテーションとは、画像、テキスト、音声、動画など様々な対象に対するラベルづけのことで、機械学習においては教師データを作る上で欠かせない重要な作業である。アノテーターはアノテーション作業を実際に行う作業スタッフのことを指し、職業として認知されるようになったのは近年のことだ。
アノテーション作業は専用ツールを利用する場合もあれば、複数人でデータを共有しながら人力で分類していく場合もあり、作業対象とするデータの形式や種類も所属する企業や環境によってさまざまである。そして、アノテーションの検証方法にも以下のようにいくつかのパターンがあり、対応する業務に応じて使い分けられる。
- シングルパス:一人のアノテーターで作業を完結させる方法
- ダブルブラインドテスト:二人のアノテーターが別々にアノテーションを行い、結果が異なる場合は別の監督者により判断する方法
- マルチブラインドテスト:三人以上のアノテーターが別々にアノテーションを行い、結果が異なる場合に多数決、もしくは監督者の裁定により決定する方法
近年のAIの普及に伴い、アノテーターの需要は急増している。教師データの作成ツールを提供するサービスやアノテーションの代行を請け負うサービスなど、AI開発を支援するサービスも多様に展開されている。アノテーターを自社でかかえている企業もあるが、必要に応じて外注するのが一般的だ。
パソコンとネット回線さえあれば在宅でも対応可能であることから、クラウドソーシングに登録し、アルバイトとして仕事を得ているアノテーターもいる。ただし、アノテーションはデータへのラベルづけの単純作業とは限らない。適切な抽象度を鑑みてラベリングする高度なノウハウが求められる場合もあれば、医療画像に対するラベルづけなど、専門的な知識がないと正しい回答を紐づけられないような場合もある。外注する場合には、対応するアノテーターのスキルや人材育成の仕組みなど、実績以外の側面からも十分な確認をすることを推奨する。