金融翻訳者の日記

自営業者として独立して十数年の翻訳者が綴る日々の活動記録と雑感。

「過学習」は「汎化性能」を低下させる

出会った言葉:
「汎化性能を上げるためになるべく過学習しないようにパラメーターを調節している」
(あるハッカソン(プログラム関連コンテスト)に参加した学生のインタビューから)

*「ハッカソン」って、一定のデータ(たとえば3万件)のデータを与えられ、それを元に自分でプログラムを作って機械学習させ、何らかの推定値を出し、その精度を競うもの(らしい)なのだが、結果を競うのは与えられたデータではなく、未知のデータ。
つまり「はい終了です!」でプログラミングが終了すると、それまで使ったデータとはちがうデータにプログラムを適用して精度が争われるのだそうです(ここは審査員がやる)。途中経過で発表される順位は既知データに基づくものなのであくまでも暫定順位。本当の順位は、修了後の審査で判定されるわけ。

ここで「過学習」とは一般的な学習させすぎ、という意味ではなく、既知データ(訓練データ)に対して学習されているが、未知データ(テストデータ)に対しては適合できていない状態のこと。発言中の「汎化性能」とはつまり、未知のテストデータに対する識別能力のことなのだとか。

これで思い出したのが新井紀子先生の一節。「そして、ついに恐れていたことが起こります。……RST(リーディングスキル・テスト:新井先生が著書で紹介している基礎読解力を測るテストのこと。詳しくは『AIに負けない子どもを育てる』新井紀子著 東洋経済新報社刊を参照)の問題をドリルとして毎日やらせる学校や自治体が現れたのです(同書p166)。

この問題は世の中のあらゆる試験に当てはまること。たとえばTOEIC。試験対策のための訓練だけをしても、汎化性能つまり英語の総合力が上がるとは限らない、っていうことなのですね。こういうことを自分の息子(ハッカソンに参加しました)から教わるとは思わなんだ。