適応サンプリングを用いた学習アルゴリズムの解析方法


機械学習における学習アルゴリズムの振る舞いを解析する方法ついて、これまで に実験的や理論的に研究が行われてきた。しかしながらら、事例空間が広く なるに従い、計算時間が爆発的に増加したり、また学習アルゴリズムの数学的モ デル化が困難なために、現実に学習アルゴリズムの振る舞いを解析することは困 難であった。

我々はランダムサンプリングを用いることで、これらの問題点を解決し、AdaRCA アルゴリズムを提案した。AdaRCA では、事例空間より訓練事例を受け取り、そ れを学習アルゴリズムに入力し、仮説の分類精度を測定する。この試行を充分な 回数繰り返し、その平均値を学習アルゴリズムの平均分類精度とするものである。

ランダムサンプリングでは適当なサンプルサイズ(AdaRCA では試行回数)を 決定することが重要であるが、我々は適応型サンプリングを AdaRCA に適用させ 、また分類精度の最大値と最小値を推測することで、サンプルサイズを過大に見 積ることなく解析できることを可能とした。 AdaRCA を用いることで学習アルゴ リズムの分類精度の解析が柔軟に行うことができる。