深層学習のための、ランダムな画像切り抜きと貼り付けを用いた新しいデータ拡張手法の提案

膨大なパラメータを持つ深層畳み込みニューラルネットワーク(Convolutional Neural NetWork; CNN)は, 画像処理の分野において大きな成果をあげている. しかし, 学習データに対して膨大すぎるパラメータを持つ深層CNNは, 常に過学習を起こすリスクを負う. この問題を解決するために, 学習データの擬似的な水増しを行う, data augmentationの手法がいくつか提案されてきた. 画像反転,くり抜き,拡大縮小や色彩情報の変換などのdata augmentationは, 学習データに対する過学習を抑制し, 深層CNNのより高い性能の実現に貢献してきた. 本研究では, このようなdata augmentationの手法をさらに発展させ, 4枚の異なる画像をそれぞれランダムにくり抜き, それらを貼り合わせて新たな学習画像を構成する, 新たなdata augmentationの手法を提案し, 画像処理の更なる高精度化を目指す.

本研究は総務省 戦略的情報通信研究開発推進事業(SCOPE)の委託を受けて行われた.