ディープラーニングを含めて機械学習において精度の高い学習をするために

G検定

ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する標準化や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る主成分分析(PCA)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う局所コントラスト正規化などが前処理として利用され,OpenCVなどの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化するbag-of-wordsや文章に含まれる単語の重要度を特徴量とするTF-IDFなどがある.

タイトルとURLをコピーしました