教師なし学習は、ラベル付けされた応答がない入力データを使って推論を行うタイプの機械学習のアルゴリズムです。
最も一般的な教師なし学習の手法は、クラスター分析です。これは、データ内の隠れたパターンやグループ化を発見する探索的データ解析に使用されます。クラスターは、ユークリッド距離や確率的な距離などの指標に基づいて定義される類似度の尺度を使ってモデル化されます。
一般的なクラスタリング アルゴリズムには次のようなものがあります。
階層クラスタリング: クラスターツリーを作成して複数のレベルをもつ階層的なクラスター群を構築します。
k 平均法クラスタリング: クラスターの重心までの距離に基づいてデータを k 個の異なるクラスターに分割します。
混合ガウスモデル: 多変量正規密度コンポーネントの混合としてクラスターをモデル化します。
自己組織化マップ: データのトポロジーと分布を学習するニューラルネットワークを使用します。
隠れマルコフモデル: 状態の系列を観測データから復元するために利用します。
教師なし学習
機械学習の手法のひとつである教師なし学習について解説します。教師なし学習は、学習データに人間が正解のラベルを与えずにデータセットから推論を行います。k平均法や階層クラスタリングといった一般的なアルゴリズムや、応用についても解説します。
機械学習の中の一つの手法であり、正解のないデータから共通する特徴を持つグループに分けたり(クラスタリング)、データを特徴づける情報を抽出する(次元削減)などの手法があります。
教師なし学習
教師なし機械学習アルゴリズムは、既知つまりラベル付きの結果を参照せずにデータセットからパターンを推察します。教師あり機械学習とは異なり、教師なし機械学習手法を回帰や分類の問題に直接適用することはできません。出力データの値がどのようなものになるかわからないため、通常の方法ではアルゴリズムをトレーニングできません。しかし、教師なし学習は、データの基盤となる構造を見つける場合には使用できます。
教師なし機械学習
教師なし機械学習は、教師あり機械学習とは対照的に、既知つまりラベル付きの結果を参照せずにデータセット内のパターンを推察します。