自己符号化器とは?

AI
検索エンジン

自己符号化器(auto encoder) とは

自己符号化器(auto encoder) とは,入力を訓練データとして使い,データをよく表す特徴を獲得するニューラルネットワークです.
教師データを使わない教師なし学習に分類され,ニューラルネットワークの事前学習や初期値の決定などの利用されます.
https://qiita.com/ta-ka/items/44f4288e8723a7bc9a75

自己符号化器はニューラルネットワークによる教師なし学習の代表的な応用であり,出力が入力に近づくようにニューラルネットを学習させる.主に次元削減のために利用されることが多く,活性化関数に恒等写像を用いた場合の 3 層の自己符号化器は主成分分析(PCA)と同様の結果を返す.自己符号化器を多層化すると,ディープニューラルネット同様に勾配消失問題が生じるため,複雑な内部表現を得ることは困難であった.この問題に対して 2006 年頃にHintonらは,単層の自己符号化器に分割し入力層から繰り返し学習させる層ごとの貪欲法を積層自己符号化器に適用することで,汎用的な自己符号化器の利用を可能とした.また,自己符号化器の代表的な応用例としてノイズ除去、ニューラルネットの事前学習、異常検知がある.

活性化関数

活性化関数は、入力信号の総和がどのように活性化するかを決定する役割を持ちます。これは、次の層に渡す値を整えるような役割をします。

一般的に、
「単純パーセプトロン」の活性化関数では、「ステップ関数」などが使われ、
「多層パーセプトロン(ニューラルネットワーク)」の活性化関数では、「シグモイド関数、ソフトマックス関数」や恒等関数が使われます。
また、これら「ステップ関数、シグモイド関数、ソフトマックス関数」を非線形関数と呼ぶのに対し、「y=cx」のような関数を線形関数と呼びます。

活性化関数のまとめ(ステップ、シグモイド、ReLU、ソフトマックス、恒等関数) - Qiita
ゼロから作るDeep Learning 活性化関数とは 活性化関数は、入力信号の総和がどのように活性化するかを決定する役割を持ちます。これは、次の層に渡す値を整えるような役割をします。 一般的に、 「単純パーセプトロン...
やっぱりよく分からない活性化関数とは - AI人工知能テクノロジー
やっぱりよく分からない活性化関数とは この記事ではニューラルネットワークに必要な要素の一つ、活性化関数について説明します。 ただ、その前に簡単にニューラルネットワークについておさらいをしたいと思います。 ニューラルネットワークは人間の脳をモデル化したもので、複数のニューロンから構成されています。ニューロンは入力層、中間...

主成分分析(PCA)

主成分分析(しゅせいぶんぶんせき、英: principal component analysis; PCA)は、相関のある多数の変数から相関のない少数で全体のばらつきを最もよく表す主成分と呼ばれる変数を合成する多変量解析の一手法。データの次元を削減するために用いられる。

主成分を与える変換は、第一主成分の分散を最大化し、続く主成分はそれまでに決定した主成分と直交するという拘束条件の下で分散を最大化するようにして選ばれる。主成分の分散を最大化することは、観測値の変化に対する説明能力を可能な限り主成分に持たせる目的で行われる。選ばれた主成分は互いに直交し、与えられた観測値のセットを線型結合として表すことができる。言い換えると、主成分は観測値のセットの直交基底となっている。主成分ベクトルの直交性は、主成分ベクトルが共分散行列(あるいは相関行列)の固有ベクトルになっており、共分散行列が実対称行列であることから導かれる。

主成分分析は純粋に固有ベクトルに基づく多変量解析の中で最も単純なものである。主成分分析は、データの分散をより良く説明するという観点から、そのデータの内部構造を明らかにするものだと考えられる。多くの場合、多変量データは次元が大きく、各変数を軸にとって視覚化することは難しいが、主成分分析によって情報をより少ない次元に集約することでデータを視覚化できる。集約によって得られる情報は、データセットを元のデータ変数の空間から主成分ベクトルのなす空間へ射影したものであり、元のデータから有用な情報を抜き出したものになっている。主成分分析によるデータ構造の可視化は、可視化に必要なだけ先頭から少数の主成分を選択することで実現される。

主成分分析は探索的データ解析(英語版)における主要な道具であり、予測モデル構築(英語版)にも使われる。主成分分析は観測値の共分散行列や相関行列に対する固有値分解、あるいは(大抵は正規化された)データ行列の特異値分解によって行われる。主成分分析の結果は主成分得点(因子得点、英: score)と主成分負荷量(因子負荷量、英: loadings)によって評価される。主成分得点とは、あるデータ点を主成分ベクトルで表現した場合の基底ベクトルにかかる係数であり、ある主成分ベクトルのデータ点に対する寄与の大きさを示す。主成分負荷量はある主成分得点に対する個々の(正規化された)観測値の重みであり、観測値と主成分の相関係数として与えられる。主成分分析は観測値の間の相対的なスケールに対して敏感である。

主成分分析による評価は主成分得点と主成分負荷量をそれぞれ可視化した主成分プロット、あるいは両者を重ね合わせたバイプロットを通して解釈される。主成分分析を実行するためのソフトウェアや関数によって、観測値の基準化の方法や数値計算のアルゴリズムに細かな差異が存在し、個々の方法は必ずしも互いに等価であるとは限らない(例えば、R言語における prcomp 関数と FactoMineR の PCA 関数の結果は異なる)

 

やっぱりよく分からない活性化関数とは - AI人工知能テクノロジー
やっぱりよく分からない活性化関数とは この記事ではニューラルネットワークに必要な要素の一つ、活性化関数について説明します。 ただ、その前に簡単にニューラルネットワークについておさらいをしたいと思います。 ニューラルネットワークは人間の脳をモデル化したもので、複数のニューロンから構成されています。ニューロンは入力層、中間...

 

主成分分析の考え方 | Logics of Blue
最終更新:2017年7月20日主成分分析は、多種類のデータを要約するための強力なツールです。この記事では、主成分分析の考え方・計算の方法、そしてR言語を用いた実装方法について説明します。まずは、主成分分析とは何者で、計算結果をどのように解釈したらよいのかを学んでください。そのうえで、ggplot2を使った美麗なグラフの...

 

 

 

タイトルとURLをコピーしました