リストワイズ法とは?

G検定
R 欠損値の対応(missing value treatment) - 統計学と疫学と時々、助教生活
今回は、欠損値の発生する理由を紹介し、その後に書籍を参考に欠損値に対応するRのコードを紹介します。 医学研究だけでなく、様々な調査をしていると欠損値(missing value)に出会います。欠損値が発生しているメカニズムによっては、結果を大きく変える可能性もあります。そのため、まずは欠損値のメカニズムを把握すること、...

リストワイズ削除では、指定された変数の少なくとも1つに欠損値がある場合、ケースは分析から除外される。
分析は、完全なデータセットを持つケースでのみ実行される。リストワイズはべらぼうにデータ量が多かったり欠損が少ない時はサクッとできるので便利。

分析に利用するデータには多くの場合、なんらかの理由により記録されなかった値、欠損値 (欠測、欠落 missing data) が含まれます。全ての変数の値が観測されているデータを完全データ (complete data) と呼びます 。これに対して欠損が含まれるデータは不完全データ (incomplete data) と呼ばれます。 データ件数が増えるほど、なんらかの理由によりデータとなる傾向にあります。それは後に述べるように欠損がランダムな事象により生じることが多いためです。

欠損値の処理
欠損データの処理
タイトルとURLをコピーしました