■はじめに:完全性の確保
▼なぜデータ完全性が重要なのか
正確性、一貫性、完全性
▼データ完全性とコンプライアンス
▼目的とデータ完全性の両立
▼目的とデータの整合性
クリーンなデータがあり、整合性が取れていれば、正確なインサイトを得ることができ、
データに裏付けされた結論を出すことができます。
整合性が取れているが、データクリーニングが必要な場合は、
分析を始める前にデータをクリーニングしましょう。
もしデータが部分的にしか目標と整合していない場合は、
目標を修正する方法を考えるか、データに制約を加え、
データのサブセットがビジネス上の目的により一致するようにしましょう。
▼不十分なデータへの対応
▼サンプルサイズの重要性
サンプル サイズを決める際は、以下のことに注意しましょう。
30 未満のサンプル サイズは使用しないようにしましょう。
サンプルの平均結果が母集団の平均結果を表す最小のサンプルサイズは30である、
と統計的に証明されています。
信頼度は95%が最も一般的ですが、場合によっては 90% でもよいとされています。
・信頼度: あるサンプルサイズが、より大きな母集団を正確に反映する確率
・母集団: データ分析において、データセットに含まれるすべてのデータの値
・サンプル: 母集団全体から抽出した一部のセグメント
・誤差の範囲: サンプルの結果が実際の母集団の結果と異なることが許容される最大値
▼統計的検定力を活用する
統計的検定力は 通常1からの値で示されることを知っておいてください。
つまり、統計的検定力が0.6であれば それは60%ということです。
▼最適なサンプルサイズを決定する
▼データの信頼性を評価する
▼ウィークリーチャレンジ1
3回目で96.88%で合格。かなり記憶が怪しいな
コメント