docomo主催のGaccoというeラーニングで、
総務省統計局が行っている「社会人のためのデータサイエンス入門」というのがあり、
急遽参加いたしました。
それというのも10月4日から「社会人のためのデータサイエンス演習」というのを受講するため、
まずは基本となる入門編を受けることにしたわけです。
すでに9月1日に開講しているので、
追っかける形になります。
以下、1週目メモ
・データ分析に対する投資は平均13倍になって帰ってくる。
・PPDAC Problem(問題の発見) Plan(調査の計画) Data(データの収集) Analysis(分析) Conclusion(結論)
・平均値の見方
平均値:データバランスよく釣り合う値
極端な数値、ゆがんだ数値がある場合は中央値でみる
・労働人口 6577万人
非労働力人口 4506万人
・女性の労働力人口比率 M字カーブ
・太陽光発電システムについて
1-6. 付加価値額と非正規職員比率の関係~分析事例(4)
1-7. スポーツをデータで科学する~分析事例(5)
何を説明したいのか=被説明変数
勝つためには何をすればよいか=説明変数
決定係数R二乗がが多い方が説明しやすい
1-8. 合計特殊出生率の見方~分析事例(6)
日本は超高齢社会(27.3%)
合計特殊出生率と共働き率の関係(R二乗が低い)
1-9. 国際比較データから日本社会を読み解く~分析事例(7)
台湾も韓国も出生率が低い
欧米はゆっくりと進行、一部では回復もしている。
日本は平均寿命が高い
(ただしGDPの割合は中程度)
テスト受けましたが、正解率40%でダメダメだったので、
ちょっと真剣に学ぶ必要がありそうです。
コメント