■R におけるビジュアライゼーション
▼Rとtidyverseにおけるビジュアライゼーションの基礎知識
よく使われるもの
ggplot2、
Plotly や Lattice、RGL に Dygraphs、Leaflet、
Highcharter、Patchwork、gganimate、 ggridges
ggplot2 のコアな概念、 具体的には
エステティック:プロット中のオブジェクトの視覚的特性
geom:データを表現するために使う 幾何学的なオブジェクト
facet(ファセット):データの小さなグループや サブセットを条件ごとに別々に表示するもの
ラベルと注釈:プロットをカスタマイズするためのもので
プロットの目的を伝えたり、重要なデータを 強調したりするためにタイトルやサブタイトル、
キャプションなどのテキストを追加できます。
▼実践編:ggplot2 を使ったデータビジュアライゼーション
コードを使って独自のプロットを作成するには、以下 3 つの手順に沿って作成しましょう。
1. ggplot() 関数を使い、扱うデータセットを選択します。
2. データを表示するために、geom_ 関数を追加します。
3. aes() 関数の引数に、プロットしたい変数を代入します。
例:ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g))
▼はじめての ggplot()
▼R でビジュアライゼーションをする際のよくあるエラー
大文字と小文字の区別
括弧と引用符のバランス
プラス記号によるレイヤーの追加
▼ジョセフ:ピープル アナリティクスへのキャリアパス
▼R におけるビジュアライゼーションの強化
カラーを追加する。
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,color=species))
形を変える
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,shape=species))
両方同時
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,shape=species,color=species))
さらに大きさを変える。
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,shape=species,color=species,size=species))
透明度を加える。
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,alpha=species))
とりあえず色を紫にする。
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g),color=”purple”)
▼ggplot をさらに使いこなす
geomの種類
geom_point
geom_bar
geom_line
など
▼エステティックと facet(ファセット)
ファセットには2種類ある
facet_wrap()
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,color=species))+facet_wrap(~species)
facet_grid()
ggplot(data=penguins)+geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,color=species))+facet_grid(sex~species)
▼ggplot の構成要素
グラフにタイトルを追加するには、labs() 関数
評価の低い製品を強調するには、以下の aes() 関数を使用します:
col = ifelse (x<2, ‘blue’, ‘yellow’)
▼labs(ラベル)と annotate(注釈)関数
ラベルをつける
ggplot(data=penguins)+
geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,color=species))+
labs(title=”Palmer Penguins:Body Mass vs, Flipper Length”)
サブタイトルをつける
ggplot(data=penguins)+
geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,color=species))+
labs(title=”Palmer Penguins:Body Mass vs, Flipper Length”,subtitle=”Sample of three Penguin Species”)
キャプションをつける(動画が見切れていてうまくいかない)
ggplot(data=penguins)+
geom_point(mapping = aes(x=flipper_length_mm,y=body_mass_g,color=species))+
labs(title=”Palmer Penguins:Body Mass vs, Flipper Length”,subtitle=”Sample of three Penguin Species,
caption=”Data collected by Dr.Kristen Gorman”)
注釈をつける
annotate(“text”,x=220,y=3500,label=”The Gentoos are the largest”)
▼ビジュアライゼーションを保存する
ggsave()をつかう。
ggsave(“Three Penguin Species,png”)
▼ウィークリーチャレンジ4
2回目、80%でギリギリ合格。
コメント