■データ演算を始める
▼データ演算
▼一般的な計算式
▼関数と条件
COUNTIF関数
SUMIF関数
▼複数の条件を持つ関数
SUMIFS関数
COUNTIFS関数
▼複合関数
SUMPRODUCT関数
■ピボット
▼ピボットテーブルを使う
▼ピボットテーブルの構成要素
ピボットテーブルは行、列、値、およびフィルタの 4 つの基本的な要素で構成されています。
▼ピボットテーブルを分析に活用する
■SQL計算の詳細
▼クエリと計算
モジュロ演算子:モジュロ演算子は割り算の余りを返します
▼簡単な計算をSQLに埋め込む
▼他の構文による演算処理
GROUP BY
ORDER BY
■データ検証のプロセス
▼確認、そして再確認
▼データ検証の種類
・データ型
目的:データがフィールドに定義されたデータ型と一致するかどうかを確認します。
例:小学校の学年 1 ~ 6 のデータ値は、数値データ型でなければなりません。
制限:データ値 13 はデータ型検証は通過できますが、範囲外の値です。この場合、データ範囲の検証も必要になります。
・データ範囲
目的:データがフィールドに定義された値の許容範囲内にあるかを確認します。
例:小学校の学年のデータ値は 1 から 6 の範囲内でなければなりません。
制限:データ値 5.5 は許容範囲内に含まれ、そして数値データ型としても成立します。しかし、 5.5 という学年は存在しないため、本来許容されるべきではありません。この場合、データ制約の検証も必要になります。
・データ制約
目的:データがフィールドの特定の条件または基準を満たしているかを確認します。これには、入力されたデータ型だけでなく、文字数など他の属性も含まれます。
例:内容の制約:この場合、小学校の学年 1 ~ 6 のデータ値は整数でなければなりません。
制限:データ値 13 は整数なので、内容制約の検証は通過します。しかし、 13 は学年として存在しないため、許容されるべきではありません。この場合、データ範囲の検証も必要になります。
・データの一貫性
目的:データが他の関連データのコンテキストで意味をなすか確認します。
例:製品の出荷日のデータ値は、製造日よりも早くなることはありません。
制限:データの整合性は取れていても、不正確または間違っている場合があります。この場合、出荷日のデータ値が生産日より後であったとしても、不正確である可能性があるということです。
・データ構造
目的:データが設定された構造に沿っているか、または適合しているかを確認します。
例:ウェブページが正しく表示されるためには、設定された構造に沿っている必要があります。
制限:データ構造が正しくても、データそのものが不正確または誤っている場合があります。ウェブページのコンテンツが正しく表示されていても、間違った情報が含まれている可能性があるということです。
・コード検証
目的:ユーザーのデータ入力時に、アプリケーションのコードが前述のいずれかの検証を体系的に実行できているかどうかを確認します。
例:コード検証で発見されるよくある問題として、複数のデータ型が許可されている、データ範囲のチェックが行われていない、テキスト文字列の終了が適切に定義されていない、などがあります。
制限:コード検証では、データ入力で起こりうるすべてのバリエーションを検証できない可能性があります。
データ分析の 6 つのフェーズは以下の通りです。
問いかけ、準備、処理、分析、共有、行動
■SQLにおける一時テーブルの使用
▼一時テーブルについて
WITH句
▼複数のテーブルの種類
SELECT INTO 構文(ただしBigQueryでは認識しない)
CREATE TEMP TABLEを使う
▼一時テーブルの操作
■ウィークリーチャレンジ4
87.50%で合格。
■コースチャレンジ
ちょっとこのコースは短かったのですが、
無事に92.31%で合格しました。
コメント