■データ探索とは
▼適切なデータを選択する
▼データの構造化について
構造化データ: 行や列など一定のフォーマットで整理されたデータ
非構造化データ: 簡単に識別できるような方法で整理されていないデータ
▼データモデリングの階層とテクニック
データモデリングとは、データがどのように組織化され、構造化されているかを可視化し、
図を作成するプロセスです。 この可視化したものがデータモデルと呼ばれます。
データモデリングは、家の設計図と考えることができます。
常時、電気技師、大工、配管工がその設計図を使っているでしょう。
これらの建築業者はそれぞれ設計図に対して異なる関係性ですが、
家の全体的な構造を理解するためには、全員が設計図を必要とします。
データモデルも同様で、ユーザーによって必要とするデータは異なるかもしれませんが、
データモデルによって、全体の構造を理解することができます。
▼データモデリングの階層
概念データモデルは、データが組織全体でどのように相互作用するかなど、
データ構造のハイレベルな視点を示します。概念データモデルはたとえば、
新しいデータベースのビジネス要件を定義するためなどに使用されます。
概念データモデルには、技術的な要素は含まれません。
論理データモデルは、リレーションシップ(関係)、アトリビュート(属性)、
エンティティ(実体)など、データベースにおける技術的な詳細に焦点を当てます。
論理データモデルはたとえば、個々の記録がデータベース内でどのように一意的に識別されるかを
定義するためなどに使用されます。ただし、データベース の表名は物理データモデルにあたります。
物理データモデルは、データベースがどう機能するかを示します。物理データモデルでは、使用するすべてのエンティティと属性を定義します。
たとえば、データベースの表名、列名、データの型などが含まれます。
▼ブール論理を理解する
AND,OR,NOT,
▼なぜデータ変換をするのか?
データ変換の目的には、以下のようなものがあります。
データの整理: 整理されたデータは扱いやすくなる。
データの互換:異なるアプリケーションやシステムで同じデータを使用できるようになる。
データの移行:フォーマットが一致するデータを、あるシステムから別のシステムに移行することができる。
データの統合:同じ構成のデータを統合することができる。
データの拡張:データをより詳細な項目で管理することができる。
データの比較:データを同じ条件で比較することができる。
▼ウィークリーチャレンジ1
2回目のチャレンジで87.5%で合格
途中、Kaggleの説明とか出てきて、
若干意味不明なセッションでした。
コメント