データベース

第9章 データベース

データベース

データベースは、データの集合体で、各データを追加/削除/加工できるように一元化したデータ管理システムのこと。データベースは、図書館のように精緻に管理されるべきもので、各データが不整合的に管理されているものはデータベースとは言えない。ここでは、データベース作成の基本について説明します。

データベース

 データベースとは、データの集合体です。業務上のデータを管理する際に活用するもので、商品データ、顧客データ、取引データなど、様々なデータを一元管理できるため、現代ではデータベースが広く普及しています。

データベースの種類

データベースには主に4つの種類がある。

  • 階層型データベース
  • 網型データベース
  • 関係データベース

データベースはただデータを格納するだけでなく、格納したデータをコンピュータが活用しやすいように構造化されている。


◆階層型データベース

階層型データベースでは、木構造になっており、親レコードには複数の子レコードがある。一方で、子レコードには、親レコードが一つのみと言う特徴がある。

【メリット】

  • データのアクセス速度は早い。

【デメリット】

  • データの格納プロセスが具体的なため重複登録、構造的にな柔軟性に欠ける。

*重複登録とは、データの上に同じデータを複写すること。


◆網型データベース(ネットワーク型データベース )

網型データベースでは、階層型とは異なる性質を持つ。それは、子レコードは、複数の親レコードを持つことができるということである。

データを取り出す際は、リンクによって親子間、又は兄弟間でデータをやりとりできる。これをネットワーク型データベースとも言う。

【メリット】

  • 重複登録が必要ない。
  • 親ノードと子ノードを組み合わせられるため、データが重複しない。

【デメリット】

  • 使用に高度な知識が必要。


◆関係データベース(リレーショナルデータベース )

データの集合の表で整理したものである。表のため、親子関係は存在しない。関係データベースでは、データの結合によってレコード間の関連付けを行う。

【メリット】

  • データが設定されたカテゴリで管理される
  • データ同士がむやみに変更されたりエラーが起きにくい
  • データ検索が可能

【デメリット】

  • 構築のために精緻な知識が必要
  • 処理速度が遅い


関係データベース

 関係データベースは、最も普及しているデータベースです。リレーショナルデータベースとも呼ばれ、表の形で

データを表します。

 関係データベースは、下記のような構成になっている。

  • 行・・・組、レコード、タプル
  • 列・・・属性、カラム、アトリビュート
  • データ項目・・・フィールド
  • 次数・・・列の数
  • 位数・・・行の数
  • ドメイン(定義域)・・・ドメインとは、同一を特性を持つ集合のことである。

関係データベースのキー

 関係データベースには2つのキーがある。一つが、表中の行を識別するためのキーである。もう一つが、別の表と関連づけるための外部キーである。ここでは、主キー、候補キー、スーパーキー、外部キーについて説明する。

主キー

複数の候補キーの中から任意に選んだキーのこと。主キーに選ばれなかったキーのことを代理キーという。主キーには、同一の値は存在できない一意性制約だけでなく、空値があってはいけないという実体を保証するためのNOT NULL制約がある。この主キーが持つ独自な制約を主キー制約という。

候補キー

表中の属性を特定する上で必要最小限の属性のこと。候補キーには、一意性を大前提とするための一意性制約がある。

スーパーキー

表中の属性を特定できる属性のこと。また、属性の組のこと。

外部キー

外部キーとは、関連表を参照する属性、または属性の組のことである。外部キーには、参照制約がある。参照制約とは、表内や表同士の関係性を定義できることである。外部キー値は、NOT NULL制約が定義されていなければ、空値は許される。


SQL

 SQLStructural Query Language)は、関係データベースを操作するための言語である。関係データベースでは、SQLが活用されるのが一般的。

 関係データベースにデータを追加したり、削除したりするためにSQLが言語ツールとして使われる。


データベースの正規化

 関係データベースの各テーブルで整合性を高めるためには、無数にあるデータ項目を整理する必要がある。データベースを操作しやすいように整合性を高める作業をのことを正規化という。


正規化のメリデメと手順

 関係データベースは2次元の表です。管理・整理しやすいように、重複していたり、繰り返されている部分を排除する必要があります。そんな関係データベースの生合成を排除するための取り組みが正規化です。

 正規化は本来であれば第5正規化まで存在するが、一般的には第3正規化まで行う。

正規化のメリット

  • データ管理・保守が容易になる(データ操作による異常発生を防ぐ)
  • データの共通性が向上する
  • データ容量を削減できる

正規化のデメリット

  • 検索の処理パフォーマンスの低下
  • 意図的な関係性再構築による処理速度低下


<正規化の手順>

① 第1正規化

繰り返し部分が排除された状態にすることを第一正規化という。第一正規化の結果を得られた表を第1正規形という。一方で、繰り返し部分のある表を非正規形という。

② 第2正規化

第1正規化で作った表から重複しているデータを分離する。

③ 第3正規化

第2正規化で作った表から更に列が切り出されたものである。分離できる部分を、さらに分離するのが第3正規化で実施すること。








完了して続く