SQLServer【Index編】#S1_02_インデックスとは?

当サイトではアフィリエイト広告を利用しています。

インデックスとは,データベースの値を高速に見つけてくるための機能です。SQLServerに限らず,オラクルなどのデータベースでも同様にインデックスという機能が存在します。

データベースとは「データ」の「ベース」です。「ベース」っていうのは,「ベースキャンプ」とか言うように,データの集まりなので,大量にデータが存在する可能性があります。

SQLServerのGUIのツールなのでデータを見ると,テーブルの値は一覧表で表示されるので,テーブルのデータというのは,1つのファイルに順番通りに入っているように見えるかもしれませんが,実際には8キロバイトの小さなファイルの集まりになっています。

例えば1つの顧客情報テーブルのデータが10万ファイルに分かれて格納されている場合に,その中から「小野」という名前のデータだけを探す場合,何の決め事もなく10万ファイルに顧客情報を格納している場合は,その10万ファイルをすべて読まないと,「小野」が何人いるかわかりません。だからすべてを読んで「小野」は3人でしたって感じで検索結果を返すことになります。検索を1回やるたびにこんなことをやっていたら,非常に効率が悪いし,時間が大量にかかってしまいますよね。

だから,とある決め事の順番で並べておいて,すぐにデータを探してくる方法がインデックスという機能です。

辞書の索引と同じ考え方です。索引があれば索引を見て,何ページに調べたい言葉があるかが,すぐにわかりますよね。言葉が一定の規則に沿って索引がない場合,毎回辞書を全部読まないと,調べたいことが書いているかどうかもわからないし,書いているとしても何ページに書いているかわからなかったら大変ですよね。だから,大量のデータを規則的にならべて,辞書の索引のような感じで対象データの所在を高速に探すためにインデックスは存在しています。

インデックスの必要性

インデックスは大量のデータから,検索結果を高速に見つけ出すために必要な機能ですが,そもそも検索対象が少ない場合はインデックスが無くても問題ありません。例えば1000件程度しかテーブルにないのであれば,インデックスが無くても,データを1秒未満取得できるでしょう。これが10000件くらい以上になってくると,インデックスなしでは,検索結果に差が出てきます。