摘要 |
カラムナデータベースの列内のソートされていないデータに対するヒストグラムを使用する効率的なクエリー処理のために、確率的データ構造が生成される。カラムナデータベーステーブル内の列のヒストグラムの複数のバケットに対してバケット範囲サイズが判断される。少なくともいくつかの実施形態では、ヒストグラムは、高さのバランスを調整したヒストグラムであり得る。確率的データ構造は、ヒストグラム内のどの特定のバケットに対して、データブロック内に格納されたデータ値があるかを示すために生成される。選択データに対する列を対象としたクエリーの指示が受信されると、その列に対するデータを格納しているデータブロックの各々に対する確率的データ構造が検査されて、選択データに対するクエリーに対応するために読み取る必要がない、データブロックのうちの特定のものを判断し得る。【選択図】図1 |