Co je vertikální databáze?

Vertikální databáze je databáze, ve které je fyzické rozvržení dat spíše sloupec po sloupci než řádek po řádku. Spíše než aby byly uspořádány do horizontálních struktur záznamu a zpracovány vertikálně, jsou data ve vertikální databázi uspořádána do vertikálních struktur, známých jako predikátové stromy nebo P-stromy, a zpracovávána horizontálně.

Dolování dat

Horizontální databáze jsou vhodné pro aplikace, kde požadovaným výsledkem je sada horizontálních záznamů, ale méně pro aplikace, jako je dolování dat, kde se výzkumníci obvykle zajímají o výsledky, které lze stručně vyjádřit. P-stromy, na druhou stranu, jsou velmi vhodné pro dolování dat. P-stromy se obvykle vytvářejí rozložením každého atributu nebo sloupce tabulky horizontálních záznamů na samostatné bitové vektory nebo datové struktury pole. P-stromy mohou být jednorozměrné, dvourozměrné nebo vícerozměrné; pokud data, která mají být uložena v databázi, mají přirozené rozměry - například geoprostorová data nebo geografické informace - rozměry P-stromu se shodují s rozměry dat.

Výkon

Data ve vertikální databázi jsou zpracovávána pomocí rychlých logických operátorů, jako jsou AND, OR, exclusive OR a doplněk. Kromě toho uspořádáním dat spíše po sloupcích než po řádcích je možné provádět dotazy nebo hledat data bez přístupu na stránky na pevném disku, které nejsou ovlivněny dotazem, a tak zvýšit rychlost načítání dat . To je důležité při těžbě dat ve velkých úložištích dat.

Velikost stránky

Další výhodou vertikálních databází je, že umožňují ukládání dat na velké stránky. Velká velikost stránky znamená, že lze načíst velké množství příslušných datových položek v jedné operaci čtení. Naproti tomu jediná operace čtení v horizontální databázi načte nejen relevantní datové položky, ale také atributy nebo sloupce, které nejsou relevantní pro daný dotaz, a upřednostňuje malé velikosti stránek.

Vědecké aplikace

V posledních letech se o vertikální databáze opětovně zajímá vědecká komunita. Počet simultánních uživatelů ve vědeckých databázových aplikacích je obvykle mnohem menší než v komerčních aplikacích, ale uživatelé mají tendenci zadávat složitější nepředvídané dotazy. Kromě toho musí vědecké databázové aplikace obvykle poskytovat automatizovanější reakci na složité dotazy z důvodu absence pracovníků podpory databází a systémů. Vědečtí uživatelé obvykle dávají přednost práci s dedikovanými interními počítačovými systémy, takže vědecké databázové aplikace musí být přenositelné mezi různými modely počítačů. Vertikální databáze jsou ve všech těchto počtech lepší než jejich horizontální protějšky.