Apache Hive
Apache Hive je infrastruktura datového skladu vybudovaná nad Hadoopem pro poskytování datových sumarizací, dotazů a analýz. Hive poskytuje rozhraní typu SQL pro dotazování na data uložená v různých databázích a souborových systémech, které jsou integrovány s Hadoop. Bez Hive musí být dotazy implementovány v MapReduce Java API, kde se spouští SQL aplikace a dotazy nad distribuovanými daty. Hive nabízí nezbytnou SQL abstrakci k integraci dotazů SQL typu (HiveQL) do nižších vrstev Java API bez nutnosti implementovat dotazy přímo v základním Java API.
Protože většina datových skladů pracuje s jazyky na bázi SQL dotazování, Hive podporuje snadnou přenositelnost aplikací postavených na SQL do Hadoopu. Apache Hive byl originálně vyvinut Facebookem a je v současnosti používán společnostmi jako Netflix nebo FINRA.
Víceletá zkušenost Behaimu zahrnuje: Instalace, nastavení, konfigurace, shell skripty, přístup k datům pomocí JDBC z různých klientů, BI nástroje (Spotfire, Tableau) atd.