Cloudera Impala
Cloudera Impala je dotazovací engine, který běží nad Apache Hadoop. Projekt byl oznámen v říjnu 2012 jako veřejná beta test distribuce a všeobecně dostupný je od května 2013. Impala přináší do Hadoopu škálovatelnou paralelní databázovou technologii, která uživatelům dovoluje spouštět SQL dotazy s nízkou latencí nad daty uloženými v HDFS a Apache Hbase bez toho, že by vyžadovaly přesuny dat nebo transformace. Impala je integrovaná Hadoopem tak, aby používala stejné souborové a datové formáty, metadata, bezpečnostní a resource management frameworky používané MapReduce, Apache Hive a dalším Hadoop software.
Implala je určená pro datové analytiky, kteří provádějí analýzy nad daty uloženými v Hadoopu s použitím SQL nebo BI nástrojů. Výsledkem je, že zpracování velkých objemů (přes MapReduce) a a současně i interaktivní dotazy mohou být prováděny s použitím stejných dat a metadat. Odstraňuje se tak potřeba přenosu do specializovaných systémů a převodu do proprietárních formátů jen proto, aby bylo možné provádět analýzu.
S Impalou má Behaim několik let zkušeností v oblasti instalací, nastavení, konfigurací, použití přes shell a přístup z různých JDBC klientů jako jsou BI nástroje (Sporfire, Tableau) atd.