Menu

Cloudera Impala

Cloudera Impala je dotazovací engine, který běží nad Apache Hadoop. Projekt byl oznámen v říjnu 2012 jako veřejná beta test distribuce a všeobecně dostupný je od května 2013. Impala přináší do Hadoopu škálovatelnou paralelní databázovou technologii, která uživatelům dovoluje spouštět SQL dotazy s nízkou latencí nad daty uloženými v HDFS a Apache Hbase bez toho, že by vyžadovaly přesuny dat nebo transformace. Impala je integrovaná  Hadoopem tak, aby používala stejné souborové a datové formáty, metadata, bezpečnostní a resource management frameworky používané MapReduce, Apache Hive a dalším Hadoop software.

Implala je určená pro datové analytiky, kteří provádějí analýzy nad daty uloženými v Hadoopu s použitím SQL nebo BI nástrojů. Výsledkem je, že zpracování velkých objemů (přes MapReduce) a a současně i interaktivní dotazy mohou být prováděny s použitím stejných dat a metadat. Odstraňuje se tak potřeba přenosu do specializovaných systémů a převodu do proprietárních formátů jen proto, aby bylo možné provádět analýzu.

S Impalou má Behaim několik let zkušeností v oblasti instalací, nastavení, konfigurací, použití přes shell a přístup z různých JDBC klientů jako jsou BI nástroje (Sporfire, Tableau) atd.

Kontaktujte nás

Behaim IT Solutions
Horní náměstí 371/1
779 00 Olomouc, Czech Republic
Tel: +420 734 174 043

Kontaktujte nás

Behaim IT Solutions