Apache Impala

Apache Impala
Basisdaten
Hauptentwickler	Apache Software Foundation
Entwickler	Cloudera
Erscheinungsjahr	2013
Aktuelle Version	2.10.0 ; (13. September 2017)
Betriebssystem	Unixoide
Programmiersprache	C++
Lizenz	Apache-Lizenz 2.0
	impala.apache.org

Apache Impala ist ein Open-Source-Projekt der Apache Software Foundation, das für schnelle SQL-Abfragen in Apache Hadoop dient.^[1]

Impala wurde ursprünglich von Cloudera entwickelt, 2012 verkündet und 2013 vorgestellt.^[2] Mittlerweile wird es zusätzlich von MapR, Oracle und Amazon gefördert. Inspiration für Impala war Google F1. Seit Oktober 2016 ist Impala als Inkubator-Projekt und seit Dezember 2017 als Top-Level Projekt^[3] der Apache Software Foundation gelistet.

Impala ist ein Abfragewerkzeug für Daten aus dem Hadoop-Dateisystem, HBase und Amazon S3, ohne, dass Daten verschoben oder transformiert werden müssen. Auch Dateien im Format von Apache Avro, Apache Parquet oder LZO werden unterstützt. Impala wurde in C++ geschrieben, ist parallelisiert und skalierbar. Code wird on the fly mit Hilfe einer LLVM generiert. Viele Werkzeuge im Hadoop-Umfeld sind für Anwendungsfälle mit Batch-Abfragen großer Datenmengen gedacht. Impala beherrscht Abfragen mit geringen Wartezeiten. Es ist in die Hadoop-Softwarelandschaft integriert, da unter anderem gleiche Ressourcenmanager und Metadaten verwendet werden.^[4]

Literatur

John Russell: Getting Started with Impala. Interactive SQL for Apache Hadoop. O’Reilly, Sebastopol 2014, ISBN 978-1-4919-0577-7.
Avkash Chauhan: Learning Cloudera Impala. Packt Publishing, Birmingham 2013, ISBN 978-1-78328-127-5.
John Russell: Cloudera Impala. O’Reilly, Sebastopol 2013, ISBN 978-1-4919-4947-4.

Weblinks

Offizielle Website

Einzelnachweise

↑ Jens Ihlenfeld: Echtzeitabfragen mit Hadoop. Impala. In: golem.de. Golem Media GmbH, 24. Oktober 2012, abgerufen am 16. März 2017.
↑ Andrew Brust: Cloudera’s Impala brings Hadoop to SQL and BI. Big Data darling Cloudera's Impala product promotes SQL to peer-level with MapReduce. In: ZDNet. CNET Networks, Inc., 25. Oktober 2012, abgerufen am 16. März 2017 (englisch).
↑ Sally Khudairi: The Apache News Round-up: week ending 1 December 2017. Impala. The Apache Software Foundation, 1. Dezember 2017, abgerufen am 6. Dezember 2017 (englisch).
↑ David Ramel: Cloudera to Donate Impala and Kudu Big Data Projects to Apache. In: ADT Mag. 1105 Media Inc., 18. November 2015, abgerufen am 16. März 2017 (englisch).

[1] Jens Ihlenfeld: Echtzeitabfragen mit Hadoop. Impala. In: golem.de. Golem Media GmbH, 24. Oktober 2012, abgerufen am 16. März 2017.

[2] Andrew Brust: Cloudera’s Impala brings Hadoop to SQL and BI. Big Data darling Cloudera's Impala product promotes SQL to peer-level with MapReduce. In: ZDNet. CNET Networks, Inc., 25. Oktober 2012, abgerufen am 16. März 2017 (englisch).

[3] Sally Khudairi: The Apache News Round-up: week ending 1 December 2017. Impala. The Apache Software Foundation, 1. Dezember 2017, abgerufen am 6. Dezember 2017 (englisch).

[4] David Ramel: Cloudera to Donate Impala and Kudu Big Data Projects to Apache. In: ADT Mag. 1105 Media Inc., 18. November 2015, abgerufen am 16. März 2017 (englisch).

[1]

[2]

[3]

[4]

Apache Impala
Basisdaten
Hauptentwickler	Apache Software Foundation
Entwickler	Cloudera
Erscheinungsjahr	2013
Aktuelle Version	2.10.0 (13. September 2017)
Betriebssystem	Unixoide
Programmiersprache	C++
Lizenz	Apache-Lizenz 2.0
impala.apache.org