Welche Vorteile bringt das ETL?

posted am

Unternehmen benötigen sehr gute Beziehungen zu ihren Kunden, um die Umsätze zu generieren. Die Kundenzufriedenheit kann die Firma mithilfe der IT-Systeme ermitteln. Dazu sind Datensätze aus den verschiedenen Abteilungen zusammenzuführen, die im Rahmen der endgültigen Auswertungen aussagefähige Informationen liefern. Zu ihnen gehören beispielsweise das Käuferverhalten, die abgegebenen Rezessionen und das Feedback nach jeder Lieferung.
Die Daten werden im Allgemeinen jeweils in einer speziellen Datenbank gehalten, die nach spezifischen Kriterien ausgerichtet wird. Um diese Informationen mit anderen Datensätzen in eine gemeinsame Datenbank zu überführen, benötigt der Techniker neben einer Schnittstelle ein gemeinsames Format. Hier setzt ETL an. Darunter versteht man die Extract, die Transformation sowie das Loading von Datensätzen. Alle drei Arbeitsschritte werden zu einem zusammenhängenden Prozess vereint. Das Ergebnis ist eine Zieldatenbank, in der Informationen mit unterschiedlichen Datenformaten aus verschiedenen Datenquellen gebündelt werden.

Am Anfang steht die einzelne Datenbank, die einen Teil der benötigten Informationen beinhaltet. Sie ist gleichzeitig die ursprüngliche Datenquelle. Die darin gespeicherten Informationen werden extrahiert und in den Arbeitsbereich verschoben. Die vollständige Extraktion ist unbedingt erforderlich. Nun erfolgt die Transformation in ein einheitliches Format. Die Tatsache, dass die Transformation jeweils in einem eigenen Arbeitsbereich stattfindet, wird als Staging-Area umschrieben. Die damit verbundene Zusammenfassung bezeichnet man als Schema-Mapping. Ist der Prozess abgeschlossen, erfolgt der Ladeprozess.
Das Laden aus dem Arbeitsbereich in die neue Datenquelle ist vollendet, wenn die Daten dort korrekt eingelesen und verarbeitet werden können.

Die Methode findet beispielsweise bei der Informationsgewinnung im Data-Warehouse Anwendung. Solche IT-Systeme haben sich beispielsweise bei Preisdatenbanken, zentralen Artikelverwaltungen und Leistungskatalogen bewährt. Der Anwender kann dabei zwischen individuellen Strukturen wählen, mit denen er seine Artikelverwaltung aufbauen möchte. Er muss sich auch nicht an die von den einzelnen Programmen vorgegebenen Hierarchien halten.

Das ETL bietet darüber hinaus noch weitere Vorteile. Zum einen werden die Duplikate bei jeder Übertragung gelöscht. Diesen Vorgang nennt man Objektidentifizierung. Dazu kommt die Schlüsselanpassung, bei der unterschiedliche Länder- und DIN-ISO-Codes genormt werden. Hierbei kann das System auch das jeweilige Geschlecht berücksichtigen und mit einer entsprechenden Kennung M oder F versehen. Sollen interne Berechnungen vorgenommen werden, so bereitet das Programm im Rahmen der Transformation die Berechnung vor. Auf diese Weise werden beispielsweise Zollangaben in landesspezifische Meter umgerechnet.

Um das ETL optimal zu nutzen, werden Konzepte im Real-Time-Modus verarbeitet. Der Betreiber der Datenbanken muss jedoch für eine stetige Aktualisierung aller Datensätze sorgen, damit er diese für seine betrieblichen Zwecke nutzen kann. Hierzu setzt er versierte IT-Spezialisten ein, die zur taggenauen Datenbereitstellung verpflichtet werden.

Der Ladeprozess sollte nur eine kurze Zeitspanne in Anspruch nehmen. Sonst geht die Integrität der Datenbank verloren. Interne und externe Stellen greifen sonst auf Informationen zurück, die nicht mehr den derzeitigen Ansprüchen genügen. Genauso wichtig ist eine Versionshistorie, die alle Veränderungen während des ETL lückenlos dokumentiert. Sie wird immer mit einem digitalen Zeitstempel versehen, der alle Aktualisierungen enthält.

Weitere Informationen zu diesem Thema erhalten Sie bei A-SD GmbH.


Teilen