Data Preprocessing - Datenvorverarbeitungsschritte des Prozessmodelles

BIB
Stuber, R.
Daten treten in der realen Welt oftmals unvollständig, mit Fehlern behaftet oder inkonsistent auf. Weiterhin erfordert die Integration mehrerer Datenbestände in einen gemeinsamen Datenbestand oftmals die Anpassung einzelner Daten, sei es, weil der Wertebereich di eriert oder weil einfach syntaktische Unterschiede zwischen den zu vereinheitlichenden Datensätzen vorherrschen. Soll schließlich knowledge discovery auf Daten betrieben werden, so können heterogene Daten Konfusionen verursachen, die zu unzuverlässigen und ungenauen Ergebnissen führen können. Wächst die Datenmenge enorm an, so kann eine Datenreduktion sowohl die Geschwindigkeit einer Datenverarbeitung als auch deren Kosten senken. Die angesprochenen Fragestellungen lassen sich in gewissem Maße mit Hilfe von Datenvorverarbeitungsschritten durchführen. Es werden hierzu verschiedene Technologien und Vorgehensweisen vorgestellt.
01 / 2003
techreport

OFFIS Autoren