Data Mining
1. Begriff: Data Mining bedeutet wörtlich aus dem Englischen übersetzt „Daten-Bergbau“ und ist eine Methpaher für die Suche nach Strukturen in großen Datenmengen anhand primär statistischer Methoden.
2. Merkmale: Data Mining dient der Beschreibung von Strukturen innerhalb der Daten, vor allem aber der Prognose weiterer Merkmale anhand der identifizierten Strukturen. Entgegen der klassischen Anwendung der Statistik erfolgt dies i.d.R. anhand eines komplexen Datensatzes mit einer hohen Zahl von Merkmalen und unter gleichzeitiger Nutzung verschiedener Analyseverfahren. Dazu gehören u.a. Regressionsanalysen, Faktorenanalysen, Clusteranalysen, Assoziationsanalysen, Diskriminanzanalysen oder auch Neuronale Netze. Es steht nicht die möglichst präzise und regelkonforme Anwendung des jeweiligen Verfahrens im Vordergrund, sondern eine iterativ-explorative Annäherung an ein möglichst vorhersagestarkes Modell durch den wiederholten und kombinierten Einsatz der unterschiedlichen Methoden.
3. Schritte: Dem Data Mining als der eigentlichen Daten-Analyse geht meist eine umfangreiche Aufarbeitung der vorhandenen Daten voraus. Die Ergebnisse des Data Minings bedürfen einer anschließenden Evaluation durch Überprüfung der Vorhersagekraft außerhalb des ursprünglichen Datensatzes.
4. Anwendungsfelder: Mit Hilfe von Data Mining werden z.B. Kunden klassifiziert oder bestehenden Klassifikationen zugeordnet oder Vorhersagen zu Reaktions- oder Verhaltenswahrscheinlichkeiten getroffen (z.B. zum Kaufinteresse, zur Kündigungsintention, zur Reaktion auf Werbemaßnahmen). In der Versicherungswirtschaft spielt Data Mining daher insbesondere im Kundenbeziehungsmanagement sowie im Database Marketing bzw. im Direktmarketing eine große Rolle. Daneben wird Data Mining auch im Rahmen der Betrugserkennung und der Tarifierung eingesetzt.
Autor(en): Prof. Dr. Horst Müller-Peters