Data-Mining – Kurze Begriffserklärung

Unter Data-Mining wird die systematische Analyse von großen Datenmengen verstanden, um Trends, Muster und Zusammenhänge zu erkennen. Das Verfahren nutzt KI-Algorithmen, um selbstständig relevante Informationen zu entdecken.

Data-Mining und Big Data

Im Zusammenhang mit Data-Mining ist oft von Big Data die Rede. Beide Begriffe werden zum Teil als Synonyme verwendet, was aber falsch ist. Der Unterschied liegt im Detail:

  • Big Data ist der Begriff für große Datenmengen, für deren Verarbeitung technische Plattformen zur Verfügung gestellt werden.
  • Data-Mining ist das konkrete Verfahren, um relevante Informationen aus dem Datenmaterial zu gewinnen.

Data-Mining ist im Prinzip nicht auf Big Data beschränkt. Das Verfahren zeigt aber insbesondere bei extrem großen Datenmengen seine Stärken und kommt deshalb hauptsächlich dort zur Anwendung.
Daher stammt auch der Ursprung des Begriffs: Im Bergbau (engl. mining) kommt es darauf an, extrem große Mengen an Gestein abzubauen und aufzubereiten, um die gewünschten Metalle oder Edelsteine zu gewinnen.

Wie funktioniert Data-Mining?

Data-Mining nutzt insbesondere statistische Verfahren zur Gewinnung von Informationen. Hierbei werden auch Algorithmen eingesetzt, die auf Künstlicher Intelligenz beruhen. Dazu gehören zum Beispiel folgende Methoden:

  • Klassifikation: Zuordnung von Objekten anhand bestimmter Merkmale zu einer vorab definierten Klasse. Beispiel: Kunde hat bezahlt oder nicht bezahlt.
  • Segmentierung und Cluster-Analyse: Gruppierung von Objekten mit gemeinsamen Merkmalen. Beispiel: Bildung der Gruppe aller nicht zahlenden Kunden.
  • Prognose: Vorhersage unbekannter Werte anhand von bekannten Merkmalen. Beispiel: Kunden, die Waren von Typ X kaufen, bezahlen mit einer bestimmten Wahrscheinlichkeit ihre Rechnungen erst nach Mahnung.

Data-Mining eignet sich vor allem für Risikoanalysen im Finanz- und Versicherungswesen sowie für die Vorhersage von Kundenreaktionen im Online-Handel. Auch in der Medizin gibt es zahlreiche Einsatzbereiche von Data-Mining.