MACHINE LEARNING – EIN BLICK HINTER DEN HYPE
17.06.2019 // Björn Heinen
(c) whiteMocca - shutterstock.com
Der Begriff Machine Learning wird häufig für Marketing- und Vertriebszwecke genutzt. Daher sollte man nicht vergessen, dass hinter dem Buzzword neben der Werbemaschinerie tatsächlich ein realer Mehrwert für Unternehmen steht. Eines meiner bevorzugten Vortragsthemen besteht nur darin, auf verständliche Weise zu erklären, was konzeptuell bei verschiedenen Machine-Learning-Use-Cases passiert und wie die Anwendungen in der Praxis wirklich aussehen. In einem einzelnen Blogbeitrag ist das Thema natürlich nicht in voller Tiefe abgehandelt. Daher möchte ich meinen ersten Beitrag zu dem Thema nutzen, um eine Einführung in die verschiedenen Methoden des Maschinellen Lernens zu geben – und schon erste Einblicke in die Praxis.
Es gibt viele verschiedene Definitionen für Machine Learning – eine, die mir gefällt, lautet: Machine Learning geschieht dann, wenn der Computer eigenständig lernt, aus Daten Entscheidungen abzuleiten. Um diese Entscheidungen abzuleiten, gibt es verschiedene Wege, beziehungsweise Algorithmenklassen. Beispiele sind hier überwachtes, unüberwachtes, teilüberwachtes und bestärkendes Lernen oder auch genetische Algorithmen. In diesem Beitrag gehen wir auf die beiden gängigsten Sorten überwachtes und unüberwachtes Lernen ein. Auf die restlichen Verfahren inklusive ihrer Vor- und Nachteile für Unternehmen kommen wir in späteren Beiträgen zurück.
Machine-Learning-Arten und ihre Anwendung in der Praxis
Bei der Methode Supervised Learning handelt es sich um ein angeleitetes Verfahren, bei dem Trainingsdaten inklusive bereits beobachteter Zielwerte für den Aufbau des Modells bereitgestellt werden. Ein Beispiel für Supervised Learning ist die Klassfikation. Die Daten sollen hierbei vorgegebenen Klassen oder Gruppierungen selbstständig zugeordnet werden. Ein Beispiel aus der Praxis stammt aus dem Bereich Betrugserkennung, wo Software durch Maschinelles Lernen schnell Muster und Auffälligkeiten erkennen kann, die auf einen Betrug hinweisen (die Klassen sind also Betrug/Kein Betrug). Findet zum Beispiel eine Kreditkartenabhebung in Deutschland statt und bereits zehn Minuten später mit derselben Karte in Thailand, muss ein Betrug vorliegen. Eine große Herausforderung liegt darin, dass sich die Betrugsmuster kontinuierlich verändern. Dementsprechend müssen auch die Machine-Learning-Algorithmen permanent dazu lernen.
Eine weitere Methode des Maschinellen Lernens ist das Unsupervised Learning. Bei dieser Methode fehlen im Gegensatz zum Überwachten Lernen bekannte Zielwerte. Die Maschine versucht eigenständig, in den Eingabewerten Muster oder statistische Auffälligkeiten zu erkennen. Ein Anwendungsbeispiel für dieses unüberwachte Lernen findet sich in einem Chemiepark. Unternehmen im Chemiepark bezahlen unter anderem für die Nutzung seiner Infrastruktur, beispielsweise in Form von Wasserdampf oder Elektrizität. Außerdem leitet er das toxische Abwasser für die Unternehmen ab. Dabei gibt es für jedes Unternehmen einen Kanal, der in die Hauptkanalisation führt, die das Abwasser wiederum in eine Kläranalage leitet. Der Betreiber möchte wissen, ob bei allen Unternehmen die Abwasserabführung nach Plan läuft, da er ansonsten unter anderem einen finanziellen Schaden durch das Aussetzen der Kläranlage und folglich den Stillstand des Chemieparks haben könnte. Neben Informationen zu den Unternehmen wie Wasser-, Elektrizität-, oder Dampfabnahme, weiß man außerdem durch kontinuierliche, automatisierte Probeentnahmen, wie viel Abwasser aktuell in die Kanalisation abgepumpt wird, welche Temperatur es hat, usw. Anhand dieser Werte kann man über einen zeitlichen Verlauf mit Hilfe von Maschinellem Lernen eine Anomalie direkt erkennen.
Segmentierung mithilfe von Machine Learning
Ein weiteres Thema, das für viele Branchen von großer Bedeutung ist und mithilfe von Machine Learning optimiert werden kann, ist die Segmentierung von Daten. Clustering-Algorithmen unterstützen Unternehmen beispielsweise dabei, verschiedene Kundensegmente auszumachen. So können Retail-Unternehmen anhand von Kundeninformationen, Produktinformationen, Informationen über aktuelle Werbeaktionen und vieles mehr verschiedene Kunden-Typen identifizieren und gewinnen dadurch wichtige Einblicke in ihre Zielgruppen-Struktur. Sie erfahren, was die verschiedenen Segmente vereint oder unterscheidet. So sind gezielte Marketingmaßnahmen entsprechend dieser Zielgruppen möglich.
Clustering kann außerdem im Maschinen- und Anlagenbau Verwendung finden. Ich kenne ein Beispiel von einem Maschinenbauer, der tausende unterschiedliche Werkzeuge für CNC-Fräsen herstellt, diese aber nicht ordentlich katalogisiert hatte, z.B. nach Typ. Es gab jedoch viele Informationen wie Materialfestigkeit oder geometrischen Eigenschaften zu diesen Werkzeugen, die bereits in einer Datenbank gespeichert waren. Um herauszufinden, welche Werkzeuggruppen es gibt und was sie unterscheidet, konnte er diese Daten mithilfe von Machine Learning in kurzer Zeit clustern und nicht nur die Stammdatenqualität steigern, sondern auch einen nie dagewesenen Überblick bzw. Einblick gewinnen in Bezug auf sein Portfolio.
Die Annahme, dass man eine sehr hohe Datenqualität braucht, um Machine-Learning-Algorithmen überhaupt erfolgreich einsetzen zu können, stimmt nämlich so nicht ganz. Man kann mit Machine Learning diese Qualität oft auch verbessern.
Fazit
Es gibt etliche Beispiele, wie Maschinelles Lernen Unternehmen helfen kann, Prozesse und Daten zu optimieren. Hinter dem Buzzword steht ein echter Mehrwert! Dank Methoden des überwachten und unüberwachten Lernens können Unternehmensprozesse automatisiert, Einblicke in Prozesse gewonnen und Entscheidungen datengetrieben getroffen werden.
In meinen nächsten Beiträgen werde ich Ihnen noch mehr über Künstliche Intelligenz in der Praxis berichten und weitere Themen wie Predictive Maintenance und Datenqualität im Detail behandeln.
Nutzen Sie bereits Künstliche Intelligenz in Ihrem Unternehmen? Suchen Sie weitere Informationen zu Machine Learning in der Praxis? Dann schauen Sie sich hier gerne mein Webinar zu dem Thema an.
ÜBER UNSERE EXPERT:INNEN
Björn Heinen
Lead Data Scientist
Björn Heinen arbeitet seit 2017 bei INFORM im Bereich Data Science. Als Lead Data Scientist beschäftigt er sich sowohl mit internen Projekten, bei denen bestehende INFORM-Produkte um Machine-Learning-Funktionalitäten erweitert werden, als auch mit externen Projekten, die er von der Ausarbeitung über die Implementierung bis zur Integration begleitet.