Künstliche Intelligenz ist eine Schlüsseltechnologie unserer Zeit und hat bereits heute einen großen Einfluss auf unser Leben. Regierungen auf der ganzen Welt haben diesen Wandel inzwischen erkannt und investieren Milliarden in die Förderung von Künstlicher Intelligenz. KI hat bereits einen so großen Einfluss auf unser Leben, dass es fast unmöglich ist, um dieses Thema herumzukommen. Viele Begriffe wie Artificial Intelligence, Machine Learning und Deep Learning dürften Sie schon gehört haben. Doch was bedeuten diese Begriffe eigentlich und in welcher Beziehung stehen sie zueinander?

Schematische Beziehungen

Künstliche Intelligenz (KI) ist ein Fachbereich der Informatik, der sich mit der Automatisierung intelligenten Verhaltens auseinandersetzt. KI ist ein sehr breit gefächertes Forschungs- und Anwendungsfeld mit Bereichen der Robotik, intelligenten Agenten, maschinellem Lernen sowie vielen weiteren Teilbereichen. Es handelt sich eher um einen Sammelbegriff, als eine präzise Begriffsdefinition. Wenn medial von Künstlicher Intelligenz gesprochen wird, handelt es sich jedoch in der überwiegenden Zahl der Fälle um den Teilbereich Machine Learning.

Machine Learning bezeichnet eine Gruppe selbstlernender Algorithmen die, auf der Basis einer ausreichend großen Datenmenge, eigenständig Regeln aus diesen Daten abstrahieren und logische Schlussfolgerungen für die Zukunft schließen.

Wie das funktioniert? Wir stellen Ihnen die vier wichtigsten Methoden des Machine Learnings vor!

Machine Learning Methoden

Im Machine Learning unterscheidet man grundsätzlich zwischen den folgenden vier Methoden:

Supervised Learning

Beim Supervised Learning werden sowohl die Daten als auch eindeutige Ergebnisse – auch Zielvariablen oder Label genannt – vorgegeben. Ein einfaches Beispiel für Supervised Learning ist die Erkennung von Spam E-Mails. Ein Algorithmus erhält E-Mails, von denen wir wissen, dass sie Spam oder eben kein Spam sind. Sie werden mit den Labeln „Spam“ und „Kein Spam“ versehen. In einem Trainingsprozess werden die Regeln gelernt, die zu den richtigen Zielvariablen führen. Der Algorithmus lernt also eine E-Mail als „Spam“ oder „Kein Spam“ einzuordnen. Diese Regeln wendet der Algorithmus dann in einem Testprozess auf E-Mails ohne Label an. Anhand der Ergebnisse in diesem Testprozess kann der Algorithmus evaluiert und seine Vorhersagegüte bestimmt werden. Um das Ergebnis zu optimieren, können interne Parameter verändert werden und einer neuer Trainings- und Testprozess angestoßen werden. Ist die gewünschte Vorhersagegüte erreicht, kann der Algorithmus auf neue E-Mails angewendet werden und ordnet diese zuverlässig dem Label „Spam“ oder „Kein Spam“ zu. Er ist also in der Lage auf Basis der gelernten Regeln logische Schlussfolgerungen für die Zukunft zu schließen.

Unsupervised Learning

Beim Unsupervised Learning liegen keine eindeutigen Ergebnisse vor, daher geht es bei dieser Methode um das Gruppieren von Daten auf der Grundlage ähnlicher Muster in sog. Cluster. Ein Anwendungsbeispiel hierfür ist die Segmentierung von Kunden eines Unternehmens. Mit Hilfe des Unsupervised Learnings können Kunden nach bestimmten Merkmalen wie dem Kaufverhalten oder Einkommen gruppiert werden. Der trainierte Algorithmus kann dann neue Kunden anhand ihrer Merkmale einem Cluster zuordnen.

Semi-Supervised Learning

Beim Semi-Supervised Learning liegt ein kleiner Teil der Daten mit Labeln vor, wohingegen der größte Teil der Daten ohne Label vorliegt. Dieses Lernverfahren nutzt den Teil des Datensatzes mit Labeln, um die Regeln zu lernen und sie auf den größeren Teil des Datensatzes ohne Label anzuwenden. Die – durch die erste Iteration – neu gelabelten Daten werden dann benutzt um, eine neue Version des Modells zu trainieren. Dieses sog. Bootstrapping Verfahren wird wiederholt bis alle Daten einem Label zugeordnet sind. Da gelabelte Daten in der Praxis schwer zu beschaffen und kostenintensiv sind, wird diese Methode häufig als Vorstufe des Supervised Learnings eingesetzt.

Reinforcement Learning

Beim Reinforcement Learning  bekommt der Algorithmus Variablen die er variieren und selbständig in einer Simulationsumgebung optimieren soll, um eine gegebene Aufgabe zu lösen und eine vordefinierte Belohnung zu maximieren. Nach dem Trial und Error Prinzip wird eine Aktion ausgeführt, die entweder zu einer Belohnung oder zu einer Bestrafung führt. Da der Algorithmus darauf ausgelegt ist die Belohnung zu maximieren, lernt er über unzählige Simulationen die ideale Strategie um das Ziel zu erreichen. Ein einfaches Anwendungsbeispiel für Reinforcement Learning ist das Spiel Schach.

Wo ist nun das Deep Learning einzuordnen?

Deep Learning

Das Deep Learning ist wiederum eine Teilbereich des Supervised Learning. Inspiriert durch die Anatomie des menschlichen Gehirns und den Neurowissenschaften besteht dieser Algorithmus aus künstlichen neuronalen Netzen. Die Knotenpunkte werden Neuronen genannt, die durch Kanten (Verbundlinien) verknüpft sind.

Aufbau eines künstlichen neuronalen Netzes

Quelle: erstellt mit NN-SVG.

Dieser schematische Aufbau eines künstlichen neuronalen Netzes besteht aus einer Eingabeschicht (engl. Input Layer), einer Zwischenschicht (engl. Hidden Layer) und einer Ausgabeschicht (engl. Output-Layer). Die Daten werden über die Eingabeschicht (links) eingearbeitet. Über die Kanten werden die Informationen an die Zwischenschichten weitergeleitet, lernen die Muster in den Daten zu erkennen und kommen letztlich in der Ausgabeschicht (rechts) zu einem Ergebnis. Dieses Ergebnis wird mit den historischen Daten abgeglichen und durch eine Vor- und Rückpropagierung dieses Prozesses optimiert. Die Anzahl der Neuronen pro Schicht sowie die Anzahl der Zwischenschichten ist hierbei variabel und steigt mit der Komplexität der Aufgabe. Deep Learning Algorithmen sind sehr populär, da sie in der Lage sind komplexe Aufgaben wie die maschinelle Text- oder Spracherkennung zu lösen. Amazons Alexa, Googles Siri oder Microsofts Cortana funktionieren alle nach dieser Methode. Solche Methoden eignen sich aber auch optimal, um sie in anderen Bereichen einzusetzen. Eine Voraussetzung ist jedoch, dass ausreichend Daten vorhanden sind, um die Modelle zu trainieren. Beispielsweise eignet sich der Finanzmarkt, aufgrund der hohen Verfügbarkeit historischer Daten, hervorragend zur Anwendung solcher Methoden.

Fazit

Künstliche Intelligenz ist eine Schlüsseltechnologie unserer Zeit und wird viele Branchen grundlegend verändern. Auch wenn KI ein sehr breit gefächertes Feld ist, handelt es sich häufig um den Teilbereich Machine Learning, wenn in den Medien von Künstlicher Intelligenz gesprochen wird. Machine Learning kann weiter unterteilt werden in die Gruppen Supervised-, Unsupervised-, Semi-Supervised und Reinforcement Learning. Die wohl derzeit populärste Machine Learning Methode, das Deep Learning, ist dem Supervised Learning zuzuordnen. Sie löst bereits heute komplexe Aufgaben wie die maschinelle Spracherkennung in unserem alltäglichen Leben. Diese Methoden eignen sich auch hervorragend für weitere Anwendungsgebiete, wie den Finanzmarkt. Eine Voraussetzung ist allerdings, dass ausreichend Daten vorhanden sind, um die Modelle zu trainieren.