Big Data und das maschinelle Lernen sind immer wieder in den Medien. Gerade in Deutschland wird das Thema meist unter dem Aspekt der Datensicherheit beleuchtet. Die Datensilos der großen Technikkonzerne bergen vor allem eines: Gefahr. Zu Unrecht! Gerade Big Data liefert auch gewaltige Innovationen. Nicht nur können wir im Unterschied zu früher auf gewaltige Datenmengen zugreifen und mit einer deutlich höheren Geschwindigkeit lernen, sondern es können auch zunehmend schwierige Probleme mit Computern gelöst werden.
Mit Maschinenlernen und Big Data zum Babelfisch
Ein besonders eindrucksvolles Beispiel präsentiert uns in diesem Video Rick Rashid (Gründer von Microsoft Research). Er zeigt uns wie weit wir schon gekommen sind, um die Sprachbarrieren zwischen allen Menschen aufzulösen:
Ich finde es beeindruckend, wie Rashid in Englisch sprechen kann, der gesprochene Text nahezu in Echtzeit in Schrift umgewandelt und auf dem einen Bildschirm angezeigt wird, mit kaum einer Verzögerung die passende Übersetzung in chinesische Schriftzeichen auf dem anderen Bildschirm angezeigt wird und mit einer auch nicht allzu langen Verzögerung Rashids Worte in gesprochenem Chinesisch erklingen! Technisch geht es dabei um das Thema Deep Learning. Deep Learning ist eine Variante der sog. künstlichen neuronalen Netze. Die Verfahrensweise neuronaler Netze orientiert sich in grob an der Arbeitsweise des Gehirns: es werden Netze einfacher, verbundener Nervenzellen simuliert, die durch Erfahrungen lernen: analog den Nervenverbindungen im Gehirn nimmt die stärke von Neuronenverbindungen zu oder ab, wenn gelernt wird. Theoretisch geht die Theorie schon in die 1940er Jahre zurück. Wie Deep Learning funktioniert erklärt Michael Nielsen (auf Englisch) in seinem freien Buch: . Ich bin auf Achims Blog darauf aufmerksam geworden.
Mensch-Maschine-Kooperation
Auch relativ unbekannt ist, dass gerade Maschinen in Kooperation mit Menschen besonders gute Ergebnisse produziert. Jeder hat davon gehört, das Deep Blue von IBM den Großmeister Kasparov im Schach besiegte. Seitdem ist klar: der Menschen wird ultimativ von der Maschine beherrscht werden. Allerdings ist Deep Blues Sieg bereites 1997 gewesen. Seitdem haben sich die Dinge verändert, ja: wir haben Smartphones in der Tasche und abends benutzen wir Tablets oder eBook-Reader. Nicht so ganz die Terminator-Distropie, die viele fürchteten und noch fürchten.
Weniger bekannt ist, dass ein Schach-Wettbewerb im Jahr 2005 – bei dem Menschen, Computer und auch Teams von Menschen und Computern teilnehmen konnten von einem Mensch-Computer-Team gewonnen wurde. Und zwar nicht: ein Großmeister und ein Großrechner – sondern zwei Schachamateure mit 3 relativ mittelmäßigem Laptops zu der Zeit. Heute dürfte jeder von uns, sofern ein Smartphone im Besitz, einen mächtigeren Rechner – als Verbündeten – in der Hosentasche haben.. Ihr könnt euch die ganze Geschichte hier anschauen:
Es ist klar, dass das Thema der technischen Entwicklung nie unkritisch zu betrachten war und ist. Und ich will auch nicht verharmlosen, was noch passieren kann und in teilen vielleicht schon passiert. Aber ich denke, dass die Vorteile im Bereich Data Mining und Big Data noch bei weitem die Nachteile überwiegen. Sofern wir uns beim Gebrauch der globalen Ressourcen darauf konzentrieren würden unsere Bedürfnisse und nicht auch unsere Gier zu befriedigen – dann könnten wir ganz beruhigt viele der tollen (Daten-)Technologien nutzen, die wir uns selbst zunehmend zur Verfügung stellen.
Ich jedenfalls freue mich schon darauf, wenn ich mit einer Erweiterung für mein Smartphone oder vielleicht sogar einem autonomen Rechner im Ohr – gleich einem Babelfisch – im Ausland mit jedem sprechen und jeden verstehen kann!