REINHARD KARGER2018-12-18T14:46:10+02:00

Project Description

REINHARD KARGER

DEUTSCHES FORSCHUNGSZENTRUM FÜR KÜNSTLICHE INTELLIGENZ

Kassandra geht steil zur Prime Time:

„Künstliche Intelligenz in aller Munde, in jeder Ausgabe ungefähr jeder Tageszeitung. Das führt bei Lesern nicht aus Notwendigkeit zu mehr Erkenntnis. Führt bei Autoren garantiert zu immer fetteren Schlagzeilen, die sich sensationalistisch überbieten und aufmerksamkeitsheischend Klicks fangen wollen. Selten geht es bei KI aktuell um das Faktische. Kaum um das kurzfristig Mögliche, das mittelfristig Erwartbare, wenig um konkrete Chancen und Anwendungen, oft um überzogene Erwartungen oder obskure Vorbehalte. Leser allerdings fühlen sich existentiell bedroht, die Gesellschaft wird zunehmend nervös. Das ist nicht notwendig!

Die Wolkenschieber haben Hochkonjunktur. Kassandra geht steil zur Prime Time. Aber wie so oft kann der Blick zurück, die Zukunft erhellen. Kassandra. Ja, sie hat die Trojaner davor gewarnt, das hölzerne Pferd in die Stadt zu ziehen. Und ja, im Ergebnis hat sie recht behalten. Troja war zerstört. Was also hätte getan werden sollen? Kassandra konstruktiv zuhören. Das könnte die Lehre für 2019 sein. Nicht auf Vorurteile hören. Kassandra ernst nehmen. Nicht auf die eigenen oder die Reflexe der anderen reinfallen. Besser: hinsehen, hingehen, verstehen! Die kulturhistorische Frage ist doch, warum haben die Trojaner das hölzerne Pferd am Strand nicht auseinander genommen? Aufmachen, reinschauen!

Bitte heute auch! Was kann KI? Was können Künstliche Neuronale Netze leisten? Wozu kann man sie einsetzen? Und wieso lassen einige und oft das “künstliche” weg? Möglicherweise weil die mathematischen Grundlagen durch Marketing-Sprech emotional aufgewertet werden sollen. Weil Analogien wirkmächtig sind und das ist gut, wenn es primär um Wirkung geht. Dafür zahlen wir gesellschaftlich einen Preis: Verwirrung liegt in der Luft und die eigentlichen Fragen entgleiten, so dass die Beteiligten und die Betroffenen vorhersehbar aneinander vorbei reden. Was sind die prinzipiellen Grenzen der Leistungsfähigkeit? Was sind selbstlernende Systeme? Und was heißt Selbstlernen bei Maschinen? Was genau ist menschliches Lernen? Welche Dimensionen haben die Anwendungschancen? Wie können Wirtschaft und Zivilgesellschaft profitieren?

Ein Anwendungsbeispiel: Spracherkennung kann jeder ausprobieren und wird feststellen: Respekt! Nicht schlecht, schon gut, nicht wirklich perfekt. Vielmehr so, dass Nutzer unmittelbar Anwendungsfantasien und Ansprüche formulieren, was man alles erreichen könnte, wäre es denn nun wirklich gut. Journalisten, die gerade noch darüber diskutiert haben, ob Algorithmen die besseren Redakteure sind, wollen umgehend spracherkennende Systeme, die Interviews verschriftlichen können. Am besten auch dann, wenn die Gesprächspartner sich ins Wort fallen und so, dass man das Gesagte eindeutig einem Sprecher zuordnen kann – also klar mit Sprecheridentifikation und mit Interpunktion, obwohl die natürlich nicht gesprochen wurde und aber inhaltsbildend sein kann. “Die Eltern glauben, die Kinder haben im Lotto gewonnen” bedeutet offensichtlich etwas ganz anderes als “Die Eltern, glauben die Kinder, haben im Lotto gewonnen”. Die gleichen Wörter in derselben Reihenfolge – und eine ganz andere Welt. Und wenn man dabei ist, gerne auch noch die Zusammenfassung als Teaser für das Gespräch und eine Schlagzeile, die alles auf den Punkt bringt.

Journalisten, die die wirkmächtigen Schlagzeilen entwerfen, sind selber im Kern beeindruckt, sind existentiell verunsichert. Wortreich werden Sorgen aufgeworfen und intensiv diskutiert: beim Journalistentag NRW 2018 Mitte November in Dortmund befeuert ein virtueller Nachrichtensprecher der staatlichen chinesischen Nachrichtenagentur Xinhua eine Diskussion, ob KI bald den Nachrichtensprecher ersetzen kann und wird. Und vielleicht rasch auch den Reporter und den Redakteur und bestimmt auch den Chef vom Dienst. Und überhaupt!

Erstaunlich, dass Nervosität die kühle Abwägung auch bei Journalisten überlagert. Verblüffend, wie schnell sich die gefühlte persönliche Betroffenheit in den Vordergrund drängt. Wie gut ist dieses Angebot aus China? Na ja. Wird es in China akzeptiert werden? Möglich. In Europa? Mal sehen. Die eigentliche Frage: Warum ein virtueller Nachrichtensprecher und kein virtueller Moderator? Nun, beim Nachrichtensprecher nähert sich das aktuell technisch Machbare an die vom Zuschauer erwartete Ergebnisqualität. Denn: ein Ergebnis der Ausbildung eines Nachrichtensprechers ist das Kunststück, die Artikulation gerade möglichst neutral zu halten, ohne persönliche Wertung, unbeeinflusst von politischer Einstellung, sexueller Orientierung, privater Lebenssituation oder religiöser Überzeugung. Das gleiche gilt für Körperhaltung, Mimik, Gestik oder Satzmelodie. Das Ideal ist der objektive, unpersönliche oder eben marginalisiert menschliche Sprecher. Die obige Frage beantwortet sich fast von selbst: wenn die Aufgabenbeschreibung den Menschen zu einem „Roboter“ macht, dann ist es wenig verwunderlich, dass virtuelle Präsentationsagenten, die gerade keine menschlichen Emotionen angemessen ausdrücken können, diese Aufgaben so übernehmen, dass die Ergebnisse sich kaum von menschlichen Ergebnissen unterscheiden lassen. Wenn sich Menschen robotisch verhalten, können Roboter eben täuschend menschlich wirken. Avatare oder Präsentationsagenten artikulieren und präsentieren faktische Nachrichten; Journalisten schreiben Geschichten, analysieren Zusammenhänge, kommentieren die Geschehnisse in der Welt, vertreten ihre Position und haben eine Haltung.

Natürlich wurde in den vergangenen Jahrzehnten die Qualität der Visualisierungstechnologie zu einem entscheidenen Faktor für den kommerziellen Produkterfolg der Film- und Spieleindustrie – also wurde investiert. Die grafische Qualität der Präsentationsagenten ist beeindruckend – bezogen auf die Aufgabe “Nachrichtensprecher”. Auch die künstlichen Stimmen, Sprachsynthese, sind deutlich besser geworden. Google Deepmind – WaveNet – setzt “Deep Neuronal Networks” ein und erzeugt damit künstliche gesprochene Sprache. Bei der letzten Entwicklerkonferenz, Mai 2018, hat Google eine konkrete Anwendung vorgestellt. Das Duplex System kann als aktiver Stellvertreter einen Telefondialog zur Terminverhandlung führen. Bei den vorgeführten Beispielen ging es um eine Tischreservierung und einen Friseurtermin. Hinsichtlich Natürlichkeit und Verständlichkeit bestehen Stimme und Dialogführung, bei dieser Anwendung, den Turing-Test: sie lassen sich kaum – eigentlich gar nicht mehr – von einer menschlichen Stimme unterscheiden. Um sich an das Ziel des naturidentischen Dialogs anzunähern, werden typische Häsitationen (“äh”) oder Affirmationspartikel (“Mm-hmm”) verwendet. Man kann darüber diskutieren, ob die Angerufene getäuscht wurde oder sich getäuscht fühlte, ob sich ein solcher “Anrufer” also als maschineller Service identifizieren sollte oder ob computergenerierte Texte durch einen Button gekennzeichnet werden müssen.

Die Anwendungsszenarien für KI, für Deep Learning, für Künstliche Neuronale Netze sind zahlreich und vielfältig, verändern die Wirtschaft und bereichern das private Leben. Mustererkennung löst das Klassifikationsproblem und führt zu mächtigen Werkzeugen, zu agileren Abläufen, hoffentlich zu mehr Erkenntnis und flexibleren Prozessen, aber offensichtlich zu besserer maschineller Übersetzung von Texten. Und auch hier: immer ausprobieren: https://www.deepl.com/home

Visuelle Objekterkennung ist vorteilhaft für Konsumenten, die textuell auf dem Smartphone in ihrer Fotosammlung nach Motiven suchen können, aber wichtig auch für Erdbeobachtung und Katastophenprävention, für die Erschließung der globalen Bildarchive und die Sicherung des visuellen kulturellen Erbes. Genauso kann Spracherkennung alle Radioaufzeichnungen und Parlamentsdebatten durchsuchbar machen. Mustererkennung kann bei bildgebende Verfahren in der Medizin eingesetzt werden und diagnostische Unterstützung für Ärzte liefern, z.B. bei der Erkennung von Hautkrebs.

Visuelle Anomalieerkennung beschleunigt die Qualitätssicherung in der Produktion. Die Auswertung von Maschinendaten kann vorausschauende Wartung ermöglichen und Maschinengesundheit fördern oder erhalten. Prognoseverfahren für Stromproduktion und -verbrauch unterstützen die Energieversorger, Kraftwerk- und Verteilnetzbetreiber, verbessern das Lastmanagement, schaffen Robustheit und Resilienz, die wegen der Erzeugungsvolatilität die Voraussetzungen sind für die grundlastfähige Nutzung von erneuerbarer Energie.

Mustererkennung kann die Finanzwirtschaft bei der Abschätzung von Kreditausfallrisiken, die Versicherungen bei der Abschätzung von Schadenssummen unterstützen und kann beide Prozesse für die Kunden beschleunigen. Der nachhaltige Erfolg für den aktiven Börsenhandel steht noch aus, aber als persönlicher Finanzberater oder Produktauswahlassistent ist der Einsatz vorstellbar – und braucht dann ein Geschäftsmodell.

Selbstfahrende Autos werden nicht zu einer unfallfreien Mobilität führen. Aber hochautomatisiertes oder später autonomes Fahren wird Leben retten und lebensgefährliche Unfälle vermeiden helfen. Zahlreiche der täglich etwa 7.200 polizeilich erfassten Verkehrsunfälle und jährlich über 390.000 Verletzte könnten vermieden werden – das sind die Zahlen für 2017.

KI ermöglicht neue Arbeitsbedingungen und wird ergonomisch belastende Aktionen übernehmen können. Dramatisch ist die Situation in der Pflege. In den kommenden Jahrzehnten wird der Pflegeaufwand weiter zunehmen, der Aufbau des Pflegepersonals wird aber kaum Schritt halten können. Auch hier können hybride Teams aus Menschen und KI-basierten Assistenzsystemen einen wesentlichen Beitrag leisten, um dem Pflegepersonal die Arbeit zu erleichtern und von lästigen Verwaltungsaufgaben zu befreien, so dass es sich auf sein Gegenüber konzentrieren kann.

Das alles soll nicht ablenken von der wichtigen Debatte über den möglichen Missbrauch dieser KI-Werkzeuge. Im Zusammenhang mit Plattform-Kapitalismus, im Kontext der geheimdienstlichen Überwachung und der Verwendung gegen Bürgerinteressen und Menschenrechte in autoritären Regimen. Natürlich sollten die Vereinten Nationen einen KI-Waffen-Sperrvertrag initiieren und weltweit verhandeln, so dass sich die militärische Nutzung autonomer Systeme auf z.B. Kampfmittelräumungsdienste beschränkt – und die mögliche Abwehr außerirdischer Invasoren.

Die Diskussion um die Möglichkeiten von Künstlicher Intelligenz eröffnet eine überraschende Perspektive: Das Menschliche, das man mit Maschinen simulieren möchte, zeigt sich das erste Mal in seiner prachtvollen emotionalen, sozialen und körperlichen Komplexität. Der Mensch wird sich wieder selbst zum Faszinosum. Und um diesen Austausch zu führen und zu qualifizieren, bietet 2019 das Wissenschaftsjahr Künstliche Intelligenz eine extrem wichtige Chance. Es ermöglicht eine Fülle unterschiedlicher Veranstaltungen, damit eine breite Auseinandersetzung, schafft Anschauung und Anlässe für Neugier. Und Neugier ist wichtig, denn eine neugierige Gesellschaft hat eine innewohnende Affinität für Innovation, eine offene Haltung für Chancen, vergisst dabei nicht die Risiken und bewertet eine Entwicklung mit einer ergebnisoffenen und informierten Diskursintelligenz.

Das Wissenschaftsjahr Künstliche Intelligenz wird den aktuellen Stand und die Leistungsfähigkeit der Forschung vermitteln, so dass mehr Menschen die Unterschiede der verschiedenen KI-Technologien und die Chancen verstehen. Es wird einen Raum für die Debatte eröffnen, was der Mensch eigentlich ist, was ihn auszeichnet und was ihn von Maschinen abgrenzt. Denn nur so kann Skepsis abgebaut werden und wir können die Diskussion darüber beginnen, wie KI jedem Einzelnen helfen kann, seine persönlichen Ziele zu erreichen. Und wie KI helfen kann, dass wir in der Gesellschaft leben können, in der wir leben wollen.

KI ist keine Fata Morgana, sondern ein Scheinriese. In der Entfernung gewaltig, aus der Nähe sehr nahbar. Und nach ein wenig Überlegung genau die Lösung für das initiale Problem! Wenn man an Jim Knopf, Lukas, Herrn Turtur und Lummerland denkt…“

Reinhard Karger, Deutsches Forschungszentrum Künstliche Intelligenz