Vortrag am Starnberger See: Künstliche Intelligenz am Newsdesk

tutzing(Foto von mir)

 

Einen Vortrag zu meinen Forschungsthemen halten, aber diesmal nicht auf einer Fachkonferenz, sondern vor Leuten, die sonst gar nichts mit Algorithmen, Automatisierung und Personalisierung am Hut haben? Da bin ich doch dabei! Die Gelegenheit hat sich geboten, als ich von der Akademie für Politische Bildung in Tutzing am 10.04.2018 für einen Vortrag eingeladen wurde. Zuhörer der dazugehörigen Tagung „Die digitale Revolution“ waren hierbei, wie bereits erwähnt, keine Kollegen aus der Wissenschaft, sondern Gymnasiallehrer. Dazu noch ganz besondere Lehrer: nämlich sogenannte Seminarlehrkräfte, die die Referendare durch ihre Lehrzeit an der Schule begleiten. Aber auch abseits von der Arbeit mit Referendaren ist die neue (und nicht ganz so neue) Technik natürlich immer Thema an der Schule.

Ich habe mit meinem Vortrag „Künstliche Intelligenz am Newsdesk – Journalismus im digitalen Wandel“ dazu beigetragen, die Zuhörer in die Welt der Nachrichten-Personalisierung und vor allen Dingen des automatisierten Journalismus einzuführen. Hierbei ging es nicht darum, die neuesten empirischen Ergebnisse vorzustellen, sondern erst einmal einen allgemeinen Überblick über die schon weithin verbreiteten technischen Möglichkeiten von Algorithmen zu geben, und dann tief in die Technologie des automatisierten Journalismus einzusteigen.

Angefangen habe ich also mit einführenden Beispielen wie den personalisierten Empfehlungen von Amazon.de und dem Facebook Newsfeed, um dann die einzelnen Schritte nachzuvollziehen, die es braucht, bis ein fertiger von einem Computerprogramm erstellter Artikel auf dem Bildschirm erscheint. Das Beispiel, an dem ich den Prozess erklärt habe, war – wie sollte es anders sein – ein Fußball-Spieltag. Geschadet hat das Thema nichts, denn das hat gleich die eingefleischten Sportfans auf den Plan gerufen, die genau wissen wollten, wie denn nun aus blutleeren Statistiken zu gelben Karten und Einwechslungen ein (halbwegs) ansprechender Artikel gemacht werden kann.

Ob ein Artikel am Ende nun ansprechend ist oder nicht – gerade über die Möglichkeiten und die Grenzen des automatisierten Journalismus wurde kontrovers diskutiert. Dabei ging es erstmal um grundsätzliche Fragen: Braucht man automatisierten Journalismus überhaupt? Gibt es denn nicht genug Journalisten, die über die wirklich relevanten Dinge berichten? Eine gemeinsame Linie wurde nicht gefunden, aber es lässt sich sagen, dass der Nutzen schließlich durchaus gesehen wurde – besonders von denjenigen, die immer mal wieder „eben schnell“ Artikel über Schulsportveranstaltungen schreiben müssen, und dabei genau auswählen müssen, welche Veranstaltung nun die wichtigste ist. Allerdings wurde (richtig) erkannt, dass das Fehlerpotential nicht gering ist, denn immerhin muss die Datenquelle die korrekten Daten liefern, damit ein fehlerfreier Artikel geschrieben werden kann. Die Diskussion ging auch über diese Themen hinaus, und streifte so auch die „Fake News“-Debatte, und gegen Ende auch, wie man die Schüler wieder zur (Online-) Zeitung bringen kann. Vielleicht ist – aller Resignation zum Trotz – personalisierte Berichterstattung ja ein Weg?

Alles in allem wurde eine spannende Diskussion geführt, die mir abseits der Fachmeinung gezeigt hat, dass es durchaus (noch?) große Vorbehalte gegen den automatisierten Journalismus gibt, und durchaus mit Sorge auf die Zukunft der „Qualitätspresse“ geschaut wird. Und bevor hier jemand über meine Zuhörer unkt: nein, eine große Altersspanne war vertreten, ebenso wie ein ausgewogenes Verhältnis von Männern und Frauen. Egal wie alt, egal welches Geschlecht: die Sorgen ähnelten sich.

Aber genau deshalb ist es so wichtig, auch mal aus dem Elfenbeinturm herauszukommen: in der „richtigen“ Welt sieht es ganz anders aus, und lange nicht so hoffnungsfroh wie in der Wissenschaft. Während Algorithmen in der (kommunikationswissenschaftlichen) Forschung langsam Alltag geworden sind, in dem es meist nur noch um das „Wie“ geht, haben wir vor allen Dingen nach dem „Warum“ gefragt. Ab und an mal wieder drei Schritte zurück, das ist sehr wertvoll für die Forschung.

Ich bedanke mich bei Akademie für Politische Bildung für die Einladung – ich komme gerne mal wieder ins schöne Tutzing!

Advertisements

Neuer Artikel: Der Robo-Journalismus mit seinen Tücken und Möglichkeiten – Was Journalisten denken

blogpost_automatjourn(Foto von mir – der kleine BB-8 gehört natürlich zum Star Wars-Universum)

 

Wie bereits freudig erzählt und im letzten Post zum Radiointerview mit SWR2 Impuls noch einmal erwähnt, ist ein neuer Artikel erschienen, in welchem ich mich zusammen mit meinen Kollegen Prof. Neil Thurman (Ludwig-Maximilians-Universität München) und Konstantin Dörr (Universität Zürich) mit automatisiertem Journalismus befasse. Wir haben dazu Journalisten von großen Medienhäusern, wie z.B. der BBC und Reuters, entsprechende Software ausprobieren lassen, und sie hinterher zu ihren Einschätzungen befragt. Hier eine kleine Zusammenfassung der Ergebnisse.

Der ganze Artikel – in englischer Sprache – lässt sich mit einem Klick auf das pdf-Symbol herunterladen:

pdf-icon_klein

 

Bevor es zu den Ergebnissen geht –  was ist automatisierter Journalismus bzw. „Robo-Journalismus“ überhaupt?

Mit automatisiertem Journalismus ist gemeint, dass mittels Software und Algorithmen Texte geschrieben werden, d.h. dass nicht jede Nachricht einzeln von einem Menschen getippt wird. Die dazu nötigen Informationen werden aus Datensätzen entnommen, und automatisch in einen Text umgewandelt – dieses Vorgehen bietet sich besonders dort an, wo mit vielen strukturiert aufbereiteten Zahlen gearbeitet wird, wie z.B. in der Finanzbranche, in der für die Unternehmen immer ähnliche Kennzahlen vorkommen. Wenn die Software richtig programmiert ist, wird z.B. ein Finanzbericht in Windeseile ohne weiteres Zutun eines Menschen auf dem Bildschirm ausgespuckt.

Prinzipiell lässt sich das Verfahren überall dort anwenden, wo Geschehnisse als möglichst detaillierte Datenpunkte erfasst werden können. So auch im Sport, wie im Fußball – denn Spieler, Anzahl der Tore, der gelben Karten, oder auch die Auswechslungen können einzeln erfasst und damit für die jeweilige Software brauchbar gemacht werden. Das wichtige ist, dass für alle gleichartigen Ereignisse – wie alle Fußballspiele am Wochenende – die Daten im selben Format erfasst werden. Nur so kann die Software die Daten verarbeiten.

Bloß, weil ein Computer beteiligt ist, heißt das nicht, dass der Journalist vollkommen überflüssig ist. Denn, damit das Ganze funktioniert, müssen die passenden Datensätze erst einmal ausfindig gemacht und dann in die Software eingespeist werden. Danach liegt es am Journalisten, eine Vorlage erstellen, in welche die Software schließlich für die Berichte die Daten einsetzt. Das heißt, der Journalist schreibt in der Software eine Art Lückentext, mit Platzhaltern für die Datenpunkte und mit verbindenden Halbsätzen und Worten. Dieser Lückentext kann sehr kompliziert werden, da die Software natürlich bei einer Niederlage einen anderen Text schreiben soll als bei einem Kantersieg, ebenso soll bei einem Gewinn einer Firma ein anderer Text stehen als bei Verlusten. Das Schreiben dieser Vorlage ist eine sehr mathematische Angelegenheit, in der „wenn-dann-sonst“-Fälle innerhalb der Programmierung aufgemacht werden, damit jeder Situation, die in den Daten vorkommt, Rechnung getragen werden kann.

Nur noch ein Klick, und wenn die Vorlage, also der Lückentext, korrekt erstellt wurde, hat man in Windeseile Berichte für jedes Fußballspiel vom letzten Wochenende vor sich. Oder Finanzberichte für nicht nur eine, sondern für vielleicht 50 Firmen auf einmal, je nachdem, was der vorher eingespeiste Datensatz hergibt.

Wie man sieht, ganz ohne den Journalisten geht es nicht, immerhin muss jemand vorher der Software sagen, was sie tun soll. Aber ist das getan, können in kürzester Zeit viel mehr Berichte verfasst werden, als es der Journalist ohne die Software jemals könnte.

 

Was haben wir in der Studie gemacht?

Wir haben wir mit britischen Journalisten einen Workshop abgehalten, in dem sie eine Software für automatisierte Berichterstattung kennenlernen und ausprobieren konnten. Uns war wichtig, dass die Journalisten die Software und den automatisierten Journalismus nicht nur vom Hörensagen her bewerten, sondern eigene, frische Erfahrungen gemacht haben. Also hatten sie nach dem Software-Training gut zwei Stunden Zeit, selbst zu probieren und eigene Artikel zu erstellen.

Direkt nach dem Workshop haben wir sie zur Handhabung der Software befragt; auf solche Weise mit dem Computer und mit Sprache umzugehen war den meisten fremd. Daran anschließend wollten wir wissen, wie sie die Qualität der Ergebnisse, d.h. ihrer selbst generierten Berichte, einschätzen, ebenso wie die journalistische Qualität und den Informationsgehalt. Ebenfalls hat uns interessiert, wie die Software in ihren Arbeitsalltag integriert werden könnte – oder eben auch nicht, gerade im Hinblick auf Einsparungen in der Branche. Schließlich haben wir sie gebeten, die Rolle der „menschlichen“ Journalisten in der Zukunft einschätzen – denn: ist der automatisierte Journalismus für sie eine Bedrohung, oder eröffnet er neue Möglichkeiten?

 

Was haben die Journalisten gesagt? Bestimmt viel Negatives?

Es gab, wie zu erwarten war, einige negative Einschätzungen. Erst einmal ging es damit los, dass einige der Journalisten die Software als wenig intuitiv beschrieben. Schwierigkeiten lagen darin, die mathematischen Formeln in einem „Wenn-dann-sonst“-System anzuwenden, die nötig sind, um für jede Situation einen anderen Text bereitzustellen. Das ist verständlich – immerhin war die Software neu für sie, und Formeln haben normalerweise wenig mit dem journalistischen Alltag zu tun. Dazu hat so einigen der befragten Journalisten die kreative Seite ihres Berufs gefehlt, das Spielen mit Sprache und Formulierungen

Neben diesen Startschwierigkeiten wurde angemerkt, dass die Gefahr bestünde, sich in den kleinteiligen Daten zu verlieren, und dabei die eigentliche Geschichte nicht mehr zu sehen. Um beim Fußball zu bleiben: als eindrückliches Beispiel hat einer der Journalisten angeführt, dass es manches Mal nur zu einem geringen Teil um das Geschehen auf dem Platz ginge, sondern viel mehr um das Drumherum – wenn z.B. das letzte Spiel in diesem Stadion stattfindet, bevor es abgerissen wird, oder es Krawalle unter den Fans gegeben hat.

Außerdem könne ein aus dem Lückentext entstandener Text recht blutarm wirken. Es werden nur die Daten verwendet, die vorliegen – Meinungen dazu oder weitere Informationen zum Thema kann das Programm nicht verarbeiten. An letzterem wird in einigen Softwareschmieden allerdings schon gearbeitet. Dennoch, gerade den Journalisten der Boulevardblätter war es wichtig zu betonen, dass die „menschliche Seite“ einer Geschichte oft wichtiger sei als die die nackten Zahlen.

 

Und wie sieht es mit positiven Einschätzungen aus?

Auch Positives gab es zu vermelden. So haben einige der Journalisten geschätzt, dass man diese automatisiert erstellten Texte als ersten Anlaufpunkt für eine weiterführende Geschichte benutzen könne. Exceltabellen und andere Datensätze seien mit ihren Zahlenkolonnen oft schwer zu lesen, und da könne es helfen, wenn diese Daten in ganzen, wenn auch im ersten Zugriff einfachen Sätzen dargestellt werden. So ließe sich nach Einschätzung einiger Journalisten leichter sehen, ob sich z.B. die Kriminalitätsrate im Vergleich zu anderen Regionen erhöht, oder ob das Unternehmen im Vergleich zum letzten Monat Verluste eingefahren hat. Ausgehend von diesen Zahlen könne dann der Hintergrund recherchiert werden. In diesem Falle dient die Software als Hilfe, um die Daten zu lesen, und nicht als Instrument, um Berichte zu schreiben und diese dann zu verwenden.

Allerdings kann auch ein sehr einfacher und kurzer Bericht schon an die Leser gebracht werden. Gerade die Journalisten der großen Nachrichtenagenturen sahen in der Technik eine Möglichkeit, erst einmal die Fakten und Zahlen in Form von ‚breaking news‘ an ihre Kunden zu senden, und dann eine Hintergrundanalyse zu einem späteren Zeitpunkt nachzuliefern.

Außerdem fanden die Journalisten, dass die Software eine gute Möglichkeit biete, über Dinge berichten zu können, die ansonsten keine Beachtung fänden. Solange die Daten vorhanden sind, kann die Software Berichte schreiben – wie z.B. zu den Baseballspielen der Kinder in der USA. Die Daten zum Spielgeschehen liegen vor, und kein Reporter muss sich am Spielfeldrand einfinden. Das bedeutet, dass auch sehr spezielle Themen Eingang in die regelmäßige Berichterstattung finden können, wenn die Vorlage in der Software einmal geschrieben und getestet wurde.

 

Was ist das Fazit dazu? Und wo ist der Haken an der Sache?

Der automatisierte Journalismus ist keine Zukunftsvision mehr. Die Software wird immer mächtiger und ausgefeilter, und nicht wenige Publikationen benutzen sie bereits in ihrer täglichen Arbeit, wie z.B. Forbes für Finanzberichte. Wie man damit umgeht, das ist nun die Frage.

Meine persönliche Einschätzung ist, dass sich die Software besonders dafür eignet, um zeitraubende und für Fehler anfällige Tätigkeiten zu unterstützen oder ganz zu ersetzen. Wenn z.B. Börsendaten zusammengefasst werden müssen, kann es allein beim Übertragen der Zahlen zu Fehlern kommen – die Software macht diese nicht. Natürlich immer vorausgesetzt, dass die Daten stimmen, und hier liegt der Haken: die Berichte sind nur so gut wie der Datensatz, der ihnen zugrunde liegt. Ist dort Falsches vermerkt, wird das in die Welt geschickt – und deshalb wird der Journalist nicht obsolet werden, allein schon, um als Prüfinstanz zu wirken. Daneben wird er andere Aufgaben übernehmen, weg von eben beschriebener Routine, und im besten Fall mehr Zeit dafür haben, sich mit den Hintergründen zu befassen und tiefer zu recherchieren.

Außerdem wird der automatisierte Journalismus zu dem Trend beitragen, dass Nachrichten und andere Inhalte immer weiter auf den einzelnen zugeschnitten werden. Die Baseballspiele der Kinder, die nur ein kleines Publikum haben dürften, machen dabei den Anfang. Aber prinzipiell ist es mithilfe der Software auch möglich, die lokale Berichterstattung zu unterstützen, indem z.B. Berichte auf einzelne Stadtteile oder sogar Straßenzüge angepasst werden. Gerade bei regional sehr begrenzten Phänomen kann das ein Vorteil sein.

Aber, das muss man dazu auch sagen, der „Robo-Journalismus“ kann die journalistische Spürnase mit dem ‚Da steckt mehr dahinter‘-Gefühl nicht ersetzen. Das heißt, dass zumindest vom heutigen Standpunkt aus von der automatisierten Berichterstattung keine Bedrohung für den Journalisten ausgeht – aber wie das in Zukunft sein wird, hängt von den Entwicklungen der Software ab und ist kaum vorherzusehen.

Tagebücher sind doch für Mädchen! – Ein Plädoyer für das Forschungstagebuch

gb_kleinPlease click here for the English version!

researchjournal_klein(Foto von mir)


Was ist passiert?

… vielleicht stimmt es, dass Tagebücher meistens eher für Mädchen gedacht sind, wer weiß das schon so genau. Aber sie sind auch für Wissenschaftler interessant. Notizbücher – ob nun explizit als „Tagebuch“ bezeichnet oder nicht – sind im Generellen sehr nützlich: sie halten wichtige Gedanken zusammen, und wenn man nach einer Weile wieder hineinschaut und zurückblättert, kann man unter Umständen sehr wertvolle Informationen entdecken. Also, genauso wie ein Kalender festhält, was man an einem bestimmten Tag getan hat, tut ein Forschungstagebuch ziemlich dasselbe. Dennoch, es scheint mir, dass Forschungstagebücher eher selten genutzt werden, zumindest von Leuten, die ich kenne. Das sollte sich ändern!

Noch einmal ganz von vorne, was ist eigentlich ein Forschungstagebuch genau? Wie schon gesagt, es ist ein Notizbuch (oder Ordner), das mehr oder weniger wie ein konventionelles Tagebuch funktioniert, nur eben für wissenschaftliche Einträge (wissenschaftlicher Frust natürlich inklusive, nicht wahr!). Diese Einträge können von allem möglichen handeln: von möglichen Themen, Hypothesen, Literaturrecherche, möglichen Interpretationen von Daten, und so weiter, und so fort. Klingt noch immer nach Zeitverschwendung? Nein, gar nicht.

Was meine ich dazu?

Also, ganz kurz, warum glaube ich, dass ein Forschungstagebuch das essentielle Werkzeug für den Forschungsprozess ist? Schauen wir uns zunächst das offensichtlichste an:

 * Ordnung halten – zunächst ist alles – Gedanken, Hypothesen, etc. – zusammen gebunden in einem Notizbuch (oder einem Ordner), das heißt, zusammen an einem einzigen Ort, und am besten sogar in chronologischer Reihenfolge. Meiner Meinung nach zählen Loseblattsammlungen, wo mal hier ein Zettel herumliegt und da einer aus Versehen in den Mülleimer wandert, nicht als Forschungstagebücher, da sie eben nicht die Möglichkeit bieten, bestimmte Informationen, die z.B. an einem gewissen Datum geschrieben worden sind, schnell und effizient wieder hervorzuholen. Jedenfalls für mich ist das sehr wichtig, dass ich meine Gedanken schnell wiederfinde und damit schnell benutzen kann. Außerdem, wie bereits angedeutet, haben ein Notizbuch oder ein Order den Vorteil, dass nichts verloren geht, wie es bei der Loseblattsammlung schnell der Fall sein kann.

* Gedanken sind sicher verwahrt – dem ersten Punkt sehr ähnlich, aber dennoch nicht ganz dasselbe. Hierzu eine kleine Anekdote: als ich vor ein paar Monaten zwei Ordner aus meinem ersten Doktorandenjahr durchgegangen bin, beide voller Ausdrucke von Fachartikeln, Arbeitsblättern, Notizen und To-do-Listen, habe ich viele, viele kleine Notizen gefunden, die auf ebendiesen Dokumenten gekritzelt waren. Mal hier ein Gedanke in der Ecke der Seite des Fachartikels, mal da ein Fragezeichen neben den Notizen. Alles Gedanken, die jetzt wohl verloren wären, hätte ich nicht in just diesem Augenblick beschlossen, die wichtigsten und wertvollsten von ihnen in ein gebundenes (!) Forschungstagebuch zu übertragen. Also, so alteingesessen bin ich selbst noch nicht, wenn es um Forschungstagebücher geht. Aber: ich kann sagen, dass mir diese Gedanken, die ich vor über einem Jahr hatte, jetzt sehr weiterhelfen – und Probleme lösen, über die ich jetzt nicht mehr nachdenken muss. Also, in kurz lässt sich sagen, dass das Vorgehen, die Dinge an einem einzigen Ort aufzubewahren, so Einiges an wertvollen Gedanken sicher verwahren kann.

* Eine hübsche Erinnerung und Motivation – okay, okay, das klingt jetzt wohl sehr mädchenhaft, aber ich mag es, mir alte Dinge anzusehen. Was die älteren Einträge im Forschungstagebuch angehen, helfen sie mir auch, mich zu motivieren – gerade wenn ich denke, dass ich seit Monaten nichts geschafft habe, und einfach nicht vorankomme. Dass das nicht wahr ist, zeigen mir meine Notizen im Forschungstagebuch, denn in dieser vermeintlichen Leere habe ich doch Schritte gemacht, wenn vielleicht manchmal nur sehr kleine. Das ist alles festgehalten, und es hilft mir, mich für neue Schritte zu motivieren und meinem Ziel näher zu kommen.

Fazit

Zusammengefasst lässt sich sagen, dass ein Forschungstagebuch im Forschungsprozess sehr helfen kann, gerade wenn man über mehrere Jahre an einem einzigen Projekt arbeitet, wie es bei der Doktorarbeit der Fall ist. Aber nicht nur bei der Doktorarbeit kann es sehr nützlich sein, ich glaube auch, dass es bei Bachelor- oder Masterarbeiten helfen kann, die Gedanken zu ordnen und auf Ideen zu kommen. Denn auch wenn der Umfang und die vorgegebene Zeit für diese Arbeiten sehr viel kürzer sind, ist auch das sehr anstrengend und verlangt eine Menge ab; gut, wenn man es sich einfacher machen kann.

_____________________________________________________________________________________________________