Forscher der University of Michigan haben eine Software entwickelt, die Nachrichtenagenturen und Social-Media-Seiten helfen soll, das Problem von Fake News in den Griff zu bekommen. Das System, das auf einem speziellen Algorithmus basiert, nutzt eine ausgeklügelte Form der Sprachanalyse, um verdächtige Meldungen zu identifizieren. Bei ersten Tests konnte die automatische Lösung gefakte Beiträge in 76 Prozent der Fälle korrekt aufspüren. Menschliche Kontrolleure schafften hingegen nur 70 Prozent.
Viele überforderte Redakteure
"Das Auffinden von Fake News kann ziemlich schwierig sein. Nachrichtenportale und Social-Media-Plattformen müssen sich hierbei vor allem auf ihre Redakteure verlassen, die aber oft mit der enormen Flut an neuen Meldungen, die über sie hereinstürzen, einfach überfordert sind", zitiert TechXplore Rada Mihalcea, Professorin für Informatik und Ingenieurwesen an der University of Michigan. Oft dauere es auch sehr lange, bis die Fakten zu einer Meldung extern verifiziert werden. "Meistens ist dann, wenn klar ist, dass eine Story gefälscht ist, der Schaden bereits angerichtet", betont die Projektleiterin. Um möglichst schnell und genau zu arbeiten, seien technische Hilfsmittel unumgänglich.
"Linguistische Sprachanalyse durch speziell dafür entwickelte Algorithmen eröffnet hier ganz neue Möglichkeiten. Sie ist viel schneller als es Menschen jemals sein können und lässt sich auf eine ganze Reihe verschiedener Arten von Nachrichtenartikeln anwenden", so Mihalcea. Damit die Software automatisch richtige von gefälschten News-Meldungen unterscheiden konnte, musste sie zunächst einem ausgiebigen Training unterzogen werden. Hierzu rekrutierten die Forscher ein Online-Team aus Redakteuren, deren Aufgabe es war, wahre Storys in Fake-News zu verwandeln. Am Ende dieses Prozesses entstand ein Datenset mit insgesamt 500 echten und falschen Beiträgen.
"Erfolgsrate lässt sich noch steigern"
Die gesammelten Daten wurden anschließend vom Algorithmus mittels linguistischer Analyse ausgewertet. Dabei wurde etwa besonders auf Eigenschaften wie die grammatische Struktur, Wortwahl, Interpunktion und Komplexität geachtet. Nach dem Training mit diesen Daten wurde die Software dann auf echte Nachrichten aus dem Web losgelassen und erzielte dabei bessere "Fangquoten" als menschliche Mitarbeiter. "Mit mehr Training lässt sich die Erfolgsrate sicher noch steigern", ist Mihalcea überzeugt. (ptx)
www.umich.edu