Woran arbeitet »News-Stream«? Auf der CeBIT 2016 haben wir den Stand unserer Arbeit anhand eines nachgebauten Redaktions-Arbeitsplatzes präsentiert. Die modularen Anwendungen machen deutlich, wie sich Big Data Werkzeuge in Redaktionen nutzen lassen. Das vom Bundesministerium für Forschung und Bildung geförderte Projekt befindet sich im Frühjahr 2016 bei etwa der Hälfte der Gesamtlaufzeit. 2016 und 2017 werden die bisherigen Demos stetig weiter entwickelt.

Kurze Übersicht: »News-Stream« arbeitet an zwei großen Bereichen: Der Textanalyse und dem Audiomining. Es geht darum, diese zwei großen Inhaltsbereiche besser zugänglich, übersichtlicher zu machen – und aus der Analyse neue Funktionalitäten, Möglichkeiten und konkrete Arbeitsabläufe für Journalisten zu entwickeln.


Demos Textanalyse 

  • Zitator
  • Distribution Monitoring
  • Topic Montoring
  • »News-Stream« Dashboard

Konsortialpartner: Neofonie (https://www.neofonie.de)


Motivation Textanalyse

Journalisten sind Lotsen in einem immer komplexer werdenden Informationsdschungel: Sie müssen aus einer Vielzahl an Nachrichtenquellen Informationen filtern, bewerten und auf unterschiedlichen Kanälen weiter verarbeiten. Im Forschungsprojekt »News-Stream« entwickeln das Fraunhofer IAIS und Neofonie zusammen mit Deutsche Welle und dpa neue Recherche- und Analysetools: Mit wenigen Klicks können Journalisten tausende Inhalte aus Videoplattformen, RSS-Feeds, Medienarchiven oder sozialen Medien auf dem Bildschirm thematisch bündeln und sich in Echtzeit über aktuelle Ereignisse informieren.

Auf der CeBIT stellen die »News-Stream«-Experten erste Ergebnisse und Anwendungsbeispiele vor. Dieser Beitrag bietet eine kurze Übersicht über die wichtigsten Funktionen.


Technologie

Bisherige journalistischen Werkzeuge sind dem kontinuierlich wachsenden Echtzeitdatenstrom im News Room nicht mehr gewachsen. Dafür sind sie niemals konzipiert und entwickelt worden. Es reicht heute einfach nicht mehr, Inhalte manuell über Google zu suchen. Es reicht nicht, täglich die vorhandenen Publikationen und Quellen zu sichten. Ein solches Vorgehen kostet viel Zeit, ist am Ende dennoch nicht wirklich vollständig und nicht ausreichend strukturiert. Daher nutzt das »News-Stream« Projekt Big Data Technologien, um Journalisten in der täglichen Praxis neue Möglichkeiten zu bieten. Der Fokus liegt zum einen auf der Audioanalyse, zum anderen auf neuen, innovativen Formen der Textanalyse. Wichtig zu wissen: Wir gehen modular vor, um so ganz konkrete Anforderungen mit einer konkreten Anwendung zu erfüllen.

Übersicht: Die zwei Hauptstränge Projekts sind Textanalyse und Audioanalyse

Bildschirmfoto 2016-03-13 um 12.17.47

 

 


Quellen-Finder

Der Konsortialpartner Neofonie arbeitet im Rahmen des Projekts »News-Stream« an verschiedenen Werkzeugen, bei denen durch Textanalyse große  Datenmengen ausgewertet werden. Das Ziel lautet, relevante Inhalte und Zusammenhänge sichtbar zu machen.  Dabei werden Technologien zur semantischen Analyse von Texten  eingesetzt, die für die Verarbeitung sehr großer und schnell veränderlicher Informationen ausgelegt sind.

Die Übersicht unten zeigt die dazu notwendige Architektur: Eine Vielzahl unterschiedlicher Quellen werden in einer für Big Data ausgelegten IT-Architektur verarbeitet und dann über unterschiedliche Anwendungen bereit gestellt.

Bildschirmfoto 2016-03-13 um 12.21.16

 


Übersicht über die bisher verfügbaren Demos

  • Zitator: Zitate suchen
  • Distributions-Monitoring: Wie oft und vor allem publiziert eine bestimmte Quelle zu einem Thema?
  • Themen-Monitoring: Welche Quellen berichten aktuell über ein bestimmtes Thema?
  • Dashboard: Erweiterte Lösung, die mit vielen Parametern arbeitet, um Übersicht zu schaffen

Wie sieht das konkret aus?


Demo: Zitator
Ein erstes Beispiel ist der “Zitator”, eine Anwendung, um in großen Textbeständen bestimmte Zitate zu suchen. Mit Hilfe dieses Recherchetools lassen sich rasch Belege für umstrittene Aussagen auffinden. Ebenso ist es möglich die wechselnden Positionen bei komplexen Themen sichtbar zu machen.

Bildschirmfoto 2016-03-13 um 12.31.44

Funktionen
Der Zitator kann auf drei verschiedene Arten genutzt werden:

  • Zitate einer Person finden, dazu genügt die Eingabe des Namens
  • Bestimmte Suchbegriffe, die dann automatisch Personen zugeordnet werden, die den Begriff benutzt haben
  • Suche nach bestimmten Textstellen – so lässt sich schneller als zuvor überprüfen, ob ein ein Zitat, eine Aussage oder eine Textstelle übernommen wurden

Bildschirmfoto 2016-03-13 um 12.34.10

Kontext
Die Ergebnisliste für die Zitate wird automatisch mit Links zu weiterführenden Quellen angereichert, beispielsweise mit Daten zur Biografie einer Person. Das ist hilfreich, um wichtige Jahreszahlen, Bezeichnungen, Rollen im Detail zu überprüfen. Aktuell wird beispielhaft mit WikiData verlinkt – wir wollen damit zeigen, wie sich Suchergebnisse der Anwendung durch ständig aktualisierte Zusatzinformationen weiter anreichern lassen.

Bildschirmfoto 2016-03-13 um 12.36.45

Anwendungsbeispiele: Suche nach Begriff oder Namen in Zitaten
Die drei verschiedenen Wege zum Aufspüren bestimmte Zitate, Worte oder Textstellen lassen sich unterschiedlich nutzen. Beispiel: Wenn gerade viel über eine bestimmte Person oder eine Aussage gesprochen wird, erzeugt der Zitator eine Überschicht und findet dann auch Erwähnungen, die sonst gar nicht erfasst worden wären. In unserem Beispiel wird nach den Namen “Blatter” gesucht.

Bildschirmfoto 2016-03-13 um 12.38.46

Forschung und Weiterentwicklung
Der “Zitator” zeigt, wie sich Big Data Technologien mit konkreten Rechercheanforderungen verbinden lassen. Doch natürlich gibt es hier weiteren Forschungsbedarf: Wie gut sind die Ergebnisse? Schleichen sich durch die automatische Erfassung bestimmte Fehler ein? Um einen Prozess stetiger Verbesserungen zu ermöglichen, können Nutzer Feedback zur Qualität der Ergebnisse geben. Als Folge lernt die Anwendung immer weiter dazu.

Bildschirmfoto 2016-03-13 um 12.40.35

Aktueller Stand und weitere Entwicklung
Derzeit liefert der Basisdienst der dpa die Grundlage für die Zitat-Suche. In Zukunft sollen weitere Quellen und Informationsströme die Anwendung erweitern. Bei der Zitaterkennung wird aktuell auf “pattern matching” gesetzt. In Zukunft sollen hier Machine-Learning-Verfahren zum Einsatz kommen. Dadurch wird es möglich sein, die Erkennung relevanter Zitate immer weiter zu verbessern.

Weitere Demos – kurz dargestellt…


Demo: Distribution Monitoring
Diese Anwendung bietet die Möglichkeit, die das Publikationsmuster verschiedener Quellen sichtbar zu machen. Dabei wird nicht nur die Zahl der veröffentlichten Beiträge sichtbar, sondern auch der Zeitpunkt, zu dem besonders viele Informationen publiziert wurden. Wichtig ist hier die Form der Visualisierung: Durch die „Heatmap“ können verschiedene Dimensionen – Tage, Häufigkeit – auf einen Blick sichtbar gemacht werden.

Bildschirmfoto 2016-03-13 um 12.43.26


Demo: Topic Monitoring
Ein weiteres Demo, ein weiterer Blickwinkel der in der Praxis häufig wichtig ist: Welche Medien berichten aktuell mit welchen Schwerpunkten über ein bestimmtes Thema? Immer wieder kommt es vor, dass große oder plötzliche Ereignisse eine Flut an Veröffentlichungen erzeugen – mit Hilfe des Topic Monitoring lässt sich das erfassen und auswerten.

Bildschirmfoto 2016-03-13 um 12.46.28

 


Demo: »News-Stream« Dashboard – News aus der Vogelperspektive
Allgemeiner, dafür umfassender ist diese Ansicht: “Dashboards” sammeln unterschiedlichste Daten und stellen diese dann visuell dar. Das von Neofonie entwickelte zeigt, wie viele Parameter dabei eine Rolle spielen. Aus dieser Gesamtsicht vieler Aspekte können in Zukunft weitere Einzellösungen entwickelt werden.

Bildschirmfoto 2016-03-13 um 12.48.28

Filterung, Suche nach Auffälligkeiten
Das Dashboard ermöglicht die Beobachtung vieler Quellen über einen längeren Zeitraum – und deckt so rascher Auffälligkeiten auf, die dann zum Startpunkt neuer Beiträge werden.

Bildschirmfoto 2016-03-13 um 12.50.17


Interesse, Vorschläge, Verbesserungen? Sprechen Sie mit uns.
Die hier vorgestellten Big Data Werkzeuge für Journalisten sind aktuell in der Erprobungsphase. Deutlich werden soll hier vor allem wie stark sich dieses Forschungsprojekt an der Praxis orientiert. Jetzt wollen wir wissen, wie gut die Ergebnisse im Kommunikationsalltag nutzbar sind. Nutzerfeedback, zusätzliche Anforderungen und Ideen für Erweiterungen sind daher sehr willkommen. Sprechen Sie uns an, wir richten auf Wunsch gerne Testzugänge ein. Unsere Kontaktdaten finden sie hier.