Beiträge

Explainer: Wie funktioniert eigentlich Topic Monitoring?

Was sind die wichtigsten Themen der aktuellen Berichterstattung? Und welche Medien berichten darüber? Diese Frage beantwortet unsere “Topic Monitoring”-Demo. Wie Topic Monitoring Journalisten bei ihrer täglichen Arbeit unterstützt und welche Technologien dahinter stecken, erklärt Peter Adolphs von Neofonie:

Die folgende Grafik zeigt eine Visualisierung der aktuellen Themen. In der linken Spalte sind die wichtigsten Quellen zu sehen, die der Redakteur konfiguriert hat. Die Themen werden als blaue Kreise visualisiert. Rechts neben den Kreisen stehen die wichtigsten Schlagworte und Eigennamen, die ein Thema charakterisieren. Beim Thema “Julian Assange” sind das z.B. “Wikileaks” und “London”. Ein Klick auf ein Schlagwort könnte das Netz weiterer verbundener Schlagworte anzeigen.

explainertopicmonitoring

Anwendungsszenarien für Topic Monitoring
Das geschilderte Szenario orientiert sich an Journalisten, die das Tagesgeschehen beobachten wollen. Ihnen geht es vor allem um neue Themen und deren Gewichtung in der Berichterstattung. Ein anderer Anwendungsfall ist die Beobachtung vorab definierter Themenfelder. Worüber spricht die Berliner Regionalpresse? Was wird über die CeBIT berichtet? Welche Themen spielen in der Berichterstattung über den Autobauer Tesla eine Rolle? Hier werden die Nachrichten über thematisch verwandte Schlagworte gefiltert . Neben Schlagworten können hierfür alle verfügbaren Metadaten verwendet werden, z.B. im Text erkannte Eigennamen, Ort, Ressort oder Nachrichtenquelle.

Das Topic Monitoring ist ein Verfahren des unüberwachten maschinellen Lernens. Für das thematische Clustering ist also kein Vorwissen über die Dokumente oder manueller Pflegeaufwand erforderlich. Es ist deshalb gut für die Analyse großer Textmengen geeignet, deren Inhalte nicht vorab bekannt sind. News-Stream analysiert die Datenquellen dabei in naher Echtzeit. Ein Ziel ist es, Live-Streams verschiedener Fernsehkanäle automatisch Themen-Clustern zuordnen. Auch außerhalb des Newsrooms hat das Topic Monitoring seinen Platz: Leserbefragungen lassen sich auf diese Weise ebenso sortieren und auswerten wie z.B. Anfragen an einen Kundendienst oder große Bestände wissenschaftlicher Veröffentlichungen.

Werkstattbericht No. 4 – Haben Sie eine Distributionsstrategie?

Die Konkurrenzanalyse gehört in Medienunternehmen zum täglichen Business – insbesondere im Onlinebereich. Dabei steht i.d.R. die Themenagenda im Fokus der Aufmerksamkeit. Kein Nachrichtenunternehmen will schließlich ein wichtiges Thema in der eigenen Berichterstattung auslassen und Nutzer an die Konkurrenz verlieren.

Es gibt einen Aspekt, der für die eigene Strategie mindestens genauso wichtig ist, wie das Themenmonitoring – die Distributionsanalyse.

Warum ist die Distributionsanalyse wichtig für mich?

Die Daten, die bei der Distributionsanalyse herangezogen werden, können bei der Optimierung der eigenen Distributionsstrategie helfen die Nutzer besser zu erreichen. Bei der Analyse wird der Zeitpunkt der Publikation herangezogen. Eine Heatmap-Visualisierung eignet sich für die Darstellung der Ergebnisse besonders gut dafür. Durch die gewonnen Erkenntnisse lässt sich die Distributionsstrategie nicht nur klarer nachvollziehen, sondern ermöglicht es auch sich von der Konkurrenz durch ein eigenes Profil abgrenzen. Die Datenanalyse kann dabei helfen u.a. folgende Fragen zu klären:

– Habe ich eine Distributionsstrategie?
– Hat die Konkurrenz eine Distributionsstrategie?
– Welche Themen werden zu welchem Zeitpunkt publiziert?
– Welche Themen stehen momentan bei der Konkurrenz im Fokus der Berichterstattung?
– Hat sich meine Distributionsstrategie über die letzten Wochen verändert?

Ein Beispiel: Toranalyse BuzzFeed
BuzzFeed publiziert die meisten Artikel außerhalb der üblichen Kernarbeitszeiten. Sobald wir aber in der Freizeitzone sind, werden wir mit Content versorgt. Besonders intensiv ab 17:00 EST bis spät in die Nacht hinein. Auffällig ist insbesondere die Berücksichtigung der Mittagspause (12:00 EST), die ebenso gezielt für die Contentdistribution genutzt wird.

„Analyse:

Analyse: http://pushthings4ward.com/buzzfeed/index_en.html

Sieht man sich hingegen deutschsprachige Nachrichtenanbieter an lässt sich in den meisten Fällen keine eindeutige Distributionsstrategie erkennen – eher ein 7to7-Muster.
News-Stream

Das Themenmonitoring ergänzt die Beurteilung der aktuellen Situation. Nach dem Terroranschlag in Paris hat die Berichterstattung deutlich angezogen.

News-Stream

Wie gehen wir bei der Analyse vor

Wir crawlen Nachrichtenseiten, extrahieren anhand von händisch erstellten Pattern auf der HTML-Struktur der Seiten die Artikelinhalte und Metadaten, wie z.B. das Datum der Veröffentlichung und speichern diese Informationen anschließend in einem Suchindex. Zusätzlich binden wir den dpa Basisdienst ein, der ebenfalls in den gleichen Index geschrieben wird. Dadurch dass Quelle und Veröffentlichungsdatum als Feld im Index gespeichert werden, kann man in Anfragen nach Quelle und Zeitraum filtern. Die Datenbasis für die Heatmap ist dann ganz einfach über eine facettierte Suchanfrage zu erstellen, die pro Quelle und Tag, bzw. Stunde, die Anzahl der veröffentlichten Artikel liefert. Die Visualisierung der Heatmap wurde mit der Javascript-Bibliothek D3.js realisiert.

Wollen Sie mehr erfahren? Werden Sie jetzt News-Stream 3.0 Beta-Tester http://bit.ly/newsstreambetatester