Demo: Zitator
Der “Zitator” hilft dabei, um in großen Textbeständen bestimmte Zitate zu suchen. Mit Hilfe dieses Recherchetools lassen sich rasch Belege für umstrittene Aussagen auffinden. Ebenso ist es möglich die wechselnden Positionen bei komplexen Themen sichtbar zu machen.
Funktionen
Der Zitator kann auf drei verschiedene Arten genutzt werden:
- Zitate einer Person finden, dazu genügt die Eingabe des Namens
- Bestimmte Suchbegriffe, die dann automatisch Personen zugeordnet werden, die den Begriff benutzt haben
- Suche nach bestimmten Textstellen – so lässt sich schneller als zuvor überprüfen, ob ein ein Zitat, eine Aussage oder eine Textstelle übernommen wurden
Kontext
Die Ergebnisliste für die Zitate wird automatisch mit Links zu weiterführenden Quellen angereichert, beispielsweise mit Daten zur Biografie einer Person. Das ist hilfreich, um wichtige Jahreszahlen, Bezeichnungen, Rollen im Detail zu überprüfen. Aktuell wird beispielhaft mit WikiData verlinkt – wir wollen damit zeigen, wie sich Suchergebnisse der Anwendung durch ständig aktualisierte Zusatzinformationen weiter anreichern lassen.
Anwendungsbeispiele: Suche nach Begriff oder Namen in Zitaten
Die drei verschiedenen Wege zum Aufspüren bestimmte Zitate, Worte oder Textstellen lassen sich unterschiedlich nutzen. Beispiel: Wenn gerade viel über eine bestimmte Person oder eine Aussage gesprochen wird, erzeugt der Zitator eine Überschicht und findet dann auch Erwähnungen, die sonst gar nicht erfasst worden wären. In unserem Beispiel wird nach den Namen “Blatter” gesucht.
Forschung und Entwicklung: Wie sehen die nächsten Schritte aus?
Der “Zitator” zeigt, wie sich Big Data Technologien mit konkreten Rechercheanforderungen verbinden lassen. Die aktuelle Demo bietet die Möglichkeit ein bestimmtes Zitat zu suchen und dann Zusatzinformationen zu erhalten, wie oft, von wem und wo dieses Zitat benutzt wurde. Doch natürlich gibt es hier weiteren Forschungsbedarf: Wie gut sind die Ergebnisse? Schleichen sich durch die automatische Erfassung bestimmte Fehler ein? Um einen Prozess stetiger Verbesserungen zu ermöglichen, können Nutzer Feedback zur Qualität der Ergebnisse geben. Als Folge lernt die Anwendung immer weiter dazu.
Aktueller Stand und weitere Entwicklung
Derzeit liefert der Basisdienst der dpa die Grundlage für die Zitat-Suche. In Zukunft sollen weitere Quellen und Informationsströme die Anwendung erweitern. Bei der Zitaterkennung wird aktuell auf “pattern matching” gesetzt. In Zukunft sollen hier Machine-Learning-Verfahren zum Einsatz kommen. Dadurch wird es möglich sein, die Erkennung relevanter Zitate immer weiter zu verbessern.