AP1: Projektmanagement und Koordination
Ziel des Projektmanagements ist die Koordination des Projektes und damit das planmäßige Erreichen der Meilensteine und Projektziele. Das Projektmanagement kümmert sich weiterhin um die Durchführung der Maßnahmen gemäß den Richtlinien von Zuwendungsgeber (BMBF) und Projektträger. Die Projektberichterstattung wird koordiniert, ebenso die Erstellung der Projektdokumentation. Darüber hinaus wird die Zusammenarbeit der Projektpartner koordiniert (u. a. mittels physischer und virtueller Treffen der Projektbeteiligten).
AP2: Anforderungsanalyse und Design
Ziel dieses Arbeitspakets ist die detaillierte Analyse von Prozessen, Arbeitsweisen und Anwendungsszenarien, um einen systematischen Ausgangs- und Bezugspunkt für die technischen Entwicklungsarbeiten im Projekt herzustellen. Nach der Aufnahme der fachseitigen Szenarien werden funktionale und nichtfunktionale Anforderungen abgeleitet sowie die zu berücksichtigenden Datenquellen und -sets definiert. Damit sind die Ergebnisse dieses Arbeitspakets ein wichtiger Ausgangspunkt für die folgenden Arbeiten.
AP3: Entwicklung der Big-Data-Infrastruktur
Auf Basis der Analyse der Anwendungsszenarien und den darauf aufbauenden Anforderungen an den Newsroom ist das Ziel dieses technischen Arbeitspakets die Konzipierung und prototypische Implementierung einer Big-Data-Infrastruktur, die die vollständige und effiziente Umsetzung des geplanten Funktionsumfangs ermöglicht. Wesentliche Aufgaben sind die Bestimmung einer geeigneten Konfiguration der Lambda-Architektur, der technischen Anforderungen an das einzusetzende Software-Ökosystem, geeigneter Software-Komponenten und das Aufsetzen einer Testumgebung für das Projekt zur späteren Integration der Analysealgorithmen.
AP4: Echtzeitnahe multimodale Medienanalyse
Ziel dieses Arbeitspakets ist die Auswahl, die Konzeption und Realisierung von Verfahren zur Metadaten-Extraktion. Diese umfassen sowohl die Extraktion von Sprachinhalten aus nicht unmittelbar computerlesbaren Inhalten wie etwa Text in Bildern oder Sprache in Audiosignalen, aber auch die Extraktion von weiterführenden Metadaten wie die Sprechererkennung oder das Fingerprinting. Für die Implementierung entsprechender Big-Data-Komponenten werden zudem bestehende Verfahren auf die Laufzeitanforderungen der Architektur angepasst. Dies geschieht auf algorithmischer, paradigmischer und parametrischer Ebene.
AP5: Kontextualisierung und semantische Analyse der strukturierten Daten
Ziel des Arbeitspakets sind die Erforschung, Entwicklung und Integration von Verfahren für die semantische Annotation und Kontextualisierung von Mediendaten. Das umfasst erstens die semantische Aggregation und Aufbereitung dieser Daten sowie zweitens die Verbesserung von Modellen zur Mustererkennung.
AP6: Integration der Gesamt-Infrastruktur und Visualisierung
Ziel des Arbeitspakets ist die Integration der vollständigen Big-Data-Infrastruktur in einer Testumgebung einschließlich der Basis-Infrastruktur aus Arbeitspaket 3, der multimodalen Medienanalyse-Algorithmen aus Arbeitspaket 4 sowie den Algorithmen zur Kontextualisierung und semantischen Analyse aus Arbeitspaket 5. Darüber hinaus werden in diesem Arbeitspaket Möglichkeiten zur interaktiven Visualisierung der Analyseergebnisse implementiert und für den nachfolgenden Pilotbetrieb integriert. Die Auswahl der Visualisierungsmöglichkeiten orientiert sich an den in Arbeitspaket 2 erhobenen Anforderungen und den erforderlichen Schnittstellenspezifika (z.B. REST-API).
AP7: Pilotbetrieb und Benchmarking
Ziel des Arbeitspakets zu Pilotierung und Benchmarking ist es, die technischen Entwicklungen anhand möglichst realitätsnaher Anwendungsszenarien mit Feedback aus der journalistischen Anwendung zu konfrontieren. Dazu ist es wesentlich, sowohl geeignete Szenarien (z. B. Flugzeugabsturz, Todesfall, Flut, Sicherheitsleck, Börsengang, Firmen-Akquisition, Quartalszahlen, Produktlaunch, … ) zu entwickeln, detaillieren und zu beschreiben, als auch Kriterien für die Evaluation zu entwickeln, um auf dieser Basis ein Benchmarking der entwickelten Infrastruktur für die Recherche und Berichterstattung durchzuführen. Geeignete Szenarien müssen sowohl konkret genug sein, um ausreichend historische Beispiele zu haben, als auch die Möglichkeit zu bieten, dass sie aktuell während der Benchmarkingintervalle auftreten. Dies gewährleistet, dass nicht nur synthetische Auftreten dieser Szenarien im Benchmarking zu betrachten sind, sondern auch tagesaktuelle Szenarien
AP8: Verwertung und Transfer
Ziel des Arbeitspakets „Verwertung und Transfer“ ist es erstens, die von den Konsortialpartnern entwickelten Ergebnisse und Big-Data-Technologien der Fachöffentlichkeit bekannt zu machen. Ziel ist es zweitens, relevante Entscheidungsträger (Politik, Wirtschaft, Wissenschaft, Öffentlichkeit) über den Nutzen der Projektergebnisse zu informieren. Drittens soll der Transfer von Projektergebnissen in zukünftige Verwendungskontexte sichergestellt werden.