Categories
Blog

Text KI – Das Comeback der Zeitungen?

In einer Zeit, in der KI die Zukunft zu beherrschen scheint, werden die Trainingsdaten der KIs wie GPT (Generative Pretrained Transformer) immer wichtiger. Jetzt hat sich die Medienlandschaft in den letzten Jahren stark entwickelt, weg von geschriebenem, hin zu Audiovisuellem. Daraus ergibt sich die Frage:

Haben TV Anstalten das Nachsehen?

Estimated reading time: 4 minutes

Die privaten Medien

KI Bestandsaufnahme:

Wenn man sich die Internetauftritte der Privaten Medienhäusern wie der SZ, der FAZ oder einem Boullewardblatt wie Bild.de ansieht, wird man nach der Überschrift direkt im Lesefluss unterbrochen. Das sogenannte Freemium Modell hindert ungestörtes lesen. Man hat also die Wahl zwischen dem Akzeptieren der Werbung und aller optionalen Tracking Cookies – sprich der Aufgabe der Privatsphäre oder zu zahlen, um auf den Informationsgewinn durch den Zugriff auf den Artikel zugreifen zu können.

Die öffentlichen Medien

KI Bestandsaufnahme:

Deutschlandfunk

Deutschlandfunk hat vor allem Radioprogramm, Features und einige Artikel auf der Website. Zudem bietet DLF mehrere RSS Feeds an, um zielgruppengerecht und plattformübergreifend Inhalte zur Verfügung stellen zu können. Neben Menschen als Zielgruppe eignen sich diese Listen auch als Ausgangslage zum Scrapen der Websiten nach Informationen – sehr KI-freundlich.

RSS ist eine Technik, in der hinter einer URL, also einer Webadresse eine Liste mit neuen oder selektierten Artikeln inclusive Metadaten wartet. So können unterschiedliche Abspielgeräte diese standardisierte Liste lesen und in ihrem Wiedergabemenü die einzelnen Artikel / Podcastfolgen anzeigen.

Zur Information

ARD

Die ARD hat ebenfalls viele Artikel online und bietet eine solide aufgebaute Archivierung der Artikel. So besteht eine URL immer wie folgt, wobei YYYY, MM und DD mit Jahr, Monat und Tag auszufüllen sind. So bekommt man zu jedem Tag eine Übersicht aller Tagesschaumeldungen. Für eine Text KI eine super Ressource, um sich an Informationen zu bedienen, vorausgesetzt das Scraping funktioniert.

https://www.tagesschau.de/archiv/allemeldungen?datum=YYYY-MM-DD

ZDF

Das ZDF bietet auf der Website eine Lösung für jeden, nur nicht für Maschinen. Die sehr konfigurierbare Suchfunktion ermöglicht es Ausschnitte, ganze Sendungen vom ZDF und diversen Medienpartnern zu finden, nicht aber ein Archiv, welches von Suchalgorithmen systematisch durchlaufen werden kann. Das „Lazy Load“ Prinzip nutzt zwar alle Tricks der visuell spannenden Webgestaltung, ermöglicht es aber nur schwer, alle Artikel zu klassifizieren. Ein konkreter API Call wird nach eigener Analyse nicht gemacht. Hier ist definitiv Algorithmus-Verbesserungspotenzial.

Zudem hat das ZDF als Fernsehsender in vielen Artikeln Videos eingebunden, welche per se nicht von einer Sprach KI verstanden werden können. Wie das dennoch funktionieren kann…

Audiovisuelles in die KI bekommen

Um Sprache oder den Audiopart von einem Video in eine Sprach KI zu bekommen, bietet sich an, ein Transkript zu erstellen. Dafür gibt es online schon verschiedene Tools, wer aber Fan von Privatsphäre ist oder die nötige Zeit hat, Geld sparen muss oder einfach nur unabhängig und offline sein möchte, der kann Whisper benutzen. Diese KI kann komplett lokal laufen und einen Audiostream in geschriebenen Text verwandeln. Das ganze läuft nicht 100% fehlerfrei, aber spart sehr viel Arbeit, da nur noch eine menschliche Kontrolle nötig ist.

Je nach Einstellung wird der Text als String in eine Textdatei abgelegt oder strikt nach der SRT Formatierung bereitgestellt. (So ließe sich die Datei durchsuchen und direkt der Timecode der relevanten Stellen finden.) Dieses Transkript könnte dann in das nächste Trainingsset für eine kommende GPT Version eingearbeitet werden und dementsprechend in den kommenden, generierten Texten vorkommen.

Die Sache mit dem Urheberrecht

Cedric Mössner – Informatiker und Youtuber hat das ganze wunderbar zusammen gefasst

Fazit:

Um eine sichere und öffentlich zugängliche Informationsbasis für Mensch und Maschine zu haben, ist es unbedingt notwendig, eine Vielzahl an qualitativ hochwertigen geschriebenen Informationen frei zugänglich zu machen. Das heißt, die Nachrichten- und Informationswelt muss nicht nur für Audiovisuelle Medien produzieren, sondern auch versuchen, die Inhalte in eigens geschriebener, transkribierter und kontrollierter – somit redaktionell abgenommener Form, den Suchmaschinen und Text-KIs zur Verfügung gestellt werden. Ob die Hersteller der KIs einen Weg finden, für die Informationen private Medienhäuser zu vergüten ist fraglich. Daher ist eine öffentlich rechtliche Informationsbasis zum Training der KIs umso wichtiger.

Langer Satz. Ich weiß. Mal sehen wir GPT 5 sich damit schlagen wird.


Mehr lesen: