Künstliche Intelligenz für Verlage
Zwischen Heilsversprechen und Existenzbedrohung
Die KI-Revolution ändert alles. Nichts bleibt, wie es war und niemand kommt dran vorbei. Das ist die Botschaft der Hypemaschine, die seit geraumer Zeit sämtliche Gesellschafts- und Wirtschaftszweige beschallt. Dem kann sich auch die Verlagsbranche nicht entziehen. Dabei ist das Verhältnis der Verlage zur generativen KI – dem Gegenstand des Hypes – zwangsweise zwiespältig.
Sind doch Verlage als hauptamtliche Inhaltsproduzenten einerseits potentielle KI-Anwender (KI erzeugt Inhalte für den Verlag), andererseits potentielle KI-Opfer (KI erzeugt Inhalte anstelle des Verlags). Entsprechend intensiv setzt sich die Branche mit dem Thema auseinander.
Gute Frage, wahrscheinlich gute Antwort
Für Fachverlage ist der Einbau von KI-Chatbots in ihre digitalen Fachinformationsprodukte eine naheliegende Idee. An die Stelle technisch anmutender Suchmasken und Trefferlisten tritt der natürlichsprachige Dialog – Mensch fragt, Maschine antwortet. Ein Traum wird wahr.
Rein technisch ist das, der KI-Revolution sei Dank, nur noch eine Fingerübung. Aber sind die Antworten des Chatbots gut genug, dass sie ein Fachverlag guten Gewissens unter seiner Marke präsentieren kann?
Wer sich schon einmal mit ChatGTP & Co. etwas intensiver über ein vertrautes Thema unterhalten hat, weiß, dass die Maschine gelegentlich im Brustton der Überzeugung gröbsten Unfug behauptet. Druckreif formuliert, aber doch nur eloquent gelogen.
Diese Unzuverlässigkeit ist systemimmanent, denn jede Antwort von ChatGTP & Co. ist das Ergebnis einer extrem aufwendigen Wahrscheinlichkeitsrechnung, eine stochastisch erzeugten Reihe von Buchstaben und Satzzeichen, die mit höchstmöglicher Wahrscheinlichkeit eine korrekte Antwort auf die gestellte Frage sein dürfte. Das klappt meistens verblüffend gut, geht aber manchmal völlig daneben. Normalerweise ist das nicht der Qualitätsanspruch, den ein Fachverlag an seine Autoren stellt.
Die Gretchenfrage zum Einsatz von KI in Fachverlagsprodukten lautet daher nicht: „Geht das?“
Die Frage ist: „Geht das gut genug?“
Qualität herausarbeiten
Wenn wir Ihnen KI-Technologien für Ihr Verlagsprodukt bereitstellen, ist das nur der Anfang eines Projekts, das allein der Qualität der Ergebnisse gewidmet ist. Wir beziehen Ihre ExpertInnen aus Redaktion, Lektorat, Autoren- und Kundschaft ein, um mit ihrem Feedback die KI zu kalibrieren, bis Sie sie guten Gewissens auf Ihre Kundschaft loslassen können.
Das gilt für KI Chatbots in digitalen Publikationen ebenso wie für andere Anwendungen, in denen KI in Ihrem Auftrag Inhalte zur Veröffentlichung produzieren soll.
Klingt aufwendig?
Ist es auch.
Geht aber nicht anders.
Eine gute fachspezifische KI fällt nicht vom Himmel, sie muss gemacht werden. Wir helfen Ihnen dabei. Sprechen Sie uns an.
Wie viel KI benötigt Ihr Verlag wirklich?
Um dies zu beantworten erarbeiten wir gemeinsam die Einsatzmöglichkeiten von KI-Tools, deren Sinnhaftigkeit und die Umsetzungsstrategien für den Verlag. Nach der Beratungsphase können Verlage leicht einschätzen, ob KI-Tools für die eigenen Strategien die erwartenden Nutzen bringen. Es gilt sich drei Fragen zu stellen:
Der Einsatz von KI in Ihrem Verlag
Gerade im Bereich der semantischen Technologien lohnt es sich für Verlage verstärkt über den Einsatz von KI nachzudenken. Bei semantischen Technologien werden Textbausteine einer Fragestellung ausgewertet, analysiert und maschinenverwertbar weitergegeben. Hier können KI-Systeme einen wertvollen Beitrag leisten.
Zum einen können Sie helfen bereitgestellten Content wie z.B. Bücher, Zeitschriften oder Artikel zu indexieren. Zum anderen können KI-Tools wie ChatGPT helfen, menschliche Fragestellungen maschinenverwertbar zu übersetzen. Dadurch ergeben sich für Verlage einige Einsatzmöglichkeiten wie z.B.:
KI Server für Verlagsprodukte
Das Problem: KI überfordert CPUs
Herkömmliche PC- und Serversysteme sind daher mit dem Produktivbetrieb nichttrivialer KI-Anwendungen überfordert. Das liegt hauptsächlich an den gängigen PC-Prozessoren (CPUs), die aufgrund ihrer Konstruktionsweise die für KI notwendigen Berechnungen nicht sehr effizient erledigen können.
Indexierung von Verlagsinhalten verlangt Rechenpower
KI-Anwendungen, die Verlagsinhalte verarbeiten (z.B. für Chatbot-Funktionen wie „Frag das Buch”), müssen diese Inhalte zuvor auf eine spezielle Art indexieren. Diese Indexierung ist extrem rechenaufwendig. Herkömmliche PCs oder Server benötigen bei größeren Inhaltsmengen, wie sie bei Fachverlagen üblich sind, mehrere Tage oder gar Wochen für eine vollständige Verarbeitung.
Die KI-Nutzung ist ebenfalls rechenintensiv
In kleinerem Umfang fallen solche Berechnungen auch in der KI-Funktion selbst an, z.B.
- zur Beantwortung von Fragen durch den Chatbot
- für dynamische Übersetzungen
- zur Nutzung von Text-to-Speech (TTS) und Speech-to-Text (STT)
- …
Die Lösung: Parallele KI-Berechnung mit GPUs
Massive parallele KI-Berechnungen lassen sich aktuell am effektivsten über KI-Systeme realisieren, die mit einem oder mehreren Grafikkarten bzw. Grafikprozessoren (GPUs) ausgestattet sind.
Vom Gaming zum KI-Einsatz
Zufälligerweise gibt es eine weit verbreitete Art von PC-Hardware, die Abhilfe schaffen kann. GPUs, die in der Vergangenheit hauptsächlich für Computerspiele verwendet wurden, müssen zur schnellen und flüssigen Abbildung hochauflösender Animationen ganz ähnliche Anforderungen erfüllen, wie sie auch bei KI-Anwendungen anfallen.
Höchste Effizienz für KI-Berechnungen
Deshalb sind GPUs auf massiv parallele Berechnungen ebenso optimiert wie auf Vektor- und Matrixberechnungen. Außerdem haben sie eine wesentlich größere Speicherbandbreite, können also viel schneller Daten zwischen den Recheneinheiten und dem Speicher austauschen.
Unser Ansatz: Doctronic KI-Server
Unsere bewährte Server-Infrastruktur, die zahlreiche Verlage bereits für den Betrieb ihrer Digitalprodukte nutzen, wird nun um leistungsstarke KI-Systeme ergänzt. So behalten unsere Kunden ihre Inhalte vollständig unter Kontrolle, während sie sicher für KI-Anwendungen verarbeitet werden.
Volle Kontrolle über Verlagsinhalte
Verlage sind besonders darauf bedacht, die Kontrolle über ihre Inhalte zu behalten und zu verhindern, dass ihre Inhalte ungewollt von Dritten verwertet werden. Das gilt nicht zuletzt für KI-Anbieter, die stets auf der Suche nach Futter für ihre Large Language Models (LLMs) sind.
Ein wichtige Bedingung für die KI-Projekte, die wir mit unseren Verlagskunden durchführen, ist daher regelmäßig, dass die Inhalte auf Systemen verarbeitet werden, die von uns allein verwaltet werden. Die Übertragung kompletter Inhaltsbestände zu OpenAI u.ä. ist unerwünscht.
KI-Hosting auf GPU-Servern in Deutschland
Für digitale Verlagsprodukte betreiben wir seit vielen Jahren eine Server-Infrastruktur, die von vielen unserer Kunden für ihre Onlineangebote genutzt wird.
Dabei handelt es sich um klassische Applikationsserver, auf denen meist Online-Fachinformationen mit unserer Xaver Publishing Platform laufen. Unser Angebot umfasst neben dem schieren Betrieb der Server auch die Serverwartung, d.h. die laufende Überwachung und Aktualisierung der Systeme.
Dieses Hosting-Angebot ergänzen wir nun um KI-geeignete GPU-Server, also Systeme, die mit Grafikprozessoren ausgestattet und damit für umfangreiche KI-Berechnungen optimiert sind.
Wir betreiben die KI-Server in einem Rechenzentrum in Deutschland. Dort mieten wir die Hardware. Für die Softwareinstallation ab Betriebssystem aufwärts sind allein wir verantwortlich, sonst hat niemand Zugriff auf die Server und ihre Inhalte.
Wie bei den Applikationsservern gliedern wir die laufenden Kosten in zwei Bereiche:
- Die Hosting-Gebühr für Bereitstellung, Betrieb, Netzwerkanbindung sowie laufende Datensicherung.
- Die Serverwartungs-Gebühr für die Überwachung des Betriebs und für die regelmäßige Aktualisierung (Betriebssystem und Softwaresysteme, mindestens einmal monatlich sowie kurzfristig bei akuten Sicherheitslücken o.ä.)
Die größte KI-Rechenlast entsteht in der Regel bei der Indexierung der Inhalte (Berechnung von Embeddings u.ä.). Umfang und Häufigkeit dieser Indexierungen sind projektabhängig. Wenn Inhalte häufig aktualisiert oder ergänzt werden, wird ein KI-Server durch das Projekt stärker ausgelastet als bei seltenen und eher kleineren Updates.
Deshalb bieten wir zwei Möglichkeiten, KI-Server für Verlagsprojekte zu nutzen.
Sie haben noch offene Fragen?
Doctronic berät Sie gerne über die Einsatzmöglichkeiten von KI in Ihrem Verlag.
Unser KI-Experte Holger Floerke steht Ihnen in einem persönlichen Gespräch Rede und Antwort.