Künstliche Intelligenz für Verlage

Zwischen Heilsversprechen und Existenzbedrohung

Die KI-Revolution ändert alles. Nichts bleibt, wie es war und niemand kommt dran vorbei. Das ist die Botschaft der Hypemaschine, die seit geraumer Zeit sämtliche Gesellschafts- und Wirtschaftszweige beschallt. Dem kann sich auch die Verlagsbranche nicht entziehen. Dabei ist das Verhältnis der Verlage zur generativen KI – dem Gegenstand des Hypes – zwangsweise zwiespältig.

Sind doch Verlage als hauptamtliche Inhaltsproduzenten einerseits potentielle KI-Anwender (KI erzeugt Inhalte für den Verlag), andererseits potentielle KI-Opfer (KI erzeugt Inhalte anstelle des Verlags). Entsprechend intensiv setzt sich die Branche mit dem Thema auseinander.

Gute Frage, wahrscheinlich gute Antwort

Für Fachverlage ist der Einbau von KI-Chatbots in ihre digitalen Fachinformationsprodukte eine naheliegende Idee. An die Stelle technisch anmutender Suchmasken und Trefferlisten tritt der natürlichsprachige Dialog – Mensch fragt, Maschine antwortet. Ein Traum wird wahr.

Rein technisch ist das, der KI-Revolution sei Dank, nur noch eine Fingerübung. Aber sind die Antworten des Chatbots gut genug, dass sie ein Fachverlag guten Gewissens unter seiner Marke präsentieren kann?

Wer sich schon einmal mit ChatGTP & Co. etwas intensiver über ein vertrautes Thema unterhalten hat, weiß, dass die Maschine gelegentlich im Brustton der Überzeugung gröbsten Unfug behauptet. Druckreif formuliert, aber doch nur eloquent gelogen.

Diese Unzuverlässigkeit ist systemimmanent, denn jede Antwort von ChatGTP & Co. ist das Ergebnis einer extrem aufwendigen Wahrscheinlichkeitsrechnung, eine stochastisch erzeugten Reihe von Buchstaben und Satzzeichen, die mit höchstmöglicher Wahrscheinlichkeit eine korrekte Antwort auf die gestellte Frage sein dürfte. Das klappt meistens verblüffend gut, geht aber manchmal völlig daneben. Normalerweise ist das nicht der Qualitätsanspruch, den ein Fachverlag an seine Autoren stellt.

Die Gretchenfrage zum Einsatz von KI in Fachverlagsprodukten lautet daher nicht: „Geht das?“

Die Frage ist: „Geht das gut genug?“

Qualität herausarbeiten

Wenn wir Ihnen KI-Technologien für Ihr Verlagsprodukt bereitstellen, ist das nur der Anfang eines Projekts, das allein der Qualität der Ergebnisse gewidmet ist. Wir beziehen Ihre ExpertInnen aus Redaktion, Lektorat, Autoren- und Kundschaft ein, um mit ihrem Feedback die KI zu kalibrieren, bis Sie sie guten Gewissens auf Ihre Kundschaft loslassen können.

Das gilt für KI Chatbots in digitalen Publikationen ebenso wie für andere Anwendungen, in denen KI in Ihrem Auftrag Inhalte zur Veröffentlichung produzieren soll.

Klingt aufwendig?

Ist es auch.

Geht aber nicht anders.

Eine gute fachspezifische KI fällt nicht vom Himmel, sie muss gemacht werden. Wir helfen Ihnen dabei. Sprechen Sie uns an.

Wie viel KI benötigt Ihr Verlag wirklich?

Um dies zu beantworten erarbeiten wir gemeinsam die Einsatzmöglichkeiten von KI-Tools, deren Sinnhaftigkeit und die Umsetzungsstrategien für den Verlag. Nach der Beratungsphase können Verlage leicht einschätzen, ob KI-Tools für die eigenen Strategien die erwartenden Nutzen bringen. Es gilt sich drei Fragen zu stellen:

Wie lässt sich das KI-Tool einbinden?

Durch eine Integrationsanalyse findet eine Bewertung der technischen Kompatibilität, der Datenformate, der Sicherheitsaspekte sowie der Performance und Skalierbarkeit der Schnittstellen statt.

Welche Aufgaben kann das KI-Tool lösen?

Doctronic untersucht die verschiedenen Anwendungsfälle und Aufgaben innerhalb des Verlages, um festzustellen, in welchen Bereichen der Einsatz von KI sinnvoll ist.

Wie gut kann das KI-Tool die Aufgabe lösen?

Eine KI-Evaluierung zeigt die Leistungsfähigkeit der KI-Tools anhand verschiedener Kriterien wie Genauigkeit, Effizienz, Zuverlässigkeit und Robustheit.

Der Einsatz von KI in Ihrem Verlag

Gerade im Bereich der semantischen Technologien lohnt es sich für Verlage verstärkt über den Einsatz von KI nachzudenken. Bei semantischen Technologien werden Textbausteine einer Fragestellung ausgewertet, analysiert und maschinenverwertbar weitergegeben. Hier können KI-Systeme einen wertvollen Beitrag leisten.

Zum einen können Sie helfen bereitgestellten Content wie z.B. Bücher, Zeitschriften oder Artikel zu indexieren. Zum anderen können KI-Tools wie ChatGPT helfen, menschliche Fragestellungen maschinenverwertbar zu übersetzen. Dadurch ergeben sich für Verlage einige Einsatzmöglichkeiten wie z.B.:

Frau steht in einer Bibliothek vor Bücherregalen und hält ein Tablet, auf dem digitale Inhalte angezeigt werden

Zusammenfassungen und Abstracts von Publikationen erstellen

  • Sorgen Sie für eine konsistente und objektive Darstellung der Buchinhalte, frei von subjektiven Meinungen.
  • Steigern sie Aufrufe und Nutzung Ihrer Bücher, indem sie in Übersichten wichtige Informationen hervorheben, die sonst übersehen werden könnten.
  • Bieten Sie Bibliotheken einen Mehrwert durch erweiterte Metadaten.
Frau sitzt in einem Computerraum vor einem Bildschirm, während andere Personen im Hintergrund ebenfalls an Computern arbeiten

Antworten auf Basis des Publikationsportfolios generieren

  • Ermöglichen Sie durch die präzise Indexierung den schnellen Zugriff auf hochspezialisierte Informationen.
  • Steigern Sie die Effizienz bei der Recherche und dem Studium erheblich.
  • Bieten Sie auf viele Publikationen gleichzeitig zugreifen und relevante Informationen zu verknüpfen zu können, um eine umfassendere und tiefere Einsicht in komplexe Themengebiete zu ermöglichen.
Person in einer Bibliothek hält ein Smartphone mit einer App geöffnet, umgeben von aufgeschlagenen Büchern auf einem Tisch.

Lernerfolgstestfragen auf Basis der Publikationsinhalte entwickeln

  • Erstellen Sie einfach eine Liste von Testfragen für eLearning-Plattformen wie kwaest.io.
  • Reduzieren Sie den Aufwand auf Autorenseite auf das Redigieren der Testfragenliste.
  • Erhöhen Sie die Nutzungsdauer/-häufigkeit der Publikationen.
Frau steht in einer Bibliothek vor Bücherregalen und hält ein Tablet, auf dem digitale Inhalte angezeigt werden

Zusammenfassungen und Abstracts von Publikationen erstellen

  • Sorgen Sie für eine konsistente und objektive Darstellung der Buchinhalte, frei von subjektiven Meinungen.
  • Steigern sie Aufrufe und Nutzung Ihrer Bücher, indem sie in Übersichten wichtige Informationen hervorheben, die sonst übersehen werden könnten.
  • Bieten Sie Bibliotheken einen Mehrwert durch erweiterte Metadaten.
Frau sitzt in einem Computerraum vor einem Bildschirm, während andere Personen im Hintergrund ebenfalls an Computern arbeiten

Antworten auf Basis des Publikationsportfolios generieren

  • Ermöglichen Sie durch die präzise Indexierung den schnellen Zugriff auf hochspezialisierte Informationen.
  • Steigern Sie die Effizienz bei der Recherche und dem Studium erheblich.
  • Bieten Sie auf viele Publikationen gleichzeitig zugreifen und relevante Informationen zu verknüpfen zu können, um eine umfassendere und tiefere Einsicht in komplexe Themengebiete zu ermöglichen.
Person in einer Bibliothek hält ein Smartphone mit einer App geöffnet, umgeben von aufgeschlagenen Büchern auf einem Tisch.

Lernerfolgstestfragen auf Basis der Publikationsinhalte entwickeln

  • Erstellen Sie einfach eine Liste von Testfragen für eLearning-Plattformen wie kwaest.io.
  • Reduzieren Sie den Aufwand auf Autorenseite auf das Redigieren der Testfragenliste.
  • Erhöhen Sie die Nutzungsdauer/-häufigkeit der Publikationen.

KI Server für Verlagsprodukte

Eine überhitzende CPU

Das Problem: KI überfordert CPUs

Eine überhitzende CPU

Herkömmliche PC- und Serversysteme sind daher mit dem Produktivbetrieb nichttrivialer KI-Anwendungen überfordert. Das liegt hauptsächlich an den gängigen PC-Prozessoren (CPUs), die aufgrund ihrer Konstruktionsweise die für KI notwendigen Berechnungen nicht sehr effizient erledigen können.

Indexierung von Verlagsinhalten verlangt Rechenpower

KI-Anwendungen, die Verlagsinhalte verarbeiten (z.B. für Chatbot-Funktionen wie „Frag das Buch”), müssen diese Inhalte zuvor auf eine spezielle Art indexieren. Diese Indexierung ist extrem rechenaufwendig. Herkömmliche PCs oder Server benötigen bei größeren Inhaltsmengen, wie sie bei Fachverlagen üblich sind, mehrere Tage oder gar Wochen für eine vollständige Verarbeitung.

Die KI-Nutzung ist ebenfalls rechenintensiv

In kleinerem Umfang fallen solche Berechnungen auch in der KI-Funktion selbst an, z.B.

  • zur Beantwortung von Fragen durch den Chatbot
  • für dynamische Übersetzungen
  • zur Nutzung von Text-to-Speech (TTS) und Speech-to-Text (STT)
Eine Reihe von GPUs

Die Lösung: Parallele KI-Berechnung mit GPUs

Eine Reihe von GPUs

Massive parallele KI-Berechnungen lassen sich aktuell am effektivsten über KI-Systeme realisieren, die mit einem oder mehreren Grafikkarten bzw. Grafikprozessoren (GPUs) ausgestattet sind.

Vom Gaming zum KI-Einsatz

Zufälligerweise gibt es eine weit verbreitete Art von PC-Hardware, die Abhilfe schaffen kann. GPUs, die in der Vergangenheit hauptsächlich für Computerspiele verwendet wurden, müssen zur schnellen und flüssigen Abbildung hochauflösender Animationen ganz ähnliche Anforderungen erfüllen, wie sie auch bei KI-Anwendungen anfallen.

Höchste Effizienz für KI-Berechnungen

Deshalb sind GPUs auf massiv parallele Berechnungen ebenso optimiert wie auf Vektor- und Matrixberechnungen. Außerdem haben sie eine wesentlich größere Speicherbandbreite, können also viel schneller Daten zwischen den Recheneinheiten und dem Speicher austauschen.

Ein Doctronic-Logo in der Mitte vor einer symbolischen Datenwolke

Unser Ansatz: Doctronic KI-Server

Ein Doctronic-Logo in der Mitte vor einer symbolischen Datenwolke

Unsere bewährte Server-Infrastruktur, die zahlreiche Verlage bereits für den Betrieb ihrer Digitalprodukte nutzen, wird nun um leistungsstarke KI-Systeme ergänzt. So behalten unsere Kunden ihre Inhalte vollständig unter Kontrolle, während sie sicher für KI-Anwendungen verarbeitet werden.

Volle Kontrolle über Verlagsinhalte

Verlage sind besonders darauf bedacht, die Kontrolle über ihre Inhalte zu behalten und zu verhindern, dass ihre Inhalte ungewollt von Dritten verwertet werden. Das gilt nicht zuletzt für KI-Anbieter, die stets auf der Suche nach Futter für ihre Large Language Models (LLMs) sind.

Ein wichtige Bedingung für die KI-Projekte, die wir mit unseren Verlagskunden durchführen, ist daher regelmäßig, dass die Inhalte auf Systemen verarbeitet werden, die von uns allein verwaltet werden. Die Übertragung kompletter Inhaltsbestände zu OpenAI u.ä. ist unerwünscht.

KI-Hosting auf GPU-Servern in Deutschland

Für digitale Verlagsprodukte betreiben wir seit vielen Jahren eine Server-Infrastruktur, die von vielen unserer Kunden für ihre Onlineangebote genutzt wird.

Dabei handelt es sich um klassische Applikationsserver, auf denen meist Online-Fachinformationen mit unserer Xaver Publishing Platform laufen. Unser Angebot umfasst neben dem schieren Betrieb der Server auch die Serverwartung, d.h. die laufende Überwachung und Aktualisierung der Systeme.

Dieses Hosting-Angebot ergänzen wir nun um KI-geeignete GPU-Server, also Systeme, die mit Grafikprozessoren ausgestattet und damit für umfangreiche KI-Berechnungen optimiert sind.

Wir betreiben die KI-Server in einem Rechenzentrum in Deutschland. Dort mieten wir die Hardware. Für die Softwareinstallation ab Betriebssystem aufwärts sind allein wir verantwortlich, sonst hat niemand Zugriff auf die Server und ihre Inhalte.

Wie bei den Applikationsservern gliedern wir die laufenden Kosten in zwei Bereiche:

  1. Die Hosting-Gebühr für Bereitstellung, Betrieb, Netzwerkanbindung sowie laufende Datensicherung.
  2. Die Serverwartungs-Gebühr für die Überwachung des Betriebs und für die regelmäßige Aktualisierung (Betriebssystem und Softwaresysteme, mindestens einmal monatlich sowie kurzfristig bei akuten Sicherheitslücken o.ä.)

Die größte KI-Rechenlast entsteht in der Regel bei der Indexierung der Inhalte (Berechnung von Embeddings u.ä.). Umfang und Häufigkeit dieser Indexierungen sind projektabhängig. Wenn Inhalte häufig aktualisiert oder ergänzt werden, wird ein KI-Server durch das Projekt stärker ausgelastet als bei seltenen und eher kleineren Updates.

Deshalb bieten wir zwei Möglichkeiten, KI-Server für Verlagsprojekte zu nutzen.

Economy-Server

Den Economy-Server nutzen wir für die Projekte mehrerer Verlage, die sich eine Hardware teilen. Dabei stellen wir sicher, dass die Software und vor allem die Daten strikt getrennt bleiben. Außerdem achten wir darauf, dass sich die Anwendungen bei der Nutzung der Ressourcen nicht gegenseitig behindern. Der Economy-Server eignet sich für Projekte, die nur gelegentlich KI-Rechenleistung benötigten.

Exclusive-Server

Der Exclusive-Server steht dem Verlag für sein(e) Projekt(e) ganz zur Verfügung. Darauf werden nur die Lösungen dieses Verlags betrieben, die Hardware wird für nichts anderes genutzt.

Sie haben noch offene Fragen?

Doctronic berät Sie gerne über die Einsatzmöglichkeiten von KI in Ihrem Verlag.
Unser KI-Experte Holger Floerke steht Ihnen in einem persönlichen Gespräch Rede und Antwort.

Holger Flörke als Redner vor einer Präsentation

Holger Flörke
Geschäftsführer

Holger Flörke als Redner vor einer Präsentation

Holger Flörke
Geschäftsführer

Nach oben scrollen