2.1 Hintergrund

2 Workflow

2.1 Hintergrund

Obwohl die Herstellung eigener Publikationen offenbar nicht zu den Kernkompetenzen deutscher Publikumsverlage gehört, organisieren diese die gesamte Produktion der Verlagserzeugnisse traditionell in eigenen Herstellungsabteilungen, die sich entsprechend auch für die Herstellung der E-Books verantwortlich zeichnen. Dort haben gedruckte Bücher jedoch nach wie vor Priorität vor E-Books, immerhin lag dessen Umsatzanteil im ersten Halbjahr 2016 im Publikumsmarkt in Deutschland bei lediglich 5,4%.1 Unter diesen Umständen erfolgt die Herstellung des Buches auch zeitlich vor der Herstellung des E-Books. Der lektorierte Inhalt wird zunächst mit einem Satz- und Layoutprogramm für den Druck gesetzt, nochmals überprüft und final korrigiert. Nach Abschluss des Packaging gelangen die vorbereiteten Daten an die Druckerei und werden anschließend am Beginn der E-Book-Herstellung in die Auszeichnungssprache Extensible Markup Language (XML) oder direkt in ein E-Book-Format konvertiert.

Der hier beschriebene Prozessablauf, in denen der E-Book-Workflow erst nach Abschluss des Print-Workflows beginnt und entsprechend von diesem abhängig ist, wird aufgrund der XML-Konvertierung nach dem Satz für die gedruckte Version auch als XML last-Prozess bezeichnet. Die E-Book-Herstellung folgt in diesem Fall einfach auf den etablierten Printprozess und wird mit den ohnehin verwendeten Programmen bewältigt. Dabei ist theoretisch kein zusätzliches Format, wie beispielsweise XML, nötig, weil der Inhalt auch direkt in ein E-Book-Format exportiert werden kann. Auf der Grundlage des printbasierten Datenbestandes kann die Herstellung digitaler Formate zudem an Dienstleister ausgelagert werden. Dieser zunächst vorteilhafte, weil einfache Prozessablauf ist selbstverständlich nur möglich, sofern der Inhalt von Buch und E-Book identisch ist. Laut Umfrage werden 84% der Buchveröffentlichungen auch als E-Book publiziert – in den allermeisten Fällen scheint die Voraussetzung identischer Inhalte also erfüllt.

2.1.1 Extensible Markup Language (XML)

Die Extensible Markup Language (XML) ist eine Auszeichnungssprache, mit der hierarchisch organisierte Daten strukturiert dargestellt und unabhängig von spezifischen Formatierungsinformationen gespeichert werden können. Die Struktur des XML-Dokuments ist offen und wird individuell definiert. Beispielsweise gibt es keine Vorgaben für die Vergabe von Element- oder Attributnamen wie in anderen Auszeichnungssprachen.2

<zitatesammlung>

    <titel>Zitate</titel>

    <zitat autor="Lothar Emmerich">
        <text>Gib mich die Kirsche!</text>
    </zitat>

    <zitat autor="Lukas Podolski">
        <text>Fußball ist wie Schach – nur ohne Würfel!</text>
    </zitat>

    <zitat autor="Alfred Preißler">
        <text>Grau is alle Theorie – entscheidend is auf’m Platz.</text>
    </zitat>

</zitatesammlung>

Eine XML-Datei enthält immer ein Wurzelelement, das – wie alle XML-Elemente – mit einer Spitzklammernotation beginnt und endet: In dem erwähnten Beispiel ist es <zitatesammlung>. Ein Element kann Text oder weitere Elemente enthalten und beginnt immer mit einem Starttag (<zitat>) beziehungsweise endet mit einem Endtag (</zitat>). Einem Element können Attribute mit bestimmten Eigenschaften zugeteilt werden: Im Beispiel ist es das Attribut autor, dem im ersten Zitat der Name des Autors ("Lothar Emmerich") zugewiesen wird. Ein Attribut darf innerhalb eines Elements lediglich mit einer Eigenschaft versehen werden. Erfüllt ein XML-Dokument diese Kriterien, wird es auch als wohlgeformt bezeichnet. Ein solches Kriterium kann beispielsweise die obligatorische Verwendung definierter Attributnamen und Metadaten oder die Angabe eines Kapiteltitels innerhalb eines Kapitels sein, um sicherzustellen, dass jedes Kapitel mit einer eigenen Überschrift versehen ist.3

Im Zusammenhang mit XML kommen standardisierte Schlüsseltechnologien zum Einsatz, die den Funktionsumfang der Auszeichnungssprache erweitern und sie als Format für Inhalte grundsätzlich prädestinieren. Einige Erweiterungen sind, insbesondere für die kommerzielle Verbreitung von E-Books, durch Verlage obligatorisch.

  • Um unterschiedliche Vokabulare in einer Datei zu vermeiden, ist eine Trennung der Namensräume notwendig. Sie kann sowohl für ein Dokument als auch für einzelne Elemente mithilfe von XML-Namespaces angewandt werden.
  • Für jedes bekannte Schriftzeichen der Welt ist ein Code verfügbar, der nach dem internationalen Standard Unicode definiert und für die Darstellung fremder Schriftkulturen und Zeichensysteme, insbesondere bei mehrsprachigen Titeln, unerlässlich ist.
  • Die Multipurpose Internet Mail Extensions (MIME Media Type) ist eine Kodierungskonvention, die Informationen über angehängte Dateiformate und die zum Öffnen nötigen Programme bereithält.
  • Die Standardisierung der Metadaten regelt das Dublin Core Metadata Element Set, zu dem 15 Kernfelder gehören, wie beispielsweise der Titel, der Autor und der Verlag.
  • Die Extensible HyperText Markup Language (XHTML) kombiniert HTML mit XML-Syntax: Die XHTML-Daten können daher innerhalb eines XML-Prozesses bearbeitet und gespeichert werden – die Voraussetzung für die Verwendung von XHTML in EPUB. Außerdem werden die Cascading Style Sheets (CSS) unterstützt.
  • Mit den Web Content Accessibility Guidelines (WCAG) definiert das World Wide Web Consortium (W3C) Richtlinien für barrierefreie Webinhalte, die in XML übernommen wurden.

Mithilfe einer spezifischen Strukturgrammatik können entgegen der Freiheit hinsichtlich der Vergabe von Element- oder Attributnamen dennoch Regeln zum Editieren festgelegt werden, um die Datei und seinen Inhalt anschließend auf ihre Validität nach individuellen Kriterien zu überprüfen. Diese strukturellen Einschränkungen sind mithilfe verschiedener Standards fixiert, beispielsweise der Document Type Definition (DTD), der XML Schema Definition (XSD) oder dem Regular Language Description for XML New Generation (RELAX NG). Eine Strukturgrammatik kann um publikations- oder verlagsspezifische Vorgaben, sogenannte Spezifikationen, individuell erweitert werden.4

2.1.2 Medienneutrale Produktion

Sowohl das Buch als auch das E-Book basieren laut Umfrage in den meisten Fällen auf demselben Datenbestand. Um die Abhängigkeit der Prozessabläufe voneinander aufzuheben und die parallele Herstellung verschiedener Formate zu arrangieren, ist eine Fusion der Workflows – sofern möglich – geradezu naheliegend. Dabei erfolgt die Herstellung solange unabhängig von der späteren Publikationsform, bis eine Trennung im Hinblick auf das jeweilige Vertriebsmedium unvermeidbar ist. Dieser Workflow wird daher auch als medienneutrale Produktion bezeichnet oder als XML first-Workflow.5 Die Auszeichnungssprache XML eignet sich hierfür ebenfalls als gemeinsame Datengrundlage: Zunächst prädestiniert die eindeutige Regelhaftigkeit das Format für eine spätere Bearbeitung und Weiterentwicklung nach individuellen Kriterien und verlagsinternen Anforderungen. Ihre Struktur ist zudem einfach und klar und ermöglicht die spätere Transformation in verschiedene Anwendungen sowohl zur Herstellung von Print- als auch digitalen Publikationen. Eine auf XML basierende medienneutrale Produktion umfasst drei Phasen:

„1. Die Phase der Manuskripterstellung: Redakteur oder Autor schreiben ein Manuskript; am Ende dieser Phase liegt das vollständige und fertige Manuskript vor.

2. Die Umsetzungs- und Korrekturphase: Das Manuskript wurde technisch umgesetzt und liegt als Papierabzug oder als Prototyp des elektronischen Produktes vor; auf dieser Basis wird nun wieder vom Redakteur oder Autor korrigiert. Am Ende dieser Phase ist der der Publikation zugrunde liegende digitale Datenbestand auskorrigiert und publikationsreif.

3. Die Produktionsphase: Aus dem geprüften und freigegebenen Datenbestand wird gedruckt bzw. das elektronische Produkt erzeugt, das nun ausgeliefert werden kann.“6

Die erste Phase der Manuskripterstellung muss näher erläutert werden: Die Vollständigkeit des Textes meint in diesem Fall auch die semantische Markierung des Inhalts, die strukturelle Unterscheidung verschiedener Textelemente, beispielsweise eine <h1>Überschrift ersten Grades</h1>, einen <p>Absatz</p> oder ein <del>durchgestrichenes Element</del>. Im Idealfall nimmt der Autor diese Markierungen während der Textproduktion selbst vor – immerhin können semantische Entscheidungen als künstlerische Eingriffe nur von ihm selbst getroffen werden. Ein Text, der mithilfe eines Schreibprogramms semantisch strukturiert wurde, kann unter bestimmten Voraussetzungen in ein medienneutrales Format konvertiert werden. Die Umsetzungs- und Korrekturphase erfolgt anschließend auf der Grundlage eines automatisch erstellten Grobumbruchs, entweder ausgedruckt oder digital. Der Autor oder das Lektorat nehmen Korrekturen am Inhalt vor, allerdings müssen diese bis zur Trennung der Prozessabläufe, dem Punkt X, vollständig und final eingepflegt sein: Der so generierte Inhalt dient schließlich als zentraler Datenbestand beider Publikationsmedien. Er muss ab diesem Zeitpunkt also unangetastet, gewissermaßen fixiert bleiben, damit er identisch in unterschiedlichen Formen existiert – entweder im Buch oder im E-Book. Etwaige Korrekturen am medienspezifischen Format müssen in einem zusätzlichen Prozess aufwendig zurück in die Datengrundlage übertragen werden, andernfalls entstehen inhaltliche Variationen.7

Die Vorteile einer medienneutralen Produktion liegen vor allem in den verkürzten Prozessabläufen, da die Herstellung der publizierten Formate strukturell nicht nacheinander sondern nebeneinander erfolgt. Angewandt auf eine große Anzahl von Publikationen ergeben sich – unter Berücksichtigung der eben erwähnten Voraussetzungen – theoretisch weitere, gravierende Vorteile für die gesamte Verlagsproduktion hinsichtlich der Datenqualität, der Handlungskompetenzen, der Automatisierung und der Geschwindigkeit.

  • Mithilfe der XML-Strukturgrammatik werden Produktionsmängel frühzeitig erkannt und nachträgliche, medienspezifische Korrekturprozesse vermieden. Alle Publikationsformen eines Inhalts basieren in der medienneutralen Produktion auf einem zentralen Datenbestand, der die entsprechenden Metadaten enthält, strukturiert verwaltet werden kann und durchsuchbar ist. Im Idealfall besitzt der Verlag dazu ein Varianten- und Versionsmanagement, um außerdem die Bereitstellung der jeweils aktuellen Version zu garantieren: Content-Management-Systeme mit zentraler, XML-basierter Datenhaltung werden so überlebenswichtig für den Verleger8. Zudem vereinfacht die hohe Datenqualität die Nachbearbeitung des Inhalts im Hinblick auf etwaige Drittverwertungen und spätere Neuauflagen.
  • Die Voraussetzung für einen XML first-Workflow ist die Vermeidung späterer Korrekturschleifen während des Herstellungsprozesses. Die einzelnen Arbeitsprozesse, insbesondere die Produktion des Inhalts und die Herstellung der Form, werden anhand konkreter Handlungskompetenzen deutlich voneinander getrennt. Das verhindert das spätere Eingreifen des Lektorats in den Herstellungsprozess und dort wiederum doppelte Arbeitsschritte. Insgesamt entsteht eine klare Kompetenz- und Ablaufstruktur im gesamten Produktionsprozess.
  • Eine medienneutrale Produktion ermöglicht einen nahezu automatisierten Prozessablauf gewissermaßen auf Knopfdruck in beide Publikationsrichtungen mithilfe spezieller XML-fähiger Satzprogramme und eines – möglicherweise in das CMS integrierten – Editors. XML als Datengrundlage und einheitlich definierte Layoutvorgaben für die späteren Produkte vereinfachen die Automatisierung der Workflows, zudem sind sie leichter zu kontrollieren. Die Herstellungsabteilung kann beide Workflows unabhängig voneinander optimieren ohne Sorge vor späteren Eingriffen in den zentralen Datenbestand. Das schont Ressourcen finanzieller sowie personeller Natur.
  • Aus den vorangegangenen Optimierungen resultieren Prozessabläufe, die die Produktionszeiten minimieren und einen zeitgleichen Veröffentlichungstermin beider Publikationsformen ermöglichen. Außerdem bietet die medienneutrale Produktion hinsichtlich ihrer Geschwindigkeit in Kombination mit POD-Prozessen einen zeitnahen Zugang zu vergriffenen Titeln der Backlist auch in gedruckter Form.9

Das grundsätzliche Hindernis der Etablierung eines XML first-Workflows liegt in der Umstellung der für den Druck optimierten Prozessabläufe auf eine medienneutrale Produktion. Sie involviert mehrere Abteilungen, betrifft die Produktion aller Publikationen und findet zum Großteil an einer äußerst sensiblen Stelle der verlegerischen Aktivität statt – dem Lektorat. Die Umstrukturierung erfolgt nicht nur auf technischer Ebene sondern sieht auch organisatorische Modifikationen vor, ohne dabei direkt erkennbare, kurzfristige Verbesserungen für die derzeit priorisierte Buchproduktion zu erzwingen. Außerdem ist der betriebene Aufwand einer strukturellen Veränderung enorm: Eine solch weitreichende Umstrukturierung dauert lange und bedarf erheblicher Anstrengungen. Damit sich die Investitionen auf finanzieller Ebene lohnen und schnell amortisieren, muss eine kritische Masse von Produktionen10 vorhanden sein, die sich allerdings nur schwer konkret beziffern lässt, weil sie von der Komplexität der veröffentlichten Publikationen, ihrer Anzahl und ihres Umfangs, sowie den bisher etablierten Prozessabläufen abhängt.


  1. Börsenverein des Deutschen Buchhandels 2016: Umsatzanteil von E-Books im Publikumsmarkt in Deutschland in den Jahren 2010 bis 2016. https://de.statista.com/statistik/daten/studie/303339/umfrage/umsatzanteil-von-e-books-im-buchmarkt/ ↩︎
  2. Vgl. Hagenhoff: Produktpflege. Seite 230. ↩︎
  3. Vgl. Wang: E-Books mit EPUB. Seite 92ff. ↩︎
  4. Vgl. Wang: E-Books mit EPUB. Seite 94. ↩︎
  5. Vgl. Schneider: Buchdruck. Seite 72. ↩︎
  6. Wang: E-Books mit EPUB. Seite 29. ↩︎
  7. Vgl. Hagenhoff: Produktpflege. Seite 232. ↩︎
  8. Hagenhoff: Produktpflege. Seite 234. ↩︎
  9. Vgl. Wang: E-Books mit EPUB. Seite 31. ↩︎
  10. Wang: E-Books mit EPUB. Seite 29. ↩︎

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.