Men

Language

Stephan Rose

Homines sumus nun dei

Eigenes eBook erstellen – Die Datenaufbereitung

Ob eBooks die Zukunft sind, sei einmal dahingestellt, doch das Potential, welches sich dahinter verbirgt scheint enorm. Besonders denke ich da an unsere Jüngsten, die mir morgendlich über den Weg laufen und aufgrund des Gepäcks, den Anschein eines Bergsteigers erwecken.

Etliche Entwicklungen auf dem Markt deuten an das, dass Schulbuch der Zukunft ein eBook sein könnte. Das schont die Umwelt, den Rücken die Geldbörse und die Haltbarkeit des Buches womit sich der Aufwand der Erstellung über Kurz oder Lang amortisieren wird.

Recherchen im Netz ergaben zahlreiche Lösungsansätze zur Erstellung aber leider auch viele Halbwahrheiten. Die besten Ergebnisse brachten engagierte Laien hervor, die kostenfrei die eigenen Erkenntnisse teilten. Ihnen, die den Geist des WWW leben, sei dieser Text gewidmet.

eBook vs PDF

Zahlreiche Verlage wie auch die Bundeszentrale für politische Bildung, glauben das Thema eBook mit einem PDF erledigt zu haben. Ich beglückwünsche jeden, der in Indesign, Word oder LibreOffice den Knopf „Als PDF speichern unter...“ gefunden hat, doch ein eBook ist es dann noch lange nicht.

Als häufigstes Argument für ein PDF wird die Möglichkeit des Layouts genannt, was wiederum lediglich auf Unverständnis sowie Unkenntnis fußt. Ein PDF schaltet die eigentlichen Vorteile des eBooks aus da weder der Text und die Bilder skaliert werden können noch der Zeilenabstand oder die Schriftart veränderbar sind.

Nun muss das eBook der Zukunft mehr sein als eine Textdatei, welche lediglich den Inhalt wiedergibt. Infografiken gehören genauso dazu wie Bilder und Illustrationen. Es hält sich hartnäckig die Meinung, dass es bei eBooks einzig um den Inhalt geht aber sie in der Optik immer einem gedruckten Buch oder einer PDF nachstehen.

Ist das so? Nein, denn das eBook ist eine verkappte Webseite und bietet fast alle Möglichkeiten wie der große Bruder auch. Die Zukunft der eBook-Reader ist auch nicht monochrom sonder wird Farbig und in der Auflösung brillanter. Durch die Etablierung von HTML 5, Smartphones, Tablets und eBook-Readern wird die Verbreitung sicherlich noch weiter voranschreiten und hoffentlich den Markt weiter erobern.

Adressaten dieses Tutorials

eBooks sind bereits in der Belletristik weit verbreitet und gewinnen zunehmend auch bei den Fachbüchern an Bedeutung.

Ausbaufähiges Potential sehe ich in:

So würde ich die Zielgruppe des Tutorials auf Dozenten, Mentoren, Ausbildern und Lehrkräfte sowie wissenschaftliche Mitarbeiter ohne Gestaltungs- oder Programmierkenntnisse eingrenzen wollen. Darüber hinaus können Literatur-Fans dazu beitragen, dass die Anzahl kostenfreier Literatur im WWW stetig zunimmt.

1. Benötigte Software

Es gibt viele Softwarelösungen, welche die Erstellung eines eBook ermöglichen. Dazu zählt auch der Platzhirsch des Layouts „Indesign“ der es ermöglicht aus einem gestalteten Printprodukt eine passable *.ebub Datei zu erzeugen. Bei der Erstellung eines eBooks kann jedoch gänzlich auf proprietäre Software verzichtet werden, da es für fast alles eine Open-Source Alternative gibt.

* Optional: Nur für Autoren mit Kenntnissen in der Vektorbearbeitung bzw. Nutzung von CSS

Je nachdem, wie umfangreich das eBook gestaltet werden soll, wird die genannte Software zum Einsatz kommen. So kann es sein, das bei dem Ein oder Anderen Projekt auf Inkscape und KompoZer verzichtet wird, da sie schlichtweg nicht benötigt werden oder die Kenntnisse zum effektiven Einsatz nicht vorhanden sind. Die verbliebenen Produkte sind jedoch für die erfolgreiche Umsetzung nahezu unverzichtbar.

2. Verfassen des Textes

Als Quelle von Text bieten sich verschiedene Möglichkeiten an. Gänzlich außer Acht, lasse ich die Debatte um das Urheberrecht, da ich davon ausgehe, dass gesunde Menschen ein normales Verständnis von Recht und Unrecht mitbringen. Gleichwohl ein Text im WWW frei abrufbar sein kann, bedeutet es nicht automatisch, dass er auch nach Guttenberg-Manier einfach weiterverwendet und als eigener ausgegeben wird. Nicht das eBook ist der Blattschuss für das gedruckte Buch, sondern die fehlende Kompetenz im Umgang mit dessen digitaler Version.

2.1 Text aus gedruckten Vorlagen

Die wohl schwierigste Form, welche im Zeit- und Korrekturaufwand am höchsten ist. Die einzelnen Seiten müssen in hoher Auflösung eingescannt werden. Fast alle Scanner und mittlerweile auch Kopierer bringen eine Texterkennung (Optical Character Recognition) bereits mit, welche es ermöglicht, Text aus einem Bild in editierbare Inhalte zu Übersetzen.

Ist eine solche Software nicht vorhanden kann, wie im folgenden Beispiel, FreeOCR (www.free-ocr.com) verwendet werden. Die Installation von FreeOCR ist nicht ganz selbstverständlich, doch sind die Hürden überwunden, erweist sich das Werkzeug als sehr nützlich. Beim installieren der Sprachen gibt es auch das Paket „Fraktur“, mit welchem ich jedoch nur mäßige Erfolge feiern konnte.

2.1.1 Scannen als Bild

Die Seiten müssen

digitalisiert und abgelegt werden.

Zum Digitalisieren muss die Scannersoftware genutzt werden, da die Bilder von FreeOCR ausgeschlossen werden. Diese werden jedoch benötigt um das Buch später mit den Originalen zu bebildern. Außerdem dient es als Referenz, da nach dem OCR, die Formatierung verloren geht. (Weiter mit 2.1.3 Texterkennung mit FreeOCR)

2.1.2 Scannen als PDF

Viele Kopierer und auch einige Scanner bieten die Digitalisierung mit anschließendem OCR an und speichern das Ergebnis als PDF (Portable Document Format) ab. Besonders, wenn die Möglichkeit besteht, einen ganzen Stapel Papier automatisch einzuziehen, ist das eine durchaus brauchbare Lösung. Für Bücher oder Dokumente in abweichenden Formaten ist es hingegen kontraproduktiv.

Liegt die benötigte Datei dennoch als PDF vor, muss zwischen PDF mit und ohne vorherigem OCR unterschieden werden.

Dokumente mit vorherigem OCR oder digital erzeugte PDF (ohne Schutz) erlauben es, den Text direkt auszuwählen und in eine andere Datei zu kopieren. PDF ohne vorheriges OCR haben diese Möglichkeit nicht weshalb die Software FreeOCR Abhilfe schaffen muss. Auch wenn die Vermutung nun nahe liegt, lässt sich „SO“ ein Kopierschutz der PDF nicht umgehen. (Weiter mit 2.1.3 Texterkennung mit FreeOCR)

2.1.3 Texterkennung mit FreeOCR

Vorausgesetzt es liegt eine Datei, ob als Bild oder PDF vor, ist der Weg zum editierbaren Text erschreckend schnell vollzogen.

1. FreeOCR öffnen

2. OCR Language auf „deu“ stellen

FreeOCR

3. Entweder Bild oder PDF über das passende Icon öffnen Im linken Bereich des Programms befindet sich das Quellfenster, auf der rechten Seite das Ergebnisfenster.

4. Bei mehreren Seiten (PDF) muss die Auswahl einzeln erfolgen

5. Das Icon OCR auswählen

FreeOCR

  1. Fensterinhalt löschen

  2. Text als *.txt speichern

  3. Zeilenumbrüche entfernen

  4. In Zwischenablage kopieren

  5. Nach Word exportieren
    Ist Word nicht vorhanden, wird ein alternatives Programm geöffnet, welches mit der Erweiterung *.doc assoziiert wird.

2.2 Text aus dem WWW

Ich stelle nicht die Frage nach der Rechtmäßigkeit, Texte aus dem WWW zu entnehmen und weiter zu verwenden. Es gibt viele Texte welche kostenlos verfügbar sind und ohne Probleme übernommen werden können. Das Ideale an Texten aus dem WWW ist, dass sie meist schon die notwendige Formatierung beinhalten.

Inhalte, wie die auf wikisource, können direkt per Copy and Paste in das eigene Office- Programm übernommen werden. Bilder sollten jedoch einzeln abgespeichert werden, da die Verknüpfung Bild mit Inhalt sonst auf eine externe URL verweist. Es empfiehlt sich, an die Stelle, wo das Bild später hin soll einen Textvermerk respektive eine Bildunterschrift zu machen.

2.3 Einbindung in Office

Zu beginn sträuben sich bei jedem, mit ästhetischem Anspruch die Nackenhaare, da die Optik noch längst nicht den Ansprüchen genügen wird. Die Texte, gleich welcher Quelle sie entstammen, müssen bereits in Kapitel geteilt werden um sie später voneinander unterscheiden zu können.

2.3.1 Grundlegende Formatierungen

Überschriften in eBooks entsprechen denen des HTML entnommen und leicht zuzuordnen.

<h1>Überschrift 1. Ordnung</h1>

<h2>Überschrift 2. Ordnung</h2>

<h3>Überschrift 3. Ordnung</h3>

<h4>Überschrift 4. Ordnung</h4>

<h5>Überschrift 5. Ordnung</h5>

<h6>Überschrift 6. Ordnung</h6>

Aus diesen entsteht später das Inhaltsverzeichnis des Buches, wobei der Aufbau und die Erstellung der Unterpunkte daraus generiert wird.

  1. <h1>Überschrift 1. Ordnung</h1>

  2. <h2>Überschrift 2. Ordnung</h2>

  3. <h3>Überschrift 3. Ordnung</h3>

  4. <h4>Überschrift 4. Ordnung</h4>

  5. <h5>Überschrift 5. Ordnung</h5>

  6. <h6>Überschrift 6. Ordnung</h6>

Hat ein Kapitel also mehrere Unterkapitel, werden die, mit größerer <hx> Zahl der kleineren zugeordnet.

  1. <h1>Überschrift 1 (1. Ordnung)</h1>

    1. <h2>Überschrift 1 (2. Ordnung)</h2>

    2. <h2>Überschrift 1 (2. Ordnung)</h2>

      1. <h3>Überschrift 1 (3. Ordnung)</h3>

  2. <h1>Überschrift 1 (1. Ordnung)</h1>

Wird in dem Aufbau eine der Größen ausgelassen, wird das Inhaltsverzeichnis trotzdem aufgebaut. Es empfiehlt sich jedoch die Kapitelüberschrift mit <h1> zu beginnen und dann schrittweise mit den kleineren Ordnungen fortzufahren. Kein Office-Programm hat <h1>, H2>, … so benannt, doch die Formatierung Überschrift 1, Überschrift 2,... entspricht dem genannten. Über diese Formatierung der Überschriften, wird später das Inhaltsverzeichnis des eBooks generiert.

2.3.2 Absätze und Formatierung

eBooks sind keine gedruckten Werke und die Anpassbarkeit steht vor dem Layout. Der Versuch ein gedrucktes Buch nach zu empfinden wird in der Regel nicht zum gewünschten Ergebnis führen. Der Inhalt muss also „Normalisiert“ und von überflüssigen Inhalten befreit werden.

Dazu zählen:

Absichtlich habe ich die Farbe hier nicht benannt. epub beruht auf HTML und Farben sind nicht das Problem sondern die darstellenden Geräte. Der Markt entwickelt sich aber so schnell, dass es gut möglich ist, dass es schon bald erschwingliche eBook-Reader in bunt gibt. Ist die Farbdarstellung nicht möglich, wird das Bild in Graustufen dargestellt.

2.3.3 Tabellen und Anstriche

Tabellen werden oft nicht richtig Dargestellt, da sie feste Breiten haben und die Flexibilität des eBook-Readers nicht gewährleisten können. Aus diesem Grund sollten sie später wieder eingefügt bzw. modifiziert werden. Anstriche werden unterschiedlich interpretiert. Bei einem OCR geht diese Formatierung verloren während sie beim kopieren von Webinhalten bestehen bleibt. Besser ist es, später die Formatierung nachzuholen.

2.3.4 Diagaramme

Wird in LibreOffice gearbeitet, können die Diagramme ideal aufgearbeitet werden. LibreOffice bietet nicht nur den „Writer“ und „Calc“ sondern auch das Zusatzprogramm „Draw“.

1. Es muss eine neue Zeichnung geöffnet werden

LibreOffice - Draw

2. Die in „Calc“ erstellte Grafik auswählen und in die Zwischenablage kopieren und in die Anwendung „Draw“ wechseln

LibreOffice - Calc

3. In „Draw“ die Grafik wieder aus der Zwischenablage einfügen und markiert lassen.

4. Unter „Datei > Exportieren“ den Harken bei „Selektion“ aktivieren und als Dateiformat „SVG“ wählen.

LibreOffice - SVG Export

5. Datei in einer logischen und nachvollziehbaren Benennung speichern. Bsp.: diagramm1_s01_1.svg für Diagramm 1 auf Seite 1

Siehe auch Beitrag: Excel Diagramme als Vektorgrafik

2.3.5 Zusammenfassung

Es liegt nun also ein digitaler Text mit formatierten Überschriften als Fließtext vor, der an entsprechenden Stellen bebildert ist. Viele der Formatierungen gehen später verloren, dennoch empfiehlt es sich eine „gesetzte“ Version als Vorlage zu nutzen, welche nicht zuletzt zu Referenzzwecken dienen wird.

3. Grafiken vorbereiten

Es liegen verschiedene Quellformate für die Bilder vor. Zum Ersten, aus den Scanns des Buches, zum Zweiten aus den erstellten Diagrammen und gegebenenfalls auch eigens erstellt Grafiken.

3.1 Bilder aus Scanns

Mobilgeräte erlauben unterschiedliche Auflösungen. So reicht diese von 72 ppi bis hin zu über 300 ppi. Je nach dem, wie wichtig Details im Bild sind, sollte die Einstellung sorgfältig gewählt werden. Hohe Auflösung bedeutete eine größere Datei und bei vielen Bildern kann das spätere epub immense Größen annehmen. So müssen die Bilder lediglich aus den Scanns beschnitten (ohne Buchtexte) und anschließend als JPG oder PNG abgespeichert werden.

3.2 SVG

SVG oder „skalierbare Vektorgrafiken“ ist eine Skript basierende Spezifikation zur Beschreibung zweidimensionaler Vektorgrafiken. Gleichgültig wie groß die Anzeige später sein wird, die Grafik wird keine Fragmente bilden (verpixeln) wodurch keine Auflösung wie bei „Bildern aus Scanns“ notwendig wird.

Wenn eigene Grafiken erstellt werden, kann hierfür neben den bereits genannten kostenfreien Lösungen wie LibreOffice - Draw und Inkscape auf proprietäre Software wie Adobe Illustrator oder Corel Draw verwendet werden.

3.3 Zusammenfassung

Es liegen nun alle Bilder einzeln zu den unterschiedlichen Seiten vor. Ob als Pixelbild wie JPG und PNG oder als Vektorgrafik (SVG). Im Office-Dokument sind bereits an den passenden Stellen, die Bilder eingebunden.

4. *.epub erstellen

Mit der vorab erwähnten LibreOffice-Erweiterung writer2epub, kann bereits jetzt eine Datei erzeugt werden, welche auf gängigen ebook-Readern lesbar ist. Das Ergebnis ist jedoch wenig überzeugend, sodass ich den Umweg über Sigil empfehle. Die „Quick and Dirty-Methode“ kann jedoch für eigene Mitschriften aus Seminaren und Kursen durchaus praktikabel sein.

Jedoch weiter mit Sigil. Sigil ist ein kostenfreier WYSIWYG eBook-Editor für epub-Dateien. In der aktuellen Version unterstützt er jedoch lediglich epub2. Auf Videos, Tondateien und HTML5 Elemente muss also vorerst verzichtet werden.

Wenn Sie es bis hierher geschafft haben, ist bereits der Großteil der Arbeit für ein eBook getan. Was fehlt ist die Umwandlung in epub, etwaige Schönheitskorrekturen mit CSS und die Definition der Inhalte.

An der Stelle endet das Tutorial „Eigenes eBook erstellen – Die Datenaufbereitung“, da Sigil ohnehin fast Selbsterklärend ist und es bereits hervorragende Unterlagen zu dessen Handhabung gibt. Aus dem Grunde verweise ich gern auf den „Sigil User Guide“ von Dave Heiland, der in leicht verständlichen „Schritt für Schritt“ Kapiteln beschreibt, wie die Vorlage den letzten Schliff bekommt.

Die Kurzversion ist:

Wenn Sie alles Richtig gemacht haben, wird bereits ein Inhaltsverzeichnis angelegt sodass nur noch Kleinigkeiten geändert werden müssen. Dieses Dokument beispielsweise, benötigt ca. 3 Minuten Aufwand um zu einem ansehnlichen eBook zu werden. - Der Aufwand ist also überschaubar.

Weiterführende Tutorials:

Programmübersicht

5. Fazit

Wie bei allen Dingen des Schaffens, kann auch das eBook bis zur Perfektion verändert und modifiziert werden. Scripte und Unterlagen, besonders für den Lehrzweck, lassen sich jedoch unkompliziert und schnell in ein eBook wandeln. So kann es enorm Zeit sparen, wenn in Mitschriften und Vorbereitungen bereits die entsprechenden Formatierung berücksichtigt wird. Wer Office bedienen kann, kann ein eBook erstellen.

Viel Erfolg!

6. Tricks

Bilder von Text umfließen lassen

Da ePub auf HTML beruht, lässt sich das umfließen leicht realisieren. Das Element was benötigt wird, ist „float“

Hierzu wird in der CSS-Datei eine zusätzliche Klasse angelegt

.bildlinks
{
float: left;
margin 10px;
}

An der Stelle im Dokument, wo nun das umfließende Bild benötigt wird, muss lediglich der img-Tag erweitert werden. <img src="/./bildname.png" width="100" height="100" class="bildlinks" />

Im Ergebnis, wird der Text das Bild rechts umfließen und einen Abstand von 10px ringsum halten. Gleiches funktioniert natürlich auch mit “float:right;”