Das Webinterface von BlogBooker.com
Habe gerade blogbooker.com entdeckt. Nach eigener Auskunft sollen hier LiveJournal‑, WordPress- und Blogger-Blogs in PDFs (oder bei Bedarf auch in gedruckte Bücher) umgewandelt werden. Klingt als Idee erstmal ganz gut – vollkommen überzeugt hat mich die Ausführung aber bisher noch nicht.
Um ein WordPress-Blog in ein Buch umzuwandeln, bedarf es zunächst einmal des sogenannten Export-Files – eine XML-Datei, die von der Seite Werkzeuge/Export im Administrationspanel erzeugt wird. Leider kommt WordPress mit Dateien > 3 MB schlecht klar. Abhilfe schafft Advanced Export, ein Plugin, das die Blog-Datenbank z.B. jahresweise exportieren kann. Die Dateien sind dann klein genug, dass der WordPress-Export (bei mir 2.8.x) nicht abbricht (was übrigens nicht durch eine Fehlermeldung signalisiert wird, sondern eine XML-Datei ergibt, die dann in Zeile 25015 oder so mit einem Fehler abbricht).
Wenn das XML-Export-File vorliegt, kann dieses in BlogBooker eingelesen werden. Dann noch die URL des Blogs eingeben, auf Start drücken, und etwa eine Minute (bei mir) warten. Fertig ist das PDF, das nun gespeichert werden kann.
Soweit funktioniert das ganz gut. Spannend finde ich vor allem, dass tatsächlich sämtliche Abbildungen im PDF enthalten sind – die stehen nämlich nicht im Export-File, sondern müssen extra aus dem Blog geladen werden. Was mir nicht gefällt, ist etwas anderes. Das ganze basiert auf TeX – und das ist dem entstehenden Buch auch anzusehen. Zum einen angesichts eines TeX-typischen und überhaupt nicht schönen Seitenumbruchs (Text – viel, viel Leeraum – Bild – viel, viel Leeraum – Text beispielsweise), zum anderen, weil die TeX-Standardschrift verwendet wird. Dabei gibt es extra eine ganze Reihe Buttons, die die Papiergröße, die Sprache, die Schriftart etc. festlegen sollen – die scheinen aber nicht unbedingt eine Wirkung zu haben – bei mir kam jedenfalls kein B5-Palatino-9pt-PDF raus, sondern eben das TeX-Standardmodell (mit untypografischen Anführungszeichen und Umlauten, die in Kursivschrift nicht kursiv gesetzt sind). Und wirklich guten automatischen Buchsatz scheint es auch noch nicht zu geben. Schade!
So sieht das Ergebnis aus – anklicken zum Vergrößern. Und auch im März 2008 gab es um diese Zeit einen Wintereinbruch, sehe ich gerade.
Die Idee gefällt mir jedoch gut – als eine Art zusätzliches Backup für das Blog, beispielsweise. Oder auch, um ein Gefühl dafür zu bekommen, was so ein Blog eigentlich bedeutet. Ich habe jetzt mal vier PDFs erstellt – eines für die Zeit bis 2006, und dann jeweils eines für 2007, 2008 und 2009. Die letzten drei sind um die 5 MB groß und umfassen jeweils 200–300 Seiten.
… dachte ich jedenfalls. Denn den Prozess für 2009 habe ich im Hintergrund gestartet – und der antwortet mit jetzt nicht mit einem schön abspeicherbaren PDF, sondern mit der lapidaren Fehlermeldung, dass es ein XML-Problem in der Datei gegeben habe, und dass ich das gefälligst in einem Texteditor korrigieren soll. Und um festzustellen, ob es Fehler gibt, und welche das sind, soll ich die – 2 MB große – XML-Datei einfach in einem Browser meiner Wahl öffnen. Da macht BlogBooker es sich für meinen Geschmack doch etwas zu einfach. Mir ist dabei jedenfalls der Browser abgestürzt. Wahrscheinlich wäre es hilfreicher, einen XML-Validator zur Hand zu nehmen. Aber das mache ich jetzt nicht.
Vorläufiges Fazit: so ganz funktioniert BlogBooker noch nicht. Der Ansatz aber ist sinnvoll – und um aus strukturiert vorliegenden XML-Dateien etwas anderes zu machen, gibt es viele, viele Möglichkeiten.
Warum blogge ich das? Als Erlebnisbericht. Bei der Gelegenheit: besteht Bedarf, die Archivbände zum Blog hochzuladen?
Habe es gerade selbst ausprobiert und es hat mich, in der Tat, nicht vom Hocker gerissen. Dafür aber La/TeX die Schuld zu geben, ist zu einfach. Du beschreibst selbst das zugrundeliegende Problem ein paar Sätze weiter unten:
… mit vielen Abbildungen sollte man noch ergänzen.
Ganz zu schweigen von der Tatsache, dass ein Textsatzsystem ein paar Hebel und Tasten hat, die auch bedient werden wollen – was BlogBooker nur halbherzig macht. Ich habe schon diverse Tabellenbände mit LaTeX gesetzt und es funktioniert – wenngleich nicht ‚out of the box‘. (Die Argumentation, mögliche Alternativsysteme heranzuziehen, erspare ich mir).
Das „TeX-Standardmodell“ heißt übrigens Computer Modern.
@Bernd – TeX gebe ich nur insoweit die Schuld, als BlogBooker, soweit ich dass sehe, letztlich das WordPress-XML so ziemlich 1:1 in TeX umsetzt. Und damit meine ich nicht nur Computer Modern, sondern z.B. auch den Knuthschen Umgang mit Leerräumen oder die akademischen Überschriften. Automatischer Satz ist nicht trivial, aber eine etwas weniger nach Informatik-Fachbuch aussehende Umsetzung ist möglich – auch mit TeX, aber nicht ohne spezialisierte Vorlage. Die fehlt mir hier.