Blog ins Book – wie geht das?

screenshot-blogbooker
Das Web­in­ter­face von BlogBooker.com

Habe gera­de blogbooker.com ent­deckt. Nach eige­ner Aus­kunft sol­len hier LiveJournal‑, Word­Press- und Blog­ger-Blogs in PDFs (oder bei Bedarf auch in gedruck­te Bücher) umge­wan­delt wer­den. Klingt als Idee erst­mal ganz gut – voll­kom­men über­zeugt hat mich die Aus­füh­rung aber bis­her noch nicht.

Um ein Word­Press-Blog in ein Buch umzu­wan­deln, bedarf es zunächst ein­mal des soge­nann­ten Export-Files – eine XML-Datei, die von der Sei­te Werkzeuge/Export im Admi­nis­tra­ti­on­s­pa­nel erzeugt wird. Lei­der kommt Word­Press mit Datei­en > 3 MB schlecht klar. Abhil­fe schafft Advan­ced Export, ein Plug­in, das die Blog-Daten­bank z.B. jah­res­wei­se expor­tie­ren kann. Die Datei­en sind dann klein genug, dass der Word­Press-Export (bei mir 2.8.x) nicht abbricht (was übri­gens nicht durch eine Feh­ler­mel­dung signa­li­siert wird, son­dern eine XML-Datei ergibt, die dann in Zei­le 25015 oder so mit einem Feh­ler abbricht).

Wenn das XML-Export-File vor­liegt, kann die­ses in Blog­Boo­ker ein­ge­le­sen wer­den. Dann noch die URL des Blogs ein­ge­ben, auf Start drü­cken, und etwa eine Minu­te (bei mir) war­ten. Fer­tig ist das PDF, das nun gespei­chert wer­den kann.

Soweit funk­tio­niert das ganz gut. Span­nend fin­de ich vor allem, dass tat­säch­lich sämt­li­che Abbil­dun­gen im PDF ent­hal­ten sind – die ste­hen näm­lich nicht im Export-File, son­dern müs­sen extra aus dem Blog gela­den wer­den. Was mir nicht gefällt, ist etwas ande­res. Das gan­ze basiert auf TeX – und das ist dem ent­ste­hen­den Buch auch anzu­se­hen. Zum einen ange­sichts eines TeX-typi­schen und über­haupt nicht schö­nen Sei­ten­um­bruchs (Text – viel, viel Lee­raum – Bild – viel, viel Lee­raum – Text bei­spiels­wei­se), zum ande­ren, weil die TeX-Stan­dard­schrift ver­wen­det wird. Dabei gibt es extra eine gan­ze Rei­he But­tons, die die Papier­grö­ße, die Spra­che, die Schrift­art etc. fest­le­gen sol­len – die schei­nen aber nicht unbe­dingt eine Wir­kung zu haben – bei mir kam jeden­falls kein B5-Pala­ti­no-9pt-PDF raus, son­dern eben das TeX-Stan­dard­mo­dell (mit unty­po­gra­fi­schen Anfüh­rungs­zei­chen und Umlau­ten, die in Kur­siv­schrift nicht kur­siv gesetzt sind). Und wirk­lich guten auto­ma­ti­schen Buch­satz scheint es auch noch nicht zu geben. Schade!

screenshot-bookblogger
So sieht das Ergeb­nis aus – ankli­cken zum Ver­grö­ßern. Und auch im März 2008 gab es um die­se Zeit einen Win­ter­ein­bruch, sehe ich gerade.

Die Idee gefällt mir jedoch gut – als eine Art zusätz­li­ches Back­up für das Blog, bei­spiels­wei­se. Oder auch, um ein Gefühl dafür zu bekom­men, was so ein Blog eigent­lich bedeu­tet. Ich habe jetzt mal vier PDFs erstellt – eines für die Zeit bis 2006, und dann jeweils eines für 2007, 2008 und 2009. Die letz­ten drei sind um die 5 MB groß und umfas­sen jeweils 200–300 Seiten. 

… dach­te ich jeden­falls. Denn den Pro­zess für 2009 habe ich im Hin­ter­grund gestar­tet – und der ant­wor­tet mit jetzt nicht mit einem schön abspei­cher­ba­ren PDF, son­dern mit der lapi­da­ren Feh­ler­mel­dung, dass es ein XML-Pro­blem in der Datei gege­ben habe, und dass ich das gefäl­ligst in einem Text­edi­tor kor­ri­gie­ren soll. Und um fest­zu­stel­len, ob es Feh­ler gibt, und wel­che das sind, soll ich die – 2 MB gro­ße – XML-Datei ein­fach in einem Brow­ser mei­ner Wahl öff­nen. Da macht Blog­Boo­ker es sich für mei­nen Geschmack doch etwas zu ein­fach. Mir ist dabei jeden­falls der Brow­ser abge­stürzt. Wahr­schein­lich wäre es hilf­rei­cher, einen XML-Vali­da­tor zur Hand zu neh­men. Aber das mache ich jetzt nicht.

Vor­läu­fi­ges Fazit: so ganz funk­tio­niert Blog­Boo­ker noch nicht. Der Ansatz aber ist sinn­voll – und um aus struk­tu­riert vor­lie­gen­den XML-Datei­en etwas ande­res zu machen, gibt es vie­le, vie­le Möglichkeiten.

War­um blog­ge ich das? Als Erleb­nis­be­richt. Bei der Gele­gen­heit: besteht Bedarf, die Archiv­bän­de zum Blog hochzuladen?

Kurz in eigener Sache: RSS sollte wieder gehen

Eini­ge Tage lang war mein RSS-Feed kaputt, was ich heu­te dank Micha­el erfah­ren habe. Mit Hil­fe von Face­book und Ulf und dem W3C Feed Vali­da­tor konn­te das wie­der repa­riert wer­den. Mein RSS-Feed – direkt oder via Feedb­ur­ner – soll­te jetzt also wie­der funktionieren.

Weil’s viel­leicht auch für ande­re inter­es­sant ist: Schuld war die­ser Arti­kel. Zuerst sah’s so aus, als wäre ein Zei­chen im Titel schuld – der Mar­ker saß auf dem „/“, beim Zäh­len kam der „:“ als Übel­tä­ter her­aus. Komisch, weil sie in ande­ren Arti­kel-Titeln als wohl­ge­formt akzep­tiert wur­den. Die eigent­li­che Ursa­che war dann auch weder „/“ noch „:“, son­dern ein in Fire­fox unsicht­ba­res „Low-ASCII-Zei­chen“ (klas­si­scher­wei­se wür­de ich es ^k nen­nen). Ulf hat’s gefun­den – und beim Kopie­ren des Arti­kels in HTML-Edit wur­den die unsicht­ba­ren Zei­chen – in Fire­fox nur als „Hol­pern“ beim Cur­sor-Bewe­gen merk­bar – dann sicht­bar. Nach dem Löschen die­ser unsicht­ba­ren Zei­chen war der Feed dann wie­der valide.

Bleibt die Fra­ge, wo sie her­ge­kom­men sind. Der wahr­schein­lichs­te Übel­tä­ter ist Power­Point – aus einem in Power­Point ange­leg­ten Pos­ter hat­te ich den Arti­kel näm­lich herauskopiert.