Ist es wirklich sinnvoll jetzt schon, den Tod der PDF in der Wissenschaft zu fordern?

workplace

Als ich mir vor über einem Jahr ein iPad kaufte, war ich lange Zeit skeptisch, ob ich irgendwann einmal darauf auch Text lesen werde. Also jetzt nicht Texte im Internet, sondern allerlei Geschriebenes in Form von Papern, Bücher etc. Das iPad sollte nicht nur meinem privaten Medienkonsum bereichern (was es tat), sondern vor allem auch im akademischen Umfeld zum Einsatz kommen und da meinen Workflow digitalisieren. Es ging mir nicht nur darum, Papier zu sparen, sondern die Digitalisierung von Zitaten, relevanten Textstellen für mich zu vereinfachen. Denn bisher machte ich es, wie vermutlich ein Großteil der geisteswissenschaftlichen (!) Forschung und Studierendenschaft.

Wenn ein Fachbuch oder ein Fachtext nicht digital (das heißt für gewöhnlich als PDF) vorlag und das war bis 2010 fast immer der Fall, dann ging ich in die Bibliothek, bemühte die Katalogsuche und Fernleihe und organisierte mir die entsprechende Druckausgabe des gesuchten Werks. Wenn dies erfolgreich war, schnappt ich mir das Buch mitsamt Kopierkarte und stellte mich in die Kopierzimmer-Reihe und wartete. Wenn ich an der Reihe war, atmete ich betört den Tonergeruch ein und kopierte mir, wenn möglich auf Recyclingpapier, die Texte, die ich anschließend zusammenhefte, durchlas, kommentierte, ggfs. exzerpierte und in riesigen Ordner, Ablagen und Hefter archivierte. Benötigte ich Textstellen, dann setzte ich mich an den Rechner und tippte vergnüglich Relevantes in das Bibliographieprogramm oder die Arbeit.

Aus heutiger Sicht betrachtet bot dieser Workflow natürlich noch Optimierungsmöglichkeiten. Und heute 2013 ist es dann auch ein wenig anders. Zum einen sind natürlich mehr Bücher und noch mehr wissenschaftliche Artikel elektronisch als PDF verfügbar. Zum anderen konnte ich durch Buchscanner, OCR-Software (Adobe Acrobat Pro), PDF, Dropbox und das iPad für mich einen angenehmeren Workflow gestalten. Das heißt aber auch, dass noch heute gilt: wenn ein Text nicht digital verfügbar ist bzw. einfach zu teuer, um ihe zu erwerben, mache ich mich in die Bibliothek auf und suche mir das entsprechende Werk. Anstatt aber papierne Kopien zu erstellen, stehe ich nun am meist unbesetzten Buchscanner, den es auch in fast jeder großen Universitätsbibliothek gibt, und scanne mir die gewünschten Texte zusammen.
Am Rechner führe ich eine Texterkennung durch und lese die so nun durchsuchbaren und gut kommentierbaren zu fast 90% auf dem iPad1 Logischerweise fällt auch das Abtippen von relevanten Textstellen und Zitaten weg. Durch simples Copy-and-Paste ist ein wichtiger Text ruckzuck bibliographiert und exzerpiert2.

Ich bin an sich recht zufrieden mit diesem Ablauf. Weniger Papier muss herumgeschleppt werden. Auf allen Geräten, die ich besitze, ist mein gesamter Literaturapparat verfügbar. Kommentare und Notizen können nicht nur leicht editiert, sondern auch zeitlich als auch endgerätetechnisch nachverfolgt werden. Auch entfällt das nervige Abtippen von Textstellen. Aber es ergeben sich noch mehr Vorteile. Hier sei vor allem die Durchsuchbarkeit des einstigen Papiers genannt. Ich verbrachte früher viel Zeit mit dem Anlesen von Textteilen, die für mein Interesse nicht vordergründig sind. Das Durchsuchen der durch ein OCR-Programm lesbar gemachten PDFs erleichtert mir das Auffinden von für mich relevanten Textstellen ungemein.

 

Halbig - bearbeitete Textseite

 

Mein Fazit ist also, dass ich mit meinem Workflow an sich ganz zufrieden bin. Ich forsche in einer Zunft, in der – anders als beispielsweise in vielen Naturwissenschaften aber auch zunehmend in anderen empirischen Wissenschaften – keine ausgeprägte Online-Journal-Kultur existiert. Die Norm ist oft das gedruckte Buch oder der im Sammelband abgedruckte Fachtext, der auch entsprechend nach Ausgabe und Seite zitiert wird. Deswegen fällt es auch auf, dass mein Workflow recht zentriert um das PDF herum aufgestellt ist, da sich auf diese Weise sozusagen Ausgabe und konkrete Seitenzahl mitdigitalisiert.

Aber das PDF steht in diesem Zusammenhängen stark in der Kritik. Es wird nicht nur hinsichtlich seiner kommerziellen Abhängigkeit zu Adobe, sondern auch wegen begrenzter Darstellungsmöglichkeiten auf verschiedenen Leseendgeräten kritisiert (Stichwort: sich zu Tode scrollen). Dies ist darauf zurückzuführen, dass es schießlich ein seitenbasiertes Format als Grundlage nimmt, welches sich dementsprechend nicht hochgradig skalierbar zeigt wie etwa eine html-Seite oder eine auf XML basierendes E-Book. Diese wesentlichen Punkte sind offenbar der Grund, warum man sich wünscht, die „Krücke“ PDF zugunsten neuer, vorteilhafterer Formate endlich loszuwerden.

Als Alternativen werden dabei natürlich der html-Artikel (Smart Article) sowie das XML-basierte eBook (sei es als .epub, .mobi usw.) ins Auge gefasst. Die Vorteile dieser Formate liegen natürlich auf der Hand. Sind geboren im Bildschirm und nicht mehr eine reine Abstraktion des Buches bzw. der papiernen Textseite. Dementsprechend spricht ihre erhöhte Anpassbarkeit für die Lesbarmachung auf verschiedene Endgeräte, die Durchsuchbarkeit (obwohl sie diese mit einer durch OCR-Techniken durchsuchbaren PDF teilen) sowie die Durchsetzung des Textes mit nicht-textuellen Elementen für diese Formate.

Was jedoch ganz klar aufgegeben werden muss – sowohl bei html-Artikel als auch den eBook-Formaten – ist das Denken innerhalb der Normseite. Paginierung, Seitenzahlen etc. sind für diese Formate einfach nicht mehr von Belang. Und natürlich kann man sich fragen, warum man gerade beim digitalen Lesen noch Seitenzahlen benötigt. Denn sobald es Seitenzahlen gibt, gibt es logischerweise ein irgendwie geartetes System von Seite, das dann vermutlich auch als Setzungsparadigma verwandt wurde und dementsprechend die freie Skalierbarkeit von html-Text oder eBook zunichtemacht.

So sehr ich natürlich die Möglichkeiten der neuen Formate begrüße, habe ich damit auch so meine Sorgen und Zweifel. Zum einen darf das Infragestellen von Seitenzahlen nicht darauf hinauslaufen, jegliches Auffindungssystem (und nein, ich meine jetzt nicht die konkrete Suche nach Textstellen) innerhalb des digitalen Textes gleichsam mit zu verwerfen. Zum anderen darf es nicht darauf hinauslaufen, dass die fehlende Lösung eines geeigneten Auffindungs- und Verweisungsystems des digitalen Fachartikels zu einer Infragestellung wissenschaftlicher Zitierweisen führt. Die fürchterliche Neigung vor allem im englischsprachigen Raum und naturwissenschaftlichen Metier das Zitat herrlich unkonkret zu lassen, indem nur noch auf die gesamte Publikation verwiesen wird (see Schreiber 2012) kann vielleicht in einer von Papern und Zeitschriften dominierten Forschung noch ausgehalten werden, sobald es aber um Bücher und verschiedenster Publikationen geht, ist dieser Zustand nicht auszuhalten. Es genügt bei einem Hinweis auf Habermas‘ Kritik an Derrida Habermas 1983 hinzurotzen. Es ist ein Service für den Leser und ein Element wissenschaftlicher Redlichkeit hier konkret zu werden: Habermas 1983, S. 219-247. Auch bei einer Zitation eines Gedankens oder Gedankengangs (das berühmte indirekte Zitat) ist es in einer Buchkultur, die die gegenwärtige Geisteswissenschaft immer noch ist, notwendig konkret zu werden, denn sonst versperre ich dem Leser meines Textes das Verstehen und den kritischen Nachvollzug meines Gedankengangs.

Auch sollte berücksichtigt werden, dass Texte nicht nur im Digitalen exisitieren und somit eine Auffindungs- und Verweissystem auch offline anschlussfähig sein muss. Und an einem solchen Auffindungssystem kranken all diese neuen Textformate des Digitalen, weshalb es auch offenbar noch verfrüht ist, den Tod der PDF in der Wissenschaft einzufordern.

Weder der Smart Article noch das eBook haben keine erkennbar solide Strategie für ein Zitationssystem entwickelt. Zumindest keines, das auch den Sprung aus dem Bildschirm heraus schaffen könnte und einigermaßen mitteilsam bleibt. Denn natürlich könnten Zitate und entsprechende Verweise mithilfe von Links umgesetzt werden. Aber dies funktioniert nur im rein digitalen Paradigma. Bekanntlich sollten aber Informationen auch außerhalb des Rechners mitteilsam bleiben. Aber bis heute habe ich kein entsprechendes Zitationsystem umgesetzt gesehen. Weder iBooks noch der Kindle lassen einen Ansatz eines Zitationssystem erkennen, bei dem konkrete Textstellen herausgestellt werden können.

Alle kehren gezwungenermaßen aber gleichzeitig unsinnigerweise zurück zur Seite (iBooks) oder zur Position (kindle) zurück. Warum gezwungenermaße? Offenbar benötigt der Leser ein solches Referenzsystem. Und dies gilt aus obigen Gründe im besonderen Maße für die Wissenschaft. Warum unsinnig? Weil diese Zählsysteme – gerade bei iBooks – nicht zuverlässig sind. Ändere ich den Screen, die Schriftgröße oder das Layout im Allgemeinen, dann ist die zitierte Stelle an diesem Punkt des Dokumentes nicht mehr auffindbar. Ich kann in die Literaturangabe ja nicht wirklich noch Informationen zu den von mir verwendeten Darstellungsoptionen geben, oder?

Ohne ein plattformübergreifendes Zählsystem bleiben ebooks oder html-Artikel für die Wissenschaft vorerst nur schwer nutzbar. Was bietet sich also als Alternative an? Zeichen, Wörter, Absätze? Schließlich sind Zeichen, Wörter oder Absätze wesentlich nun einmal im Text vorhanden und offenbar adäquater als die durch das digitale Format verlorengegangene Seite. Aber  in Wirklichkeit sind Zeichen oder Wörter keine sinnvolle Größe. Sie spielen vor allem innerhalb des Editierungsprozesses eine große Rolle, aber für den akademischen und nicht-akademischen Endanwender scheinen sie mir sehr unpraktisch. Zu riesig können gerade bei umfangreichen Werken oder Texten die Zahlen werden. Wie findet man sie auf? Muss man abzählen? Gibt es ein passables Zählsystem? Absätze sind genauso wenig hinreichend adäquat. Zwar werden die Zahlen nicht allzu riesig, aber was macht man, wenn ein Text nicht in Absätzen strukturiert oder in Absätzen überstrukturiert ist? Hier fehlt eine sinnvolle Vergleichbarkeit zwischen Texten.

Die Seitenzahl war immer eine vom konkreten Textlayout unabhängige Größe, die ausreichend genau bzw. hinreichend grob war, um einen guten Kompromiss zwischen Auffindbarkeit von Textstellen und schneller, merkbarer Weitergabe von Zitationsstellen zu gewährleisten. Auch besaß die Seitenzahl immer die Eigenschaften einen Aussage über den Umfang des Textes zu machen.

Ich wiederhole mich: Solange es kein adäquates, plattformübergreifendes, formatunabhängiges Zählsystem gibt, dass als Basis eines Zitationssystems fungieren kann, scheinen mir die Rufe nach dem Tod der PDF und der Inthronierung von html-Artikeln und eBook-Formate als verfrüht. Da ist noch ein bisschen was zu tun.

  1. Ich habe dazu zahlreiche PDF-Reader-Tools für das iPad ausprobiert und mich konnte am meisten der GoodReader überzeugen. Auch wenn es momentan bei dieser App noch an einem Update für iOS7 mangelt. Die vielen Absürze nerven. Aber man ist ja leidensfähig. []
  2. der Vollständigkeit wegen: Ich verwende zur Katalogisierung meiner Bibliographie Citavi []
  • Kurzer Test. Jap. Funktioniert.

  • pjuran

    Der Ansatz von sisu (http://sisudoc.org/sisu_manual/en/html/sisu/sisu_intro.html#9), über numerierte Textobjekte Zitatstellen auffindbar zu machen, scheint mir am ehesten noch in Richtung des gesuchten formatunabhängigen Zählsystems zu gehen. Danke für den Artikel.

    • Danke, kannte ich noch nicht. Sehr interessant. Wenn ich es richtig verstehe, ist SISU also „absatzbasiert“. Ich finde es beim Darübernachdenken an sich recht gelungen. Meine Sorge bei einem absatzbasierten System war es eigentlich, dass die Vergleichbarkeit zwischen verschiedenen Texten hinsichtlich der Textmenge nicht gegeben sei – weil es Texte geben könnte, die einfach kaum Absätze haben oder zuviele und somit die Vergleichbarkeit verzerren. Dies über Bord geworfen stellt das System eine wundervolle Möglichkeit dar – Dateityp unabhängig zu zitieren… würde mich freuen, wenn so etwas zu einem Standard werden könnte, mit der Option in den Readern etc. einfach und nett ein- und ausgeblendet werden.

      wie macht das eigentlich amazon mit dem kindle-format genau? Es ist doch auch so etwas ähnliches…

  • Björn

    Musste beim lesen an die Bibel denken. Dieses Buch existiert in verschiedenen Seitenlayouts bzw Seitengrößen und trotzdem kann man jede Textstelle finden.

    • yep, absolute Zustimmung … an sich auch ein sozusage absatzbasiertes Zählsystem und deswegen hochkompatibel für Dateiformate. wie .html, .epub etc.