Type a search term to find related articles by LIMS subject matter experts gathered from the most trusted and dynamic collaboration tools in the laboratory informatics industry.
Google Books (interner Projekttitel Project Ocean) ist die größte private Sammlung retrodigitalisierter Bücher. Sie befindet sich im Besitz des US-amerikanischen Unternehmens Google LLC. Die Sammlung ist in Auszügen öffentlich einsehbar. Nach eigenen Angaben ist ihr Ziel, das in Büchern niedergeschriebene Wissen vorwiegend durch Digitalisierung für eine Volltextsuche zur Verfügung zu stellen. Im Jahr 2019 gab das Unternehmen anlässlich des 15-jährigen Jubiläums von Google Books bekannt, im Besitz von Scans von über 40 Millionen Büchern in mehr als 400 Sprachen zu sein.[1]
Die Zeitschrift The Atlantic berichtete im April 2017, dass Google das Scannen von Büchern praktisch eingestellt habe.[2] Im selben Monat schrieb das Online-Magazin Wired, dass innerhalb von Google nur noch wenige Leute an dem Projekt arbeiten, diese jedoch noch weiterhin Bücher scannen, wenn auch in einem weit geringeren Umfang als zuvor.[3]
Google Books speist sich aus zwei Quellen:
Bei Google Books gibt es vier Zugangsebenen:[5]
Im Oktober 2004 stellte sich Google Print auf der Frankfurter Buchmesse vor (Pressekonferenz mit den Google-Gründern Sergey Brin und Larry Page).[6] Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen. Google hat sich vorgenommen, 15 Millionen Bücher bis 2015 zu scannen.[7] Das entspricht etwa 4,5 Milliarden Seiten. Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms. Im Oktober 2005 wurden zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen präsentiert. Am 4. November 2005 wurde die Suchseite, mit einer erweiterten Suche versehen (Abfragen nach Zeiträumen sind möglich), offiziell vorgestellt. Am 17. November 2005 kündigte Google die Umbenennung des Dienstes im unternehmenseigenen Weblog an.[8] Seit diesem Zeitpunkt werden Anfragen von print.google.com nach books.google.com weitergeleitet.
Im September 2008 kündigte Google an, gemeinsam mit nordamerikanischen Zeitungsverlagen Zeitungen zu digitalisieren. Die digitalisierte Version soll durchsuchbar sowie mit dem Webbrowser navigierbar sein und wie in der Printausgabe mitsamt den Fotografien, Schlagzeilen und Werbeanzeigen erscheinen.[9]
Inzwischen gibt es bei einer Reihe von Büchern eine Kooperation mit Internet Archive. Dort gibt es Ausgaben in verschiedenen Formaten, für das PDF wird auf Google verwiesen (wo es für Werke nach 1864 für Nicht-US-Nutzer nicht verfügbar ist, siehe Kritik).
Aus dem Korpus von Google Books wurden 2009 und 2012 die Datensätze für den Ngram Viewer in verschiedenen Sprachen erstellt.
Google erhält von den Verlagen Bücher oder bekommt PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.
Google versucht die Inhalte durch eine Art Kopierschutz („Digitale Rechteverwaltung“) zu schützen. Dass dies jedoch nicht immer vollständig angewandt wird, kann an verschiedenen Fachbüchern problemlos nachvollzogen werden.[10] Angeschaute Seiten lassen sich nach dem Anzeigen im Webbrowser mittels bestimmter Methoden sogar aus dessen Browser-Cache herauslesen und können mit entsprechenden Tools zu einer PDF-Datei zusammengeführt werden.
Google scannt seit etwa 2005 den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) sowie große Teile der US-Universitätsbibliotheken der Harvard University und der Stanford University, der New York Public Library sowie in Europa der Bodleian Library der University of Oxford. Auch die Bibliotheken der University of Virginia, der University of Wisconsin–Madison, der Princeton University, der University of California und der University of Texas at Austin beteiligen sich.
Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien (Biblioteca de Catalunya) in Barcelona und die Bibliothek der Universidad Complutense Madrid.
Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreie Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.[11] Ausgenommen von dem Digitalisierungsprojekt sind nur die Handschriften- und Inkunabelbestände sowie seltene und besonders wertvolle historische Drucke.[12] Im Januar 2014 gab die der Bayerischen Staatsbibliothek nachgeordnete Staatliche Bibliothek Regensburg bekannt, ihren urheberrechtsfreien Bestand zusammen mit Google digitalisieren zu lassen. Bis Ende 2014 sollen 70.000 Bücher aus dem Bestand der Regensburger Bibliothek online sein.[13]
Im Juli 2008 gab die Stadtbibliothek Lyon als erste französische Bibliothek bekannt, ihre Bücher digitalisieren zu lassen.[14]
Am 15. Juni 2010 gab die Österreichische Nationalbibliothek (ÖNB) bekannt, dass Google ihren urheberrechtsfreien Buchbestand digitalisiert. Die Kosten für die Digitalisierung der rund 400.000 Bücher betragen etwa 30 Millionen Euro und werden von Google getragen. ÖNB-Generaldirektorin Johanna Rachinger bezeichnete dieses Vorhaben als eine der größten öffentlich-privaten Partnerschaften in der österreichischen Kulturlandschaft. 400.000 Bände vom 16. bis ins 19. Jahrhundert (mit Ausnahme jener Bücher, bei denen konservatorische Bedenken dagegen sprechen) sollen dabei im Volltext erfasst werden – rund 120 Millionen Buchseiten sind danach online und kostenlos abrufbar.[15]
Heftige Kritik von Autoren- und Verlegerseite brachte Google dazu, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-out-Lösung). Während Google sich auf den Fair Use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-in). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.
Ein im Dezember 2010 in Science veröffentlichter Aufsatz berichtete über die Möglichkeiten, Google Books zur quantitativen Analyse von Kultur zu nutzen (Culturomics). Den Wissenschaftlern standen für ihre Analysen etwa 4 % aller Bücher, die jemals gedruckt wurden, zur Verfügung. Sie konvertierten die Bücher in eine massive Datenbank der in den Büchern enthaltenen Wörter (N-Gramm). Die Herangehensweise lasse sich für Forschungen auf verschiedenen Gebieten wie Lexikografie, Evolution von Grammatik, kollektivem Gedächtnis, Technologieadoption, Ruhm, Zensur oder historischer Epidemiologie nutzen. Das Forscherteam schätzte zum Beispiel auf Basis der Datenbank, dass sich die Größe des englischen Wortschatzes innerhalb des letzten Jahrhunderts fast verdoppelt habe. In einer anderen Untersuchung wurde der kulturelle Einfluss Sigmund Freuds mit dem Charles Darwins verglichen. Freud verlor demnach an Einfluss; Darwin habe Freud im Jahr 2005 überholt.[16][17]
Der Historiker Jean-Noël Jeanneney – ehemaliger Direktor der Französischen Nationalbibliothek, der mit Gallica ein freies europäisches Digitalisierungsprojekt betreibt – plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitätsbibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.
Das Problem, dass Google Books mit seiner Marktdominanz durch seine Selektionspraxis Alternativen verstellt, wird auch in Deutschland gesehen, insbesondere bei der Recherche auf Spezialgebieten wie der Lokalgeschichte oder der Mundartforschung.[18]
Eine Zuordnung von systematischen Sachgruppen und Schlagworten zu den Büchern wie in Bibliothekskatalogen erfolgt nicht. Bücher eines bestimmten Fachgebietes zu selektieren, ist nicht möglich. Google geht davon aus, es genüge für die thematische Suche, alle Wörter in den Büchern zu erfassen. Die Eingabe eines Stichworts kann aber immer nur Ergebnisse in der verwendeten Sprache liefern. Es wird nicht berücksichtigt, dass oft sprachübergreifend gesucht wird und dass ein Wort in mehreren Fachgebieten verwendet werden und unterschiedliche Bedeutungen haben kann.[19]
Der Spiegel bemängelte im Jahr 2007 die oft schlechte OCR-Qualität und die mangelhaften Metadaten.[20] Es gibt Fälle, in denen der Autorenname vom OCR falsch erkannt wurde, so dass das Werk unter dem Autorennamen nicht gefunden werden kann.[19] Die sichtbare Qualität der Seiten wurde wiederholt kritisiert. Dies betrifft die Punkte fehlende Textstellen und sichtbare Finger sowie Fingerlinge des Personals am Scanner.[21] Der amerikanische Schriftsteller und Konzeptkünstler Kenneth Goldsmith widmete dem Phänomen 2013 einen Essay im New Yorker.[22]
Google Books ist insbesondere ins Rampenlicht gerückt, da in das Projekt nicht nur urheberrechtsfreie, sondern auch durch das Urheberrecht geschützte Werke eingestellt werden. Das „Google Book Settlement“ ist ein Vergleichsvorschlag, den Google Inc. auf eine Sammelklage US-amerikanischer Verlage und Autoren gegen sie ausgearbeitet hat.[23] Die Widerspruchsfrist für Verlage und Autoren („Nicht-Teilnahme-Frist“) wurde vom 5. Mai 2009 bis zum 4. September 2009 verlängert.[23][24][25]
Im September 2011 wurde bekannt:
“In a surprise move, authors’ groups slammed their one-time university partners with a lawsuit demanding that the schools surrender digital collections and stop working with Google (NSDQ: GOOG). The lawsuit opens a new phase in the fight over digital libraries and comes the same week that Google’s controversial books settlement is expected to die in court.”
„In einem überraschenden Vorgehen verpassten Autorenverbände ihren ehemaligen Bündnispartnern, den Universitäten, eine gerichtliche Klage, in der sie verlangen, dass die Hochschulen die digitalen Büchersammlungen aufgeben und die Zusammenarbeit mit Google einstellen. Die Klage eröffnet eine neue Runde im Kampf um digitale Büchereien und kommt in derselben Woche, in der dem umstrittenen ‚Google book settlement‘ voraussichtlich vor Gericht der Garaus gemacht wird.“[26]
Im November 2013 wurde im Urheberrechtsverfahren der amerikanischen Autorenvereinigung Authors Guild gegen Google der Antrag auf einen Geschworenenprozess abgewiesen und gleichzeitig festgehalten, dass Google Books grundsätzlich durch das „Fair Use“-Prinzip gedeckt sei.[27] Dieses Urteil wurde im Oktober 2015 in zweiter Instanz bestätigt.[28]
In den USA kritisierte etwa die „American Society of Journalists and Authors“ die Einigung als einen internen Handel zugunsten der daran Beteiligten.[25] Auch Mitglieder des Konkurrenzprojektes der Open Content Alliance kritisieren das Vorgehen von Google, das keine Rücksicht auf Copyright nehme.
Das Urteil betrifft auch nicht-amerikanische Verlage und Autoren, da Google über das Internet weltweit erreichbar ist. Google könnte dann jedes Werk deutschsprachiger Autoren, die keinen Einspruch in den USA erhoben haben (Widerspruchsfrist 4. September 2009), in digitalisierter Form auf seiner Plattform zur Ansicht stellen, ohne dass hiergegen noch rechtlicher Einspruch der Autoren möglich wäre. Für den deutschen Buchmarkt hat die Verwertungsgesellschaft Wort (VG Wort) einen eigenen Regelungsvorschlag ausgearbeitet. Die VG Wort kritisiert und klagt auf der einen Seite gegen Aspekte dieser möglichen Einigung vor einem amerikanischen Gericht. Auf der anderen Seite arbeitet die VG Wort mit Google bei der geplanten Umsetzung der Einigung zusammen.
In Deutschland fordern im Heidelberger Appell Schriftsteller, Verlage und Wissenschaftler den Schutz des Urheberrechts gegen seine Aushöhlung. In dem Manifest werden zwei Dinge miteinander verbunden: die Kritik an der Google-Buch-Digitalisierung mit einer Kritik an Open-Access-Politik im Allgemeinen. Dies hat zu einer Zersplitterung der Kritiker des rasch voranschreitenden Google-Digitalisierungsprojekts geführt. Ein großes Problem sieht der Heidelberger Appell insbesondere im Vergleich. In der Frankfurter Allgemeinen Zeitung wird der Verdacht eines „Coupon-settlements“ nahegelegt, bei dem selbsternannte Klägeranwälte mit Google eine „Einigung“ aushandeln, um ein üppiges Honorar und eine marktdominierende Stellung für Google zu erreichen.[29]
Am 1. September 2009 kritisierte die Bundesregierung den Einigungsvorschlag. Sie forderte, dass zumindest eine eigene Klasse für die deutschen Rechteinhaber gebildet werden solle und diese von der pauschalen Einigung auszunehmen. Zudem behindere Googles Copyright-Verletzungen und das Verhalten „Erst tun, dann fragen“ Projekte wie die europäische Online-Bibliothek Europeana, die Autorenrechte vorab wahre.[30]
Anlässlich einer Expertenanhörung durch die Europäische Kommission am 7. September 2009 erklärte Google, auf die Bedenken von Verlegern und Autoren eingehen zu wollen und deren Vertreter an der Beaufsichtigung des Projekts Google Books zu beteiligen. In Europa urheberrechtlich geschützte und lieferbare Bücher sollen nicht ohne ausdrückliche Erlaubnis gescannt und online zugänglich gemacht werden.[31] Gleichzeitig bekundete die EU-Kommission, das Urheberrecht ändern zu wollen, da aufgrund der Gesetzeslage nur die USA von den Vorteilen der Digitalisierung und Online-Vermarktung profitieren würden.[32]
Der fünfjährige Feldversuch eines Projekts der University of California, Berkeley und der Northeastern University kommt zu dem Schluss, dass über Google Books digitalisierte Bücher um 5 bis 8 Prozent häufiger als Print-Edition gekauft werden und Zufallsfunde bei Recherchen Vorteile für kleinere und Independent-Verlage bieten können.[33]