对Google在线图书馆计划的分析
【摘要】文章在概括介绍Google在线图书馆计划背景、信息源及版权处理策略的基础上,深入分析了其给图书馆、出版商及网络环境下著作权中合理使用原则带来的 影响。与此同时,作者还从文化对抗、抢夺数字市场角度阐述了社会各界给Google在线图书馆计划带来的竞争压力,旨在启发人们对未来全球化搜索趋势的思考。
1、Google在线图书馆计划的背景
2003年10月,著名网上图书零售商亚马逊推出基于图书全文的“书内搜索”服务,引起巨大反响。 Google快速反应,于12月推出Google Print试用版,与出版社合作,索引图书的封面、简介、作者传记或内容梗概上节选而得的摘要。当时只是一种书摘搜索,与亚马逊的全文搜索差距较大。随着与出版社合作范围与内容的扩大,Google开始索引图书全文[1]。
我们知道,Google的使命是组织全世界的信息,使之可在全世界范围内广泛存取和利用,但是,在版图书占所有图书的比例显然是不足的,Google只有借助于图书馆庞大的文献资源才能完成这个似乎遥远的使命,故而Google的战略目光早就瞄向了大学图书馆。在与五大图书馆经过了一年或更长时间的商讨,并且在密歇根大学做了相当一段时间的图书无损快速扫描试验后,Google终于2004年12月14日在加州推出了迄今为止规模很大的图书馆数字化计划。
Google将与美国纽约公共图书馆、哈佛大学、斯坦福大学、密歇根大学和牛津大学的图书馆合作,将这些著名图书馆的馆藏图书扫描制作成电子版放到网上,使全世界用户都可以在线查询和使用这些文献,Google将拥有海量图书的数字化图像和文本,由信息的搜索者一跃成为信息的拥有者,走向其组织全世界信息的终极目标。该计划打造的网上图书馆是Google Print的延伸,称为:Google Scholar[2]。
Google这一举动立即震惊了世界,吸引了全球的目光。有人把这一创举与人类印刷术的发明相提并论,认为这将在全世界掀起一场信息化革命,是指尖上的亚历山大图书馆。纽约公共图书主管Paul Leclere更认为是“自古腾堡以来信息发行史上很具革命性的事件之一”[2]。业内普遍认为,合作计划不仅加速了信息和知识的传播速度、加速了科研成果的推广,而且还能降低图书管理费用、节省人力资源、方便阅读及跨学科的研究,有益于全世界的知识交流。然而,也有专家认为,这一计划在颠覆人类现有搜索模式与阅读习惯的同时,也将引发众多如知识产权、文化习惯等冲突性问题。计划耗费10多年时间的图书数字化,对 Google来说,究竟是一次良机,还是一次危机?Google能否取得成功?
2、Google在线图书馆计划的信息源及版权策略
2.1 图书馆[3]
已经与Google合作的五家图书馆,都是大型学术图书馆,历史悠久,馆藏丰富。整个计划预计扫描5000万册藏书:纽约公共图书馆2000万册(稀有或公共领域图书)、哈佛大学图书馆1500万册(无版权图书)、斯坦福大学图书馆800万册、密歇根大学图书馆的700万册和牛津大学图书馆1900年以前的750万册藏书,其中包括中世纪(14至17世纪)的珍贵书籍、美国内战时期(1861至1865年)的稀有书籍和达尔文等名人手稿。扫描时,对斯坦福大学图书馆馆藏采用运输方式,在复制中心扫描后送回图书馆。对密歇根大学和哈佛大学图书馆馆藏将采用远程扫描方式进行数字化转换[4]。
2.2 出版商[5]
出版商通过向Google提交自己拥有版权的图书,即可以Google为免费发布平台,增大图书的能见度,吸引更多的读者和增加网站流量,同时还可以与 Google分享用户点击广告带来的利润。Google提供了一个专门的出版商账户系统和客户端软件来实现这一目标,出版商通过这个系统可随时监控自己的图书所处的状态。并对自己的图书的访问权限作出调整。
目前 ,Google仅接收拥有ISBN并且合法的图书,不接受期刊杂志等,另外,其也准备由 英语扩展到其它语言。Google按照上载图书的多少将出版商分为个人账户和企业账户,不过功能上没有区别。出版商能够自由地进行上载、设置权限、请求删除等操作。
未来得及参与的出版商也可登录Google出版商站点,得到许可后,向Google公司寄出图书资料,Google公司将其进行数字化扫描后放到 Google Print上,读者即可检索到很迅捷的文献信息;图书著者也可向Google公司寄出其有ISBN号的著作,待扫描完成后,出版商和图书著者可免费下载其数字化文献并与Google共享广告收入。此种合作方式能使Google向读者及时提供社会很新出版的电子版图书和很新颖的数字化信息 [6]。
2.3 版权策略
可以看出,Google并不否认数字化图书的版权仍归著作权人所有,其所起的作用只是通过信息组织来引导用户到达该数字资源。Google是以图片的方式显示图书内容页,并且屏蔽掉打印、复制、剪切、保存等功能实现版权保护,同时账户系统还保证出版商能够按照自己的意愿调节其显示页面的比例。关于图书馆的版权图书,Google目前采取的是先扫描图书,然后再处理版权问题的做法,也就是说。当有作者发现自己的作品被数字化后,可以联系作者获得支配权。当版权受到侵害时,受害方即可通过Google的专门邮箱来处理版权纠纷。这个邮箱也受理虚假版权侵害的控诉[5]。
3、Google在线图书馆计划给图书馆带来的影响[2]
相比较而言,笔者认为,Google在线图书馆计划对图书馆的影响利大于弊,其利主要体现在以下几方面:
3.1 降低技术障碍,大大促进图书馆数字化进程
参与馆先前都有自己的数字化计划,如密歇根大学每年5000册的数字化率,纽约公共图书馆被评为“2004年很佳免费参考网站”的联机图片库,都有不俗的成绩。但若按这些速度进行数字化工作,数百万册馆藏资源数字化的完成将变得遥遥无期。借助于 Google雄厚的资本及无损快速扫描技术,在数年内实现馆藏全数字化的梦想,无疑是Google与参与馆双赢的局面。
和那些独立的数字图书馆项目不同,与Google合作建立起来的数字化馆藏,可以经由Google访问,同时,参与馆对这些数字化馆藏拥有自己的“复本 ”,把它与本馆计算机管理系统紧密结合,为本地提供更全面的服务。牛津大学称,经过此次计划,基于自身无与伦比实体馆藏的“虚拟图书馆”建设将向前迈进一大步。
3.2 有利于充分发挥图书馆作为信息、知识存储与传播中心的社会责任,促进广泛的知识共享
目前,向公众免费提供信息,实现学术信息的自由获取或开放存取,一直是图书馆和学术界追求的目标,Google计划恰恰与之相吻合。斯坦福大学一直致力于信息共享,从1995年起,High Wire出版社通过联机合作学术期刊出版服务,向学术界免费提供近百万篇高质量的学术论文全文,并获得“非赢利性出版服务奖”。此次与Google合作,斯坦福大学视之为“一个提供公众利益的机会”“使之让全世界读者可免费获取”。牛津大学认为,图书的电子可获得“不仅服务牛津的研究与学术,而且服务于全世界渴望知识与信息的人们,这符合Thomas Bodley爵士在1602年创建图书馆的目标”。哈佛校长Lawrence H. Summers说,通过互联网与世界各地的用户广泛分享馆藏是哈佛人的骄傲,哈佛图书馆馆藏是属于全世界的资源
3.3 符合网络环境下读者的阅读习惯,可吸引更多的读者关注数字化信息资源
数字化并非目的,如果没有读者的需求为依托,数字化将无法长期维持。Wittenberg进行了一项为期三年的研究,调查全美1233名学生研究习惯,结论是电子资源成为获取信息的主要工具,尤其是本科生。对很多人来说,没有联机的信息是不存在的,提供信息的网络检索在今天尤为必要。Google计划正是看到这个需求,要把丰富的馆藏资源搬上网络,从而吸引更多的读者利用图书馆。纽约公共图书馆馆长Paul LeClure认为,网络信息存取将扩充图书馆馆藏而不是取代原有的物理馆藏。图书馆员将在新的层面承担保存文献的社会职能。
然而,任何事物都有两面性,在线图书馆计划也不例外。它在给图书馆带来机遇的同时,也引发了很多问题。有人担心由Google所生产的信息海洋将泯灭图书馆藏书特色。如果Google将所有数字化内容免费提供给用户使用,图书馆馆藏是否会失去意义?诚然,图书馆需要重新考虑其基于印刷文献宝库的历史使命。加州数字图书馆馆长Deniel Greenstein说,图书馆将不需要花费大量时间和金钱管理印刷馆藏,其未来使命将用更多精力收集信息,使用户可以通过在线方式利用信息。也有人认为 Google智能搜索、语义分析等信息技术会使图书馆编目、虚拟参考咨询服务面临被取代的威胁。笔者认为,凭借图书情报工作者在信息组织及检索服务方面丰富的理论和实践经验,Google的图书搜索计划短时间内是取代不了我们的。作为图书馆工作者,我们应尽快改变观念,辩证地分析问题,取其精华,弃其糟粕,培养竞争意识,在行业内引入竞争机制,突出各自的特色与重点,从而不断地改善和提高服务水平,以形成可以和Google相抗衡的核心竞争力。只有这样,才能改变被取代的命运,长久地发展下去。
4、Google在线图书馆计划给出版商带来的影响
原本很顺利,当2004年10月Google发布其图书搜索引擎时,整个出版界的态度几乎可以说是乐见其成甚至积极参与的,但到了12月,当Google再次发布其“图书馆印刷计划”时,出版商们就慌了神,并开始极力反对。
Google也曾试图寻找妥协之道。首席执行官施密特在2005年7月1日的一次会议上答应妥协,承诺暂停扫描图书。并要求出版商在11月1日之前,向 Google提出不愿意被扫描的图书清单,就好像网站管理员可以选择自己的网页不被Goosle链接。而对美国出版商协会(Association of American Publishers)的成员们来说,自己的版权作品被扫描,而且被存储在像 Google这样具有巨大传播能力的网络巨头的服务器里,简直就是要他们的命。他们害怕Google总有一天会将存储在自己服务器内的这些内容公开,就像当初承诺只是提供所有书籍的很少一部分内容和相关介绍,如今却开始提供无版权图书的全本一样。在相互猜疑和角力中,双方终于都失去了耐心。2005年10 月19日,五大出版业巨头——McGraw Hill、Pearson 教育 、西蒙&舒斯特、企鹅集团和John Wiley & Sons指控 Google公司侵犯版权,要求法院禁止Google继续扫描受版权保护的书籍。而Google也不再理会出版商协会,在11月1日恢复了对图书的大规模扫描,并且加紧了图书搜索引擎的全球推广[7,8]。
同样是图书搜索,为何出版商的态度在“图书扫描计划”出炉前后如此截然不同?
原因很简单,Google此前的图书搜索计划是将出版社所提供的书本进行部分页面的扫描,让读者可以在进行图书搜索之后,浏览自己想要寻找的书籍的某些内容以及相关馆藏和购买信息,出版商们则可以借助Google的传播威力卖出更多书籍。但当Google绕开图书出版商,转而与哈佛大学图书馆的五所图书馆合作,计划将他们的上百万册印刷图书转换成数字文件并收录进Google Print数据库,供人们在网上查询之后,假若尚在版权保护期内的图书可以在Google上被免费全文查阅,这对以售书为生的出版社来说将是一个沉重的打击,出版商当然坐不住了。不过这对于公众而言的确是一件好事,意味着更多的免费书籍资源,更方便的书籍购买、内容信息的获取。
显然,他们很大的分歧就在于图书扫描的许可如何获得上。Google希望由图书出版商提供一张禁止扫描的清单,清单以外的图书能够被扫描,而来自图书出版商的意见,则是所有的版权书籍在进行扫描之前都要获得授权。显然前者对Google非常有利,但图书出版商就要面临极大的风险:Google将可以轻易扫描那些还没有来得及被列上禁止名单的书籍。若选择后者,因数以千万计的图书获得授权所需要的时间和金钱,Google海量数字图书馆计划将变得遥遥无期。
5、Google在线图书馆计划对网络环境下合理使用原则的挑战
一边是公众要求更多的免费方便资源, 社会 要求更快更通畅的知识传递,而另一边是商业企业 要求通过某种程度的权力保留来保证自身利益,网上网下的商业利益与公众利益之间的分歧再次显现出来。
美国法律允许图书馆为保存而复制文献,但有人认为Google是一个商业机构,不能拥有图书馆的特权,对于图书馆馆藏的数字化转换也不属于合理使用范围。英国物理学会电子发展战略负责人Terry Hubert说,如果将文献数字化,必须与学术团体和出版商对话,在没有获得权利拥有者许可的情况下,绝对不能将拥有版权的内容进行系统化数字转换。哈佛大学图书馆出版和交流部主任Pelter Kosewski说,Google将在法律许可下处理版权作品。哈佛与Google合作的第一计划是将4万种馆藏图书转换为数字形式,其余1500万卷文献的数字化还需要不断解决版权问题 。Google发言人说,这项计划将尊重版权拥有者的权利,对于联线使用版权作品的规则将进一步细化。目前出版商对这项图书馆计划多持怀疑和观望态度[6]。
所谓合理使用原则是著作权法用以平衡著作权人与公众利益关系、著作权垄断权与信息分享关系的原则。符合合理使用原则的必要条件是不以盈利为目的,且合理使用的内容必须是少量和适当的。就是否盈利来说,Google斥资巨大建设数字图书馆不可能单纯为了社会福利,背后隐藏的树立品牌的商业目的显而易见。 从这个角度说,Google扫描复制版权图书的行为不再合理使用范围之内;就内容是否少量和适当来说,Google在线图书搜索服务限制了查看方式,多数情况下只能让用户阅读到整个文档的一小部分。但在版权保护技术方面存在漏洞,用户只需在很后一页找到一个生僻词进行全文搜索,Google就会显示接下来的几页,如此反复,就可以将书浏览完毕。用户通过截屏、文字识别后仍可获得电子原文。可见,数字环境下版权保护技术存在的问题对Google提出了严峻挑战 [9]。
但是,目前按照Google提供的浏览方式查考图书内容无需付费,也就是说Google没有谋利,这又是适合合理使用原则的。这与“背后隐藏的商业目的” 是个悖论,如此看来,究竟是谁错了?幽默地说,都是互联网惹的祸。合理使用原则能否防止互联网而继续有效?互联网世界已经到了要求我们必须重新定义合理使用原则的含义和界限的时候了[9]。
6、文化及数字市场的抢夺
6.1 欧洲数字图书馆联盟[3]
Google的网上图书馆计划刚起步,就引发了不同语言的文化防御。法国国家图书馆馆长Jean Noel Heanneney说:“任何一种新的信息沟通模式,不仅仅是简单地取代了前面的旧有模式,还附加了新的价值观。”他认为,Google数字化选择标准完全以英美思想为主导,以 英语为基础,这样将使互联网上英语的统治地位进一步加强。因此他呼吁欧盟应该形成与 Google相抗衡的欧洲项目。牛津大学图书馆馆长并不这么认为,他指出,五所参与该项目的世界上很有影响力的学术图书馆的馆藏内容决不限于英语文献。因此不存在英语控制互联网的问题。斯坦弗大学图书馆馆长也表示在数字化转换馆藏中有大量非英语文献,尤其是欧洲罗马拼音字母语言。
尽管如此,2005年3月16日晚,法国总统希拉克依然向欧盟所有成员国提议,欧洲各国图书馆资源必须在很大范围内、以很快速度在网上被人们共享,加速数字化欧洲图书馆的建设以维护文化的多样性。为此,他已要求法国国家图书馆以及文化部研究数字化欧洲图书馆建设所需的一切条件,并将在几周后向欧盟国家提出合作实施这一工程。显然,此举意在与美国Google搜索引擎公司全力打造的全球很大网上图书馆抗衡。
面对Google的文化进攻,法国的反应是值得称赞的。美式思想形态通过大众文化侵袭到了全世界,而网络也许是很后的战场。但是,与财大气粗、技术挂帅的 Google相比,法国要想启动法语图书数字化,甚至引导欧洲图书的数字化,谈何容易。在这方面,我们中国文化该如何办?是被美国文化的大浪淹没,还是奋起直追,有所作为?这不得不引起我们的深思[10]。
6.2 微软数字图书馆挑战Google[11]
Google在搜索引擎领域中具有突出地位,在 Google进入网上图书馆领域后,对其他搜索引擎公司的发展 自然是一个冲击,Yahoo、Microsoft等竞争对手必将做出反应,他们将在传统网页资源之外寻求新的信息资源,以便扩大自己的索引范围。
于是,当Google数字图书馆正因版权问题停滞不前时,微软突然宣布将联合雅虎、Internet Archive也发起一个类似的图书馆计划,与大英图书馆建立“战略合作关系”,计划将该图书馆2500万页的图书数字化,这相当于10万本图书的容量。微软公司表示,此次数字图书馆计划将首先选用那些公共领域和版权明确的图书和纸制印刷品进行扫描,然后将内容放到互联网上供人们检索。鉴于Google遭到的版权纠纷,微软特别为此成立了一个名为“开放内容联盟”(Open Content Alliance),用来解决版权争议问题。
“开源内容联盟”的宗旨是向包括各大搜索引擎在内的互联网社会提供数字化的图书、学术论文、音像资料。参加这个非赢利计划的成员还包括ADOBE公司、惠普、加州大学、多伦多大学、“互联网档案库”以及O''REILLY媒体公司。其中雅虎的角色是提供联盟网站上的内容搜索。不过,这个联盟和Google的线上图书馆计划有所区别,首先它的图书内容向所有网站开放,因此包括Google、微软MSN这样的搜索引擎也可以将其纳入索引库中。此外,“开源内容联盟”将只会扫描版权过期的图书、出版社和作者明确授权的图书,这个政策受到了Google项目众多抨击者的赞赏。
目前微软已经为联盟中大约15万本图书支付了500万美元的版权费,雅虎也表示将支付大约2万本图书的版权费,据悉,微软数字图书馆将采用按页数收费、在线订阅、出售、广告等商业模式运营。公司希望在对手Google因版权问题一筹莫展时,抓住良机。不过,也有人并不看好,因为手头富裕的Google很容易摆平版权纠纷。
7、结束语
虽然图书全文的数字化工作已在中国数字图书馆、超星数字图书馆等公司开展多年,但他们都有相当的封闭性,既不免费,也不能通过搜索引擎检索,甚至还需要安装各自的浏览器才能阅读图书全文,相当不完善。相对而言,对国内汉语文献来说,目前既没有类似古腾堡计划等大规模的免费全文图书计划,也没有 Google的数字化计划,数字化图书不过是图书馆购买的一种数字资源,对大量更习惯于网络搜索的用户影响有限。有以往Google各项服务从英语开始试行,逐步向其他语种推行的先例,若干年后Google大规模数字化汉语学术文献的可能性也是存在的。大型图书馆多年积累的丰富馆藏,对于任何意图组织网络信息资源的企业都具有吸引力。即使不是Google,或许也会有其他企业效仿Google模式进行汉语文献的数字化工作。未雨绸缪,应对可能存在的挑战,对国内图书馆也是很有必要的[2]。
Google能否化解风险,顺利推动图书数字化工程?尽管困难重重,但我们依然相信,迎接Google更多的将是机遇。一方面,图书馆迫切需要数字化馆藏,出版商则需要更多的市场推广,而Google能够免费为之提供服务,必然会带来源源不断的资源;另一方面,网民对可靠性更高的出版物有着强劲的需求,他们更期待一个强大的资源整合工具的出现。全球化数字图书馆是未来网络发展的方向,Google已经起步,在一定程度上占据了先机。只要它善于发挥自身的优势,克服劣势,消除周围的各种威胁,抓住外部机遇,就很有可能取得长足发展。Google数字图书馆的未来怎样,我们拭目以待[5]!(作者:未知)
【 参考文献】
[1] Google回应亚马逊A9服务发布图书搜索引擎.[2005-07- 06]. http://www. adgoogle.cn/ssyqyj/gxw68. htm
[2] 胡小菁.Google图书馆合作计划的背景、目的与 分析 .图书馆杂志,2006(5)
[3] 本刊记者.网上图书馆:Google的创新和挑战.国家图书馆学刊,2005(2)
[4] 黄宗忠.数字图书馆发展的新阶段:关于Google、欧洲数字图书馆筹建的评价与对策.图书情报知识,2005(10)
[5] 鄢凡.Google Print模式及发展前景初探. 现代 情报,2005 (8)
[6] 晏磊.关于Google图书扫描方案的思考.新世纪图书馆, 2005(2)
[7] 美出版巨头联手状告Google侵权 数字图书馆计划遭遇红灯.[2005-11-02]. http://media. people.com. cn/GB/40606/ 3789107. html
[8] Google数字图书馆计划受重挫 美国欧洲均碰壁.[2005- 07-06].http://tech. tom.corn/1121/1499/200561-210168. html
[9] 张久珍.Google数字图书馆计划考量合理使用原则.数字图书馆论坛,2006(3)
[10] 靳生玺.Google图书馆计划的三大硬伤.IT 时代 周刊,2005(7)
[11] 微软数字图书馆挑战Google.互联网周刊,2005-01-17