CNET科技资讯网9月8日国际报道 Google周三(6日)宣布推出新服务,让使用者检索报纸、杂志等平面媒体的过期文章文件库,最远可挖掘出200多年前的文章。
这项新服务称为“Google新闻文件搜索”(Google News Archive Search),把查询者导向出版商网站提供的免费或付费的数字内容,但Google不会直接从中牟利。
Google未说明已总共会有多少出版企业加入这项新服务,但已宣布的合作伙伴包括:华尔街日报、纽约时报、华盛顿邮报、时代杂志、Guardian Unlimited、Factiva、Lexis-Nexis、HighBeam Research以及Thomson Gale。
Google已独力把这些在线数据库的文章编目索引,搜索结果将通过一般搜索以及全新的文件搜索网页呈现。
不同于Google扫描图书馆藏书引起著作权争议甚至被出版企业告上法院,新的“Google新闻文件搜索”服务备受支持。几家参与这项服务的伙伴表示,他们多年前就一直催促Google把他们的文件库纳入搜索范围。
这些数据库属于所谓“全球信息网的黑暗大陆”(dark Web),因为一般搜索引擎的触角伸不到此处,因此无法将其中的信息编目,以致使用者搜索不到。
芝加哥数字内容图书馆HighBeam Research的首席执行官Patrick Spain说:“我们多年来一直拜托Google和其他搜索引擎,用自动寻检程序(spider)把我们的内容纳入检索范围。”
HighBeam广纳3,300种刊物和4,000万份文件,都将免费供民众检阅。不过,在其他情况下,使用者只看得到标题和文章的前600个字,要看全文得成为HighBeam的付费会员,月缴20美元或年缴100美元。
Gartner研究主任Allen Weiner说:“此举象征一个关键时刻。”他说,Google取得内容公司的配合,这对双方都有利。
在许多情况下,时代杂志、华盛顿邮报等刊物的整座数据库,通过Google搜索都检索得到。时代杂志的过期文章文件库现已免费供使用者检索,这项服务靠广告费维持。该杂志上个月把截至目前为止总计4,300期的30万篇文章,统统经由Time.com网站提供检索,文章年代最远可回溯到1923年。
包括纽约时报和华盛顿邮报在内的一些刊物,则会引导查询者上特定的网站,选购想查阅的个别文章。
Google主管表示,新服务不会直接产生营收,目前还未想到如何从中获利。Google工程师Anurag Acharya说:“我们尚未把焦点转向获利,这对我们而言是新的领域。”
Acharya说,新服务不像百科全书那般包罗万象,而是提供使用者一份具代表性的相关文章清单,依照时间顺序排列。此服务设法提供一个年代指标,点出与搜索关键字最有关联的年份。例如,搜索“登陆月球”,就会指向1969年。
Weiner预期,Google将来可能把文件搜索服务与Google Checkout付款系统链接。日后,视频文件库几乎确定也会加入。 |