English

快、准、全网络检索的关键

2001-08-29 来源:光明日报 扬帆 我有话说

美国互联网委员会公布的研究报告《2000年互联网状态》显示,目前全球范围内互联网上的网页数量已经突破了20亿。每时每刻在互联网上都有数以万计甚至亿万计的信息在不停地更新替换。没有地域、时间的限制,现代企业之间的信息战已经24小时不断地进行。但是,在互联网上查找信息对于企业而言一直存在着几个难题。

一是全面性问题。找到一条企业的相关信息是容易的,找到100条也不难,但要在如此庞大的信息量中把相关信息基本找全,几乎是不可能的。二是筛选问题。互联网上每分每秒都出现大量的信息,有的是有价值的,但更多的是没价值的。在浩瀚的信息海洋中寻找有价值的东西,必然要耗费大量的时间精力。三是时效性问题。互联网上信息产生的速度很快,数量巨大,实时性非常强,但要在最短的时间内快速发现和搜索它们却并不容易。普通搜索引擎的数据更新周期一般都在一个星期以上,对于分秒必争的现代商业竞争来说,显然是无法满足需要的。我们也不可能投入那么大的人力每隔一小段时间就把所有要监控的信息源全部浏览一遍,只能看看有没有更新,更新的内容是什么。

信息的全面性、时效性和对信息的筛选成为困扰网上快速搜寻信息的主要问题。不过,百度“网事通”实时信息系统的开发成功使这些问题不再是无法跨越的障碍。这套系统可以让用户设定需要被监控的网站,然后不断地跟踪这些网站的变化。一旦任何一个被监控网站上有了新的信息出现,实时系统会立刻发现,随后派出信息采集程序将新的信息采集回来,分析索引后,存入信息索引库提供检索。同时,新信息的标题还可通过播放系统显示出来,让用户一目了然。任何新的信息,从出现到被系统采集播出并提供检索,整个过程耗时不超过1分钟。

首先,“网事通”实时信息系统能同时监控的网站可达3000家,这便解决了第一个全面性的问题。第二,系统提供了对信息的全文检索,用户如想了解任一项内容,只需输入关键词即可,这就给准确地筛选信息创造了条件。第三,实时信息系统的监控、采集和提供检索都是实时进行的,任何新的信息出现只要超过一分钟,就可以被找到,因此时效性问题也就彻底解决了。

有了这套系统,企业信息部门就像有了千里眼、顺风耳,可轻轻松松并且高质量地完成情报的收集和查找工作。不仅提高了工作效率,还大幅度地节省了人力投入,在最短的时间内,获取最新的市场消息,作出最及时的反应,快人一步,胜人一筹。

 

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有