本报北京3月28日电国家973信息技术与高性能软件基础规划项目,在因特网大规模信息检索领域取得可喜进展。该项目的子课题《基于Internet超大规模知识检索的算法及应用》,在大规模数据标引、文本聚类/分类、快速检索算法、信息采集/发布、信息过滤等诸多领域都取得了令人瞩目的成果。
该项目的首席科学家顾钧教授提出的对计算机核心难解问题的快速大规模求解方法,被计算机理论的奠基人之一Steve Cook教授列为计算机核心难解问题的两大解法之一。在他的领导下,该项目的多个课题组使用他提出的多空间搜索与局部搜索等快速算法,在智能交通、金融计算、集成电路设计、多媒体传输、网络信息挖掘等多个领域都取得了令人瞩目的成果。这些成果已经部分转化到产业中,产生了巨大的经济效益和社会影响力。同时,该计划还为中国信息技术领域培养了大批人才。
中科院计算所承担了《基于Internet超大规模知识检索的算法及应用》,在顾钧教授和李国杰院士的领导下,面向大规模的因特网数据,以高性能、高准确度知识检索算法研究为目标,借鉴顾钧教授创立的高性能算法,形成了超大规模知识检索的新理论和新方法,以此为指导对因特网上的各类信息提供一致化的知识表达、检索、挖掘等工具,并在此基础上形成高效、准确、实用的知识检索机制。
在算法研究方面,课题组取得了国际公认成绩。2001年和2002年,课题组组队参加了美国国家标准与技术研究院组织的国际信息检索算法竞赛,取得了优异成绩。在2002年的竞赛中,该课题组集中选择参加了最体现实力的两个任务:大规模过滤和WEB检索。在大规模信息过滤的评测中,该课题组提交的3个系统,在所有评测指标中均包揽前3位。在高手云集的WEB检索任务中,该课题组提交的系统在给定的总共两组评测指标中分别名列第二和第三位。
这些研究成果同时对我国信息化应用起到很大的促进作用。一些成果被广泛应用于数字图书馆、电子政务、网格平台、国家互联网空间安全保障等国家重大项目中。