计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (36): 160-163.
赵海霞1,李道申1,刘 勇1,赵嘉诚2
ZHAO Haixia1, LI Daoshen1, LIU Yong1, ZHAO Jiacheng2
摘要: Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。