基于启发式查询词选择算法的Hidden Web获取研究

计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (34): 174-176.

基于启发式查询词选择算法的Hidden Web获取研究

姚全珠,杨增辉,张楠,田元

西安理工大学计算机学院，西安 710048

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-12-01 发布日期:2007-12-01
通讯作者: 姚全珠

Research on crawling Hidden Web based on heuristic query selection algorithm

YAO Quan-zhu,YANG Zeng-hui,ZHANG Nan,TIAN Yuan

School of Computer Science，Xi’an University of Technology，Xi’an 710048，China

Received:1900-01-01 Revised:1900-01-01 Online:2007-12-01 Published:2007-12-01
Contact: YAO Quan-zhu

摘要/Abstract

摘要： Hidden Web因为其隐蔽性而难以直接抓取，因此成为信息检索研究的一个新领域。提出了一种获取Hidden Web信息的方法，讨论了实现的关键技术。通过设计提出的启发式查询词选择算法，提高了抓取的效率。实验证明了该模型和算法的有效性。

关键词: 信息检索, Hidden Web, 爬虫, 启发式算法

Abstract: Because of the hidden feature，Hidden Web is hard to crawl.It becomes a new direction in the field of information retrieval.In this paper a new method of Hidden Web information retrieval is proposed.It presents a generic operational model of the Hidden Web information retrieval and describes the key techniques.It introduces a new heuristic query selection algorithm which designed by this paper.Based on this technique，the crawling is more efficient.Experiments show the effectiveness of both the model and the algorithm.

Key words: information retrieval, Hidden Web, crawler, heuristic algorithm

姚全珠,杨增辉,张楠,田元. 基于启发式查询词选择算法的Hidden Web获取研究[J]. 计算机工程与应用, 2007, 43(34): 174-176.

YAO Quan-zhu,YANG Zeng-hui,ZHANG Nan,TIAN Yuan. Research on crawling Hidden Web based on heuristic query selection algorithm[J]. Computer Engineering and Applications, 2007, 43(34): 174-176.

[1]	张呈玲，李进金，林艺东. 基于OE-概念格的形式背景属性约简[J]. 计算机工程与应用, 2021, 57(15): 82-89.
[2]	孟鑫，杨琴，郝婷婷，张洁，曹策俊. 不同订单分配和算法下的拣货路径优化组合[J]. 计算机工程与应用, 2020, 56(23): 229-236.
[3]	李雅丽，王淑琴，陈倩茹，王小钢. 若干新型群智能优化算法的对比研究[J]. 计算机工程与应用, 2020, 56(22): 1-12.
[4]	易成岐，郭鑫，童楠楠，窦悦，陈东，王建冬. 基于启发式社团发现模型的创新态势研判算法[J]. 计算机工程与应用, 2020, 56(15): 74-79.
[5]	胡晓敏，梁天毅，王明丰，李敏. 新型树启发式搜索算法的机器人路径规划[J]. 计算机工程与应用, 2020, 56(11): 164-171.
[6]	迟宗正，董绍正，郭童，任志磊，周宽久，郭禾. 求解风力发电机布局问题的超启发式算法研究[J]. 计算机工程与应用, 2019, 55(7): 220-225.
[7]	尚正阳1，顾寄南2，唐仕喜2，孙晓红2. 高效求解三维装箱问题的剩余空间最优化算法[J]. 计算机工程与应用, 2019, 55(5): 44-50.
[8]	侯屿1，2，秦小林2，彭皓月1，2，张力戈1，2. 全局调距和声特征选择算法[J]. 计算机工程与应用, 2019, 55(2): 21-27.
[9]	张钧，贺可太. 求解三维装箱问题的混合遗传模拟退火算法[J]. 计算机工程与应用, 2019, 55(14): 32-39.
[10]	汪岿1，费晨杰1，刘柏嵩1，2. 融合LDA的卷积神经网络主题爬虫研究[J]. 计算机工程与应用, 2019, 55(11): 123-128.
[11]	刘竹松，李生. 正余混沌双弦鲸鱼优化算法[J]. 计算机工程与应用, 2018, 54(7): 159-163.
[12]	张瑞芳1，郭克华1，2. 面向个性化站点的用户检索意图建模方法[J]. 计算机工程与应用, 2018, 54(6): 37-43.
[13]	王长宝1，杨习贝1，2，窦慧莉1，陈向坚1，王平心3. 邻域决策错误率的局部约简方法研究[J]. 计算机工程与应用, 2018, 54(6): 95-99.
[14]	吴伟民，李泽熊，林志毅，吴汪洋，方典禹. 飞蛾纵横交叉混沌捕焰优化算法[J]. 计算机工程与应用, 2018, 54(3): 136-141.
[15]	王转，裴泽平. 启发式路径下节约里程的订单分批算法[J]. 计算机工程与应用, 2018, 54(23): 203-209.