基于遗传算法和舍伍德思想的双数组Trie树改进

doi:10.3778/j.issn.1002-8331.2009.29.038

计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (29): 128-130.DOI: 10.3778/j.issn.1002-8331.2009.29.038

• 数据库、信号与信息处理 • 上一篇下一篇

基于遗传算法和舍伍德思想的双数组Trie树改进

王世昆，李绍滋，柯逍

厦门大学智能科学与技术系，福建厦门 361005

收稿日期:2008-06-02 修回日期:2008-08-18 出版日期:2009-10-11 发布日期:2009-10-11
通讯作者: 王世昆

Double-array Trie based on genetic algorithm and idea of Sherwood

WANG Shi-kun，LI Shao-zi，KE Xiao

Department of Cognitive Science，Xiamen University，Xiamen，Fujian 361005，China

Received:2008-06-02 Revised:2008-08-18 Online:2009-10-11 Published:2009-10-11
Contact: WANG Shi-kun

摘要/Abstract

摘要： 对汉语信息处理中常常要涉及汉语词典查询，当所涉及的词典规模较为庞大时如何快速访问词典以获取词语知识便成为了一个需重点解决的问题。将阐述一种简单快捷的基于双数组Trie（Double-Array Trie）原理的词典查询机制。该算法的查询时间为O（n）的线性时间（n为查询词条的长度），由此可见双数组算法在时间上存在着明显优势，但在空间耗费上却存在着浪费现象。前人提出了一些解决方案，其中主要的有：在构造双数组时采用一种启发式排序策略，即每一次都先处理当前分支节点最多的活动节点。考虑到这种启发式思想为确定性算法，容易陷入局部最优陷阱之中，因此在这种思想的基础上引入了舍伍德随机思想和遗传算法中常常运用到的变异思想，在改进算法空间利用率的同时也使得算法跳出了局部最优解的陷阱。

关键词: 双数组索引, 舍伍德随机思想, 遗传算法, 变异

Abstract: In the Chinese information processing Chinese dictionary is enquired.When involved in a large scale of dictionary，how fast the visit to obtain knowledge of words will become a need to focus on resolving problems.This paper will outline a simple and efficient mechanism which is based on double-array Trie principle for the dictionary.For enquiries about the time of the algorithm is O（n）of linear time（n is the length of term enquiries）.This shows that there is a clear advantage in double-array Trie.But there is a serious waste in storage of double-array Trie.Predecessors put forward some solutions.One of the major：Using a heuristic sort strategy.That is，each time the active node is dealt with first which has the largest branch nodes.Considering that such solution is a heuristic algorithm for deterministic algorithm，it will be easy to catch the trap of local optimal solution.On the basis of that kind of mentality，this paper introduces the idea of Sherwood random thoughts and mutation of genetic algorithms to improve the performance of double-array Trie.

Key words: Double-Array Trie（DAT）, Sherwood algorithms, genetic algorithms, mutation

中图分类号:

TP311

王世昆，李绍滋，柯逍. 基于遗传算法和舍伍德思想的双数组Trie树改进[J]. 计算机工程与应用, 2009, 45(29): 128-130.

WANG Shi-kun，LI Shao-zi，KE Xiao. Double-array Trie based on genetic algorithm and idea of Sherwood[J]. Computer Engineering and Applications, 2009, 45(29): 128-130.

[1]	邹杰，李俊. 多策略协方差矩阵学习差分进化算法[J]. 计算机工程与应用, 2021, 57(7): 78-87.
[2]	李昱奇，刘志乾，程凝怡，王莹莹，朱春丽. 多约束条件下无人机航迹规划[J]. 计算机工程与应用, 2021, 57(4): 225-230.
[3]	杨玮，吴莹莹，王婷. 子母式穿梭车仓储系统配置优化问题研究[J]. 计算机工程与应用, 2021, 57(4): 258-265.
[4]	张伟康，刘升，任春慧. 混合策略改进的麻雀搜索算法[J]. 计算机工程与应用, 2021, 57(24): 74-82.
[5]	李倩，蒋丽，梁昌勇. 基于模糊时间窗的多目标冷链配送优化[J]. 计算机工程与应用, 2021, 57(23): 255-262.
[6]	李守玉，何庆，杜逆索. 分段权重和变异反向学习的蝴蝶优化算法[J]. 计算机工程与应用, 2021, 57(22): 92-101.
[7]	温泽宇，谢珺，谢刚，续欣莹. 基于新型拥挤度距离的多目标麻雀搜索算法[J]. 计算机工程与应用, 2021, 57(22): 102-109.
[8]	杜守信，毋涛. 双种群混合遗传算法的裁剪分床应用研究[J]. 计算机工程与应用, 2021, 57(22): 182-189.
[9]	任春慧，刘升，张伟康，张微微. 柯西变异的骆驼算法优化与应用[J]. 计算机工程与应用, 2021, 57(21): 87-94.
[10]	曹立佳，刘洋. 制造车间自动导引车调度新进展[J]. 计算机工程与应用, 2021, 57(21): 59-67.
[11]	陈倩茹，李雅丽，许科全，刘铱龙，王淑琴. 自调优自适应遗传算法的WKNN特征选择方法[J]. 计算机工程与应用, 2021, 57(20): 164-171.
[12]	石宇强，田永政，张雨琦，石小秋. 运用含复杂网络结构的多种群遗传算法求解FJSP[J]. 计算机工程与应用, 2021, 57(2): 257-266.
[13]	陈雷，尹钧圣. 高斯差分变异和对数惯性权重优化的鲸群算法[J]. 计算机工程与应用, 2021, 57(2): 77-90.
[14]	万达，李俊. 锦标赛精英学习与协方差变异的烟花算法[J]. 计算机工程与应用, 2021, 57(19): 84-96.
[15]	周原令，胡晓兵，江代渝，李航. 基于改进NSGA-II的车间排产优化算法研究[J]. 计算机工程与应用, 2021, 57(19): 274-281.

基于遗传算法和舍伍德思想的双数组Trie树改进

Double-array Trie based on genetic algorithm and idea of Sherwood

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics