XML文档语义检索方法研究

计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (11): 121-125.

• 数据库、数据挖掘、机器学习 • 上一篇下一篇

XML文档语义检索方法研究

莫正波1，宋玲2，吕强3，邓薇4

1.青岛理工大学理学院，山东青岛 266033
2.山东建筑大学计算机科学与技术学院，济南 250101
3..国网技术学院电网检修培训部，济南 250002
4.山东科技大学基础课部，山东泰安 271021

出版日期:2013-06-01 发布日期:2013-06-14

Research on XML semantic retrieval

MO Zhengbo 1, SONG Ling2, LV Qiang3, DENG Wei4

1.School of Science, Qingdao Technological University, Qingdao, Shandong 266033, China
2.School of Computer Science and Technology, Shandong Jianzhu University, Jinan 250101, China
3.Department of Power Grid Maintenance Training, State Grid of China Technology College, Jinan 250002, China
4.Basic Courses Department, Shandong University of Science and Technolagy, Tai’an, Shandong 271021, China

Online:2013-06-01 Published:2013-06-14

摘要/Abstract

摘要： 由于半结构文档如XML越来越广泛的应用，在数据库和信息检索领域，对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q，XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索，提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步：基于WordNet对用户查询q进行同义词扩展得到q'；将q'和D中的每一篇XML文档都进行数字签名，并通过签名之间的匹配对D进行有效过滤，除去大量不符合用户查询的文档，得到一个文档子集D'，[D'?D]；对q'与D'中的文档进行精确匹配得到检索结果。

关键词: 可扩展标示语言（XML）, 半结构文档, 相似度

Abstract: With more and more application of semi-structure data, the research of XML document similarity becomes essential in the database and information retrieval communities. Given set of XML documents D and the user query q, XML retrieval is to find out the XML documents from the D which satisfies q. In order to search efficiently, a new approach is presented to calculate similarity between two XML documents. The approach is divided into three steps. The user’s query q is expanded to q' by including the synonyms of q based on WordNet. q' and each XML document in D are allocated to digital signatures. After eliminating the irrelevant documents in D according to the signatures matching, a subset D' of D is got. Precise matching between q and D' is presented and final results are got.

Key words: Extensive Makeup Language（XML）, semi-structure data, similarity

莫正波1，宋玲2，吕强3，邓薇4. XML文档语义检索方法研究[J]. 计算机工程与应用, 2013, 49(11): 121-125.

MO Zhengbo 1, SONG Ling2, LV Qiang3, DENG Wei4. Research on XML semantic retrieval[J]. Computer Engineering and Applications, 2013, 49(11): 121-125.

[1]	张岐山，陈露露. 基于均衡接近度灰关联的Slope One算法[J]. 计算机工程与应用, 2021, 57(9): 96-102.
[2]	王永贵，李倩玉. 基于KNN-GBDT的混合协同过滤推荐算法[J]. 计算机工程与应用, 2021, 57(9): 103-108.
[3]	张松灿，普杰信，司彦娜，孙力帆. 基于种群相似度的自适应改进蚁群算法及应用[J]. 计算机工程与应用, 2021, 57(8): 70-77.
[4]	张晓闻，任勇峰. 结合稀疏表示与拓扑相似性的图像匹配算法[J]. 计算机工程与应用, 2021, 57(8): 198-203.
[5]	杨芳，尹曦，司建辉，刘宏媛，汪雪. 基于侧重点聚类的数学表达式相似度计算方法[J]. 计算机工程与应用, 2021, 57(6): 88-93.
[6]	钱芸芸，杨文忠，姚苗，李海磊，柴亚闯. 融合主题相似度权重的主题社区发现模型[J]. 计算机工程与应用, 2021, 57(5): 107-114.
[7]	田维安，陈红梅，周丽华. 基于相似用户好奇心的多样性推荐方法[J]. 计算机工程与应用, 2021, 57(23): 113-121.
[8]	梁田，曹德欣. 基于莱维飞行的改进简化粒子群算法[J]. 计算机工程与应用, 2021, 57(20): 188-196.
[9]	刘莉. 基于用户多样性偏好的top-N推荐算法[J]. 计算机工程与应用, 2021, 57(17): 116-121.
[10]	杨延娇，赵国涛，王丕栋. 基于语义与情感的句子相似度计算方法[J]. 计算机工程与应用, 2021, 57(16): 151-158.
[11]	赵琪，杜彦辉，芦天亮，沈少禹. 基于Capsule-BiGRU的文本相似度分析算法[J]. 计算机工程与应用, 2021, 57(15): 171-177.
[12]	乔伟涛，黄海燕，王珊. 基于Transformer编码器的语义相似度算法研究[J]. 计算机工程与应用, 2021, 57(14): 158-163.
[13]	张振海，张湘婷. 上下文感知的高铁信息服务推荐方法研究[J]. 计算机工程与应用, 2021, 57(12): 231-236.
[14]	曾海燕，左开中，王永录，刘蕊. 路网环境下的语义多样性位置隐私保护方法[J]. 计算机工程与应用, 2020, 56(7): 102-108.
[15]	魏玮，张芯月，朱叶. 改进的SIFT结合余弦相似度的人脸匹配算法[J]. 计算机工程与应用, 2020, 56(6): 207-212.

XML文档语义检索方法研究

Research on XML semantic retrieval

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics