栏目文章信息

    数据库与信息处理 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 面向对象XML的对象迁移方法研究
    张晓琳 1,王国仁 2
    计算机工程与应用    2008, 44 (8): 161-163.  
    摘要2284)      PDF(pc) (551KB)(729)    收藏
    针对面向对象的XML数据的对象迁移问题,提出基于集中式和分布式两种存储模式下的对象迁移方法,解决了对象标识符模糊性问题。集中式存储模式对象的OID是唯一的,但是在集中式存储模式中更新已存在的对迁移对象的引用代价很大;分布式存储模式对象的OID是多重的,但对象迁移的代价相对较小。
    相关文章 | 多维度评价
    2. 基于资源的协作过滤推荐算法研究
    纪良浩,王国胤
    计算机工程与应用    2008, 44 (8): 164-168.  
    摘要2001)      PDF(pc) (874KB)(943)    收藏
    协作过滤是当今应用最为普遍的个性化推荐算法,然而数据的稀疏性和算法的可扩展性一直是协作过滤算法所面临的两大问题。提出了一种新的推荐算法——基于资源的协作过滤算法。该算法在对资源项目依内容划分的基础上,将用户—项目评分矩阵转换为用户—资源类别评分矩阵,然后对用户聚类,在目标用户所在的簇中寻找其最近邻居并产生推荐。实验表明,该算法不仅降低了数据的稀疏性和维度,缩小了目标用户最近邻的查找范围,算法的扩展性得到了有效改善,而且提高了最近邻的准确度,推荐精度较以往传统算法有明显提高。
    相关文章 | 多维度评价
    被引次数: Baidu(28)
    3. 基于ICA与聚类分析的支持向量机分类研究
    彭红毅 1,蒋春福 2,杜 明 3
    计算机工程与应用    2008, 44 (8): 169-171.  
    摘要1994)      PDF(pc) (545KB)(834)    收藏
    在ICA与聚类分析的基础上提出了一种改进的支持向量机分类模型——ICSVM模型。ICSVM模型中利用一种指标筛选算法与独立成分分析的方法将各数据指标转化为互相独立成分的数据指标。接着运用K-means方法对独立成分样本数据集进行聚类分析,再由获得的各子类中心数据构造初始的超平面,筛选出靠近初始超平面的支持类与亚支持类,并展开支持类与亚支持类中的样本数据点重新构造超平面,以便对数据进行分类。实验表明,对于样本比较多的数据集,与标准的SVM算法相比,ICSVM算法能够节约训练时间,同时能够提高分类的正确率。
    相关文章 | 多维度评价
    4. 一种新的预测性整像素搜索算法
    孙 岩 1,李绍滋 2
    计算机工程与应用    2008, 44 (8): 172-174.  
    摘要1828)      PDF(pc) (587KB)(759)    收藏
    运动估计是视频编码的重要组成部分,占整个编码器计算量的70%以上。通过分析实验结果,以及对一些经典模式的研究,提出了一种预测式整像素搜索算法。该算法结合了四边形和六边形搜索的优点。实验表明,该文算法以极小的搜索代价得到了与全搜索算法相当的效果,在搜索速度和搜索时间方面比经典算法有了很大提高。
    相关文章 | 多维度评价
    5. 一个分层的BLOG社区识别算法
    黄丽丽,陈华辉
    计算机工程与应用    2008, 44 (8): 175-178.  
    摘要2296)      PDF(pc) (737KB)(766)    收藏
    近年来,blog网站作为新型的网络媒体得到越来越多的个人和企业的关注。针对blog数据,提出了一种社区识别的算法。该算法认为具有相近兴趣、爱好的blogger会去阅读和评论类似的post,利用blog网站中各blogger对post的评论信息可以找出这些blogger因共同兴趣而形成的潜在社区。该算法分层识别blog空间中的社区,形成社区的层次结构。实验结果显示该算法是可行且有效的。
    相关文章 | 多维度评价
    6. Web日志会话的个性化识别方法的研究
    董志锋 1,陈俊杰 1,付裕峰 2
    计算机工程与应用    2008, 44 (8): 179-182.  
    摘要2402)      PDF(pc) (823KB)(791)    收藏
    会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,判断是否在极大、极小两个阈值范围内来识别会话。根据页面内容、站点结构确定页面重要程度,通过页面的信息容量确定用户正常的阅读时间,通过Web日志中页面下载时间来确定起始阅读时间,对以上因素进行综合后对该阈值进行调整。实验结果表明,相对于目前的对所有用户页面使用单一先验阈值进行会话识别的方法及使用针对用户页面的阈值动态调整方法,提出的方法能更准确地个性化确定出页面访问时间阈值,更为合理有效。
    相关文章 | 多维度评价
    被引次数: Baidu(50)
    7. 一种改进的分布式数据流查询操作放置算法
    柴宝杰
    计算机工程与应用    2008, 44 (8): 183-186.  
    摘要1761)      PDF(pc) (706KB)(804)    收藏
    在分布式数据流管理系统中,需要将查询操作放置到不同的处理结点执行。因此,如何放置查询操作成为分布式数据流管理研究的核心问题。Peter等人提出一种基于时延空间和弹簧张弛技术的查询操作放置算法,但是该算法假设查询操作之间数据流的流速不变,没有考虑数据流的流速与数据流查询操作之间的相关性。为此,通过分析不同的数据流查询操作与其输出的数据流的流速之间的关系,对Peter等人提出的算法加以改进,实验结果表明,改进后的算法可以有效地应用于分布式数据流管理系统。
    相关文章 | 多维度评价
    8. 一种基于聚类技术的个性化信息检索方法
    于洪涛,段军义,杜照丰
    计算机工程与应用    2008, 44 (8): 187-188.  
    摘要1975)      PDF(pc) (409KB)(834)    收藏
    实践证明聚类技术是改进搜索结果显示方式的一种有效手段。然而,目前的聚类方法没有考虑到用户兴趣,对于相同的查询,返回给所有用户同样的聚类结果。由此提出一种个性化聚类检索方法。该方法改进了k-means算法,利用该算法对传统搜索引擎返回的结果结合用户兴趣进行聚类,返回针对特定用户的网页簇。实验证明该方法能够提供个性化服务,改善了聚类的效果,提高了用户的检索效率。
    相关文章 | 多维度评价
    被引次数: Baidu(28)
    9. 演化数据流上的连续异常检测
    胡雪艳 1,苏 亮 2,高春鸣 1
    计算机工程与应用    2008, 44 (7): 174-178.  
    摘要2069)      PDF(pc) (1151KB)(980)    收藏
    基于滑动窗口的异常检测是数据流挖掘研究的一个重要课题,在许多应用中数据流通常在一个分布网络上传输,解决这类问题时常采用分布计算技术,以便获得实时高质量的计算结果。对分布演化数据流上连续异常检测问题,进行形式化地阐述,提出了两个基于核密度估计的异常检测定义和算法,并通过大量真实数据集的实验,表明该算法具有良好的高效性和可扩展性,完全适应数据流应用的需求。
    相关文章 | 多维度评价
    10. 一种连通非加权图的快速聚类方法
    崔 军,郭春艳,贾宗维
    计算机工程与应用    2008, 44 (7): 179-181.  
    摘要1796)      PDF(pc) (572KB)(822)    收藏
    图的聚类是数据聚类的一种很重要的变体,一方面通常可以用图来表示数据集中数据的相似度;另一方面对大型复杂网络的分析也引起人们越来越多地关注;而且对图进行聚类分析可以增强图的可视性,有助于可视化的分析、观测和导航。将最大最小方法的基本思想应用于非加权图的聚类,提出一种无向连通非加权图的快速聚类方法,该方法具有简单、聚类时间短、运行效率高、对于大型静态图的聚类具有良好的适应性等特点。
    相关文章 | 多维度评价
    11. 基于自动模板方法的汉语语义标注
    高研博,赵京雷,陆汝占
    计算机工程与应用    2008, 44 (7): 182-184.  
    摘要2076)      PDF(pc) (513KB)(832)    收藏
    在汉语的自然语言处理领域中,汉语的语义标注一直是一个重要的研究课题。在以往的研究中,大多使用手工的方式取得模板进行标注;采用抽取自动模板的方法,对汉语的语义进行标注,以解决对词的类别进行标注,以及对复合结构语义关系进行标注的问题。实验效果表明,对词的类别进行标注取得了在把维度降到363时的精确率为81.640 6%的结果;对复合结构语义关系之间的标注也取得了比以往工作有所改进的成果。
    相关文章 | 多维度评价
    被引次数: Baidu(1)
    12. 支持向量机多类分类算法新研究
    余 辉 1,赵 晖 1,2
    计算机工程与应用    2008, 44 (7): 185-189.  
    摘要1984)      PDF(pc) (897KB)(917)    收藏
    支持向量机最初是针对两类分类问题提出的,如何将其推广至多类分类问题是当前SVM研究中的热点问题之一。主要针对支持向量机多类分类方法中的分解重构法进行了深入分析,详细讨论了影响分类器性能的两个关键因素:分解策略和组合策略,并通过实验验证了该观点。最后,通过实验对比了包括M-ary 支持向量机和模糊支持向量机的SVM多类分类方法。
    相关文章 | 多维度评价
    13. 基于完全加权关联规则的局部反馈查询扩展
    黄名选 1,严小卫 2,3,张师超 2,3
    计算机工程与应用    2008, 44 (7): 190-192.  
    摘要1951)      PDF(pc) (545KB)(821)    收藏
    针对现有查询扩展存在的缺陷,将完全加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和扩展词权重的计算方法;提出基于完全加权关联规则挖掘的局部反馈查询扩展算法。该算法能自动从初检的前列文档中挖掘与原查询相关的完全加权关联规则,从规则中提取与原查询相关的扩展词,实现查询扩展。实验结果表明,与现有查询扩展算法比较,该查询扩展算法的检索性能得到很好的改善和提高。
    相关文章 | 多维度评价
    被引次数: Baidu(19)
    14. 不协调决策信息系统的约简
    陈鑫影,邱占芝
    计算机工程与应用    2008, 44 (7): 193-195.  
    摘要2009)      PDF(pc) (451KB)(805)    收藏
    知识约简是粗糙集理论中的一个重要内容,目前大多数研究都集中在协调的决策信息系统上。但现实中存在大量的不协调决策信息系统,针对该类系统的约简研究,将更具有实践意义。定义了决策包含度约简和最大决策包含度约简的概念,讨论了决策包含度约简和最大决策包含度约简的关系,即最大决策包含度约简弱于决策包含度约简,为解决不协调决策信息系统的知识约简问题提供了新方法。
    相关文章 | 多维度评价
    被引次数: Baidu(13)
    15. 中文问答系统中机构名的处理
    韦向峰 1,张 全 1,吴 晨 1,2,袁 毅 1
    计算机工程与应用    2008, 44 (7): 196-198.  
    摘要1940)      PDF(pc) (580KB)(729)    收藏
    探讨问句中机构名的处理,并服务于中文问答系统。采用概念层次网络理论的语义概念分析方法分析问句,去掉与机构名无关的概念词语,得到候选机构名。对机构名全称库按字索引,在库中搜索出与候选机构名匹配的机构名全称并按拟合权值排序。实验结果表明该方法识别机构名的正确率达到90.6%,支持对机构名简称的处理。
    相关文章 | 多维度评价
    被引次数: Baidu(8)
    16. Skyline计算研究综述
    朱 琳 1,关佶红 2,周水庚 1
    计算机工程与应用    2008, 44 (6): 160-165.  
    摘要3144)      PDF(pc) (1244KB)(1785)    收藏
    近年来,skyline计算以其在多目标决策、数据挖掘、数据库可视化等方面的潜在应用引起了越来越多研究者的关注。集中式skyline计算作为最早的研究重点得到了深入的研究,许多有效的skyline计算算法被提出来,例如BNL、NN、BBS等等。其中,BBS被认为是当前最佳的集中式skyline计算算法。分布式skyline计算的研究也取得了明显进展,已有的工作分别对面向分布式数据库、移动自组织网络和对等网络等的skyline计算进行了探索。Skyline计算还被扩展为其它更复杂的计算问题,包括任意子空间上的skyline,所有子空间上的skyline,k-支配的skyline,空间skyline计算等等。然而,迄今为止,国内外还没有一篇论文对skyline计算技术作过全面的分析与评述。对skyline计算技术进行系统的综述。在介绍已有代表性算法的基础上,通过分析它们的特点和比较它们的性能,总结了各算法的优势和不足,并指出了skyline计算的未来发展方向。
    相关文章 | 多维度评价
    17. 基于模型的不等间隔时间序列聚类算法研究
    张小涛 1,李翠玉 2
    计算机工程与应用    2008, 44 (6): 166-168.  
    摘要2317)      PDF(pc) (611KB)(865)    收藏
    现有的聚类算法一般只能处理以固定间隔表示的数据类型,而忽略了时间轴的变化。基于倒谱距离测度和自回归条件持续期(ACD)模型的聚类方法综合了计量模型的参数估计和聚类的非参无监督分类的优点,是一种适合处理不等间隔时间序列的技术。实验结果证明这种方法是有效的,从中得出的结论与市场微观结构理论也是相吻合的。
    相关文章 | 多维度评价
    18. 基于分类回归树CART的汉语韵律短语边界识别
    钱揖丽 1,2,荀恩东 3
    计算机工程与应用    2008, 44 (6): 169-171.  
    摘要1971)      PDF(pc) (600KB)(842)    收藏
    提出了一种基于分类回归树(Classification And Regression Tree,CART)的汉语韵律短语识别方法。该方法从语音流中提取与韵律短语边界有关的声学特征,从文本中提取短语边界的语言学特征,并将两类特征有机结合构成CART特征集,建立CART决策模型。开放测试结果显示,利用该CART模型在词边界中识别韵律短语边界,其识别准确率平均可达95.91%。
    相关文章 | 多维度评价
    19. 基于模糊近似推理的Vague集双向近似推理方法
    石玉强 1,王鸿绪 2
    计算机工程与应用    2008, 44 (6): 172-174.  
    摘要1935)      PDF(pc) (334KB)(764)    收藏
    给出由有限论域上的Vague集导出的分拆真模糊向量和分拆非假模糊向量的定义。进而得到Vague集近似推理的真近似推理模型和非假近似推理模型。最后得到Vague集正向近似推理结论和逆向近似推理结论。实例表明这种Vague集双向近似推理方法是可行的。
    相关文章 | 多维度评价
    20. 基于粗糙集理论的不完备数据填补方法
    孟 军 1,2,刘永超 2,莫海波 1
    计算机工程与应用    2008, 44 (6): 175-177.  
    摘要2474)      PDF(pc) (530KB)(884)    收藏
    ROUSTIDA算法具有较好的数据填补能力,但依然会出现一些不完备信息。利用了可扩充辨识所反映的对象间的属性差异信息,对遗失属性进行填充,从而使改进后的ROUSTIDA算法的填充能力得到了很大的改善,同时还具备了初步排除噪声数据的能力,在性能上也有了很大的提高,实验表明改进的算法具有很好的实用价值。
    相关文章 | 多维度评价
    21. 基于最近共享邻居节点的K-means聚类算法
    单世民,于 红,张业嘉诚,刘馨月
    计算机工程与应用    2008, 44 (6): 178-181.  
    摘要2283)      PDF(pc) (700KB)(836)    收藏
    聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索中心点,依据中心点查找数据集个数,为K-means聚类提供参数。从而克服了K-means需要人工设定聚类个数的问题,同时具有较好的全局收敛性。实验证明KSNN算法比K-means、粒子群K-means(pso)以及多中心聚类算法(MCA)有更好的聚类效果。
    相关文章 | 多维度评价
    被引次数: Baidu(3)
    22. 带特征权重的混合特征模糊C均值算法
    谢信喜,王士同
    计算机工程与应用    2008, 44 (6): 182-183.  
    摘要1781)      PDF(pc) (290KB)(821)    收藏
    针对模糊数据,Hathaway提出了模糊C均值算法(FCM);针对符号数据,El-Sonbaty 和Ismail提出了符号数据模糊C均值算法(FSCM);Miin-Shen Yang等人对FSCM进行了改进,提出了混合特征的模糊C均值算法(MVFCM),MVFCM比FSCM更有效更具有实用性。在MVFCM的基础上,给出了带特征权重的混合特征的模糊C均值算法(WMVFCM),并通过实验比较,说明WMVFCM比MVFCM更有效。
    相关文章 | 多维度评价
    23. 基于概念图的用户兴趣查询扩展模型的研究
    牟力科,张 蕾,张晓孪
    计算机工程与应用    2008, 44 (6): 184-186.  
    摘要1847)      PDF(pc) (568KB)(758)    收藏
    查询扩展是信息检索技术研究的一个重要组成部分。目前的查询扩展是基于统一的用户模型,没有考虑到用户的个人兴趣,这对查询扩展的精确度造成了一定的影响。分析了产生这种问题的原因,提出了基于概念图的用户兴趣扩展模型,通过该模型来有效提高查询扩展的精确度。实验显示,该方法能有效提高查询的查全率和查准率。
    相关文章 | 多维度评价
    被引次数: Baidu(17)
    24. 一种挖掘多维序列模式的有效方法
    肖仁财,薛安荣
    计算机工程与应用    2008, 44 (6): 187-190.  
    摘要1934)      PDF(pc) (597KB)(845)    收藏
    提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项集,由得到的频繁1-项集开始,循环的由频繁( k-1)-项集( k>1)连接生成频繁 k项集,从而得到所有的多维模式。该算法通过扫描不断缩小的频繁( k-1)-项集来生成频繁 k项集,减少了扫描投影数据库的次数,因而减少了时间开销,实验表明该算法有较高的挖掘效率。
    相关文章 | 多维度评价
    被引次数: Baidu(18)
    25. 基于用户日志的本体进化
    郭 臻,徐德智,汪智勇
    计算机工程与应用    2008, 44 (6): 191-195.  
    摘要2136)      PDF(pc) (925KB)(764)    收藏
    本体作为语义网的基石,发挥着越来越重要的作用。本体进化的目的在于动态调整本体以适应环境的变化。从基于领域本体的用户日志出发,使用Aporior算法挖掘用户操作的频繁项集和频繁路径。通过对频繁项集和频繁路径的分析,得到了本体进化的辅助建议,并在实验中对该方法进行了实现和测试,实验结果证明该方法能有效地实现本体进化。
    相关文章 | 多维度评价
    被引次数: Baidu(8)
    26. 快速的支持向量机多类分类研究

    官 理1,祖 峰2,唐文胜1

    计算机工程与应用    2008, 44 (5): 177-179.  
    摘要2286)      PDF(pc) (544KB)(895)    收藏
    研究了支持向量机多类算法DAGSVM(Direct Acyclic Graph SVM)的速度优势,提出了结合DAGSVM和简化支持向量技术的一种快速支持向量机多类分类方法。该方法一方面减少了一次分类所需的两类支持向量机的数量,另一方面减少了支持向量的数量。实验采用UCI和Statlog数据库的多类数据,并和四种多类方法进行比较,结果表明该方法能有效地加快分类速度。
    相关文章 | 多维度评价
    被引次数: Baidu(32)
    27. n-Gram/2L索引结构的存储与时间优化算法
    刘凤晨 1,刘庆文 2,胡 玥 2,黄 河 1
    计算机工程与应用    2008, 44 (5): 180-183.  
    摘要2539)      PDF(pc) (809KB)(752)    收藏
    对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法 n-Gram/2LZ( n-Gram/2L on Zigzag join)。在对数据量较大的文章进行检索和索引时,该算法在保留原有算法特性的基础上进一步减少了索引冗余,降低了索引的存储量,同时对查询算法的优化降低了查询时的系统开销,并且减少索引中记录访问次数,提高了查询效率。
    相关文章 | 多维度评价
    28. 基于小生境遗传算法的连续属性关联规则挖掘

    杨光军1,王丽丽2

    计算机工程与应用    2008, 44 (5): 184-186.  
    摘要2039)      PDF(pc) (584KB)(653)    收藏
    对连续属性数据进行关联规则提取是一个重要的课题,构造了一种新的遗传算法模型,在结构上采用三段式染色体,将连续属性离散化、属性约简和关联规则提取集成在一起,并将小生境引入到遗传算法中避免“早熟”现象。实验表明了该算法是有效的。
    相关文章 | 多维度评价
    被引次数: Baidu(11)
    29. 文本分类中词语权重计算方法的改进与应用
    熊忠阳,黎 刚,陈小莉,陈 伟
    计算机工程与应用    2008, 44 (5): 187-189.  
    摘要2469)      PDF(pc) (508KB)(1071)    收藏
    文本的形式化表示一直是信息检索领域关注的基础性问题。向量空间模型(Vector Space Model)中的tf.idf文本表示是该领域里得到广泛应用,并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一。但是其IDF的计算,并没有考虑到特征项在类间的分布情况,也没有考虑到在类内分布相对均匀的特征项的权重应该比分布不均匀的要高,应该赋予其较高的权重。用改进的TFIDF选择特征词条、用KNN分类算法和遗传算法训练分类器来验证其有效性,实验表明改进的策略是可行的。
    相关文章 | 多维度评价
    被引次数: Baidu(84)
    30. 基于Cache的数据挖掘专用数据访问组件
    黄晓霞 1,程 论 2,黄有方 3
    计算机工程与应用    2008, 44 (5): 190-193.  
    摘要1951)      PDF(pc) (778KB)(852)    收藏
    介绍了数据挖掘算法的两种传统数据访问方式及其缺点,提出了新的数据访问方式——基于Cache的数据挖掘算法的数据访问方法,该方法提供了三种模式缓存数据:单列模式、多列模式、混合模式,以适用多种数据挖掘算法的需要。设计实现了这种数据挖掘专用数据访问组件,该组件兼顾了传统访问方式的优点,实验证明在占用有限系统资源的情况下,保证了高效的数据访问效率并支持对海量数据的访问。
    相关文章 | 多维度评价
    31. 一种新的基于AUC的多类分类评估方法
    秦 锋,罗 慧,程泽凯,任诗流
    计算机工程与应用    2008, 44 (5): 194-196.  
    摘要2647)      PDF(pc) (508KB)(1119)    收藏
    基于ROC曲线分析的AUC方法最初用于评估二类分类,不能直接解决多类别的评估,如何有效地将其推广到多类别评估中是研究的热点问题。首先介绍一种基于一对多方法的多类别AUC评估方法F-AUC,在此基础上根据二叉树的构造思想提出一种新的多类别评估方法B-AUC。该方法在MBNC实验平台上编程实现,并和F-AUC方法进行比较和分析,结果表明该方法是可行的,在评估效果和速度效果上有良好的性能。
    相关文章 | 多维度评价
    被引次数: Baidu(15)
    32. 一种提高K-近邻算法效率的新算法
    陆微微,刘 晶
    计算机工程与应用    2008, 44 (4): 163-165.  
    摘要2412)      PDF(pc) (649KB)(843)    收藏
    K-近邻(K-Nearest-Neighbor,KNN)算法是一种最基本的基于实例的学习方法,被广泛应用于机器学习与数据挖掘。其学习过程只是简单地存储已知的训练数据。当遇到新的查询实例时,一系列相似的实例被从存储器中取出,并用来分类新的查询实例。KNN的一个不足是分类新实例的开销可能很大。这是因为几乎所有的计算都发生在分类时,而不是在第一次遇到训练实例时。所以,如何有效地索引训练实例,以减少查询时所需计算是一个重要的实践问题。为解决这个问题,提出了一种新的算法。该算法把部分原本发生在分类阶段的计算移到训练阶段来完成。实验表明,算法能够提高KNN效率80%以上。此外,算法的思想还可以应用于KNN的所有变体中。
    相关文章 | 多维度评价
    33. 基于ICA与SOM的不完整数据处理
    奉国和 1,5,彭红毅 2,蒋春福 3,杜 明 4
    计算机工程与应用    2008, 44 (4): 166-168.  
    摘要2077)      PDF(pc) (635KB)(692)    收藏
    介绍了数据挖掘中不完整数据的研究现状及ICA与SOM的特点,提出了基于ICA与SOM的不完整数据的处理模型IVS-IDH,研究了数据之间存在相关关系且为非高斯分布时不完整数据的处理方法,在SOM基础上取得了不完整数据集的可视化分析结果,从而克服了Wang S提出的不完整数据处理方法的不足。
    相关文章 | 多维度评价
    34. 广义模糊粗糙集在模糊信息约简中的应用
    赵越岭 1,王英丽 2
    计算机工程与应用    2008, 44 (4): 169-171.  
    摘要1967)      PDF(pc) (505KB)(750)    收藏
    针对数据集为模糊值时冗余信息难于消除的问题,提出了基于模糊相似关系的广义模糊粗糙集与QuickReduct算法相结合的方法。利用广义模糊粗糙集数据相似程度对属性值为实数值的数据集合进行约简,不需要预先对原始数据集合进行离散化,约简结果能更完整地反映原信息系统的分类能力。同时算法中利用了启发式信息,使模糊依赖性增加较快的属性作为最小约简。计算实例验证了该方法的有效性。
    相关文章 | 多维度评价
    35. 一种基于Lucene改进的全文检索工具包
    宋 佳 1,2,诸云强 1,刘润达 1,2
    计算机工程与应用    2008, 44 (4): 172-175.  
    摘要2640)      PDF(pc) (861KB)(873)    收藏
    基于Lucene实现了一种改进的全文检索引擎工具包ELucene。它引入了索引配置文件,可针对不同应用背景来灵活定制索引的细节;提供了定时自动更新索引的功能;通过动态多态机制实现了支持多种索引数据源的功能;ELucene内部设计了引擎基础对象类,并以静态对象的方式运行来避免频繁读取索引文件带来的性能损失。面向检索,提供了检索请求类和检索响应类来分别封装用户的查询要求和查询结果集,并设计实现了一些实用的查询输入和输出处理的方法。基于ELucene的元数据搜索系统已成功应用到“国家科学数据共享工程:地球系统科学数据共享网”中。
    相关文章 | 多维度评价
    被引次数: Baidu(88)
    36. 基于轮廓特征的印刷公式粘连符号的切分
    田学东,张 艳,王 亮
    计算机工程与应用    2008, 44 (4): 176-178.  
    摘要2132)      PDF(pc) (504KB)(873)    收藏
    在印刷体数学公式识别中,不能准确地切分粘连符号是造成识别错误的主要原因之一。针对这种情况,提出了一种基于轮廓特征切分粘连符号的方法。根据轮廓特征及宽高比形成切分路径,然后对粘连字符切分。实验表明,这种方法使识别率得到了明显提高。
    相关文章 | 多维度评价
    被引次数: Baidu(3)
    37. 基于可信验证的DBMS访问控制模型
    牟亚莉 1,2,曾 浩 3
    计算机工程与应用    2008, 44 (4): 179-181.  
    摘要1945)      PDF(pc) (487KB)(731)    收藏
    针对目前访问控制模型在系统的安全实现方面存在的不足,在RABC的基础上,提出了可信操作环境下基于可信验证的DBMS访问控制模型,该模型满足系统的保密性和完整性需求,最大程度实现信息双向流动,同时支持最小特权安全特性,是一个权限分配灵活的访问控制模型。
    相关文章 | 多维度评价
    38. 基于多智能体的融合Sarsa( λ)学习算法
    薛丽华,殷苌茗,李立云,胡明辉
    计算机工程与应用    2008, 44 (4): 182-183.  
    摘要2049)      PDF(pc) (441KB)(830)    收藏
    强化学习作为一种重要的机器学习方法,已经被广泛应用于许多单智能体和多智能体系统。强化学习的性能受所使用的学习算法及其参数的影响很大,不同的学习算法或者参数很小的变化都可能导致学习性能很大的变化。当环境模型未知时,确定最好的算法和最优的参数是困难的。为了避免参数的影响,提出了一种基于多Agent的融合Sarsa( λ)学习系统,它把强化学习环境当作多智能体环境来处理。最后用迷宫实验仿真,结果验证了该方法的可行性和有效性。
    相关文章 | 多维度评价
    39. 自优化查询处理器的研究与实现
    李 健,施 磊,柏文阳
    计算机工程与应用    2008, 44 (4): 184-186.  
    摘要2055)      PDF(pc) (620KB)(740)    收藏
    自主管理是目前数据库系统亟需解决的重要问题之一,解决数据库系统自主管理的核心是使得系统能够自动调度资源,以达到系统运行优化的目标。提出并实现了一个自优化查询处理器模型SMO,该模型能够对实际查询结果进行分析,自动调整统计信息,从而准确估计查询开销,提供更优执行计划,增强系统的稳定性。
    相关文章 | 多维度评价
    被引次数: Baidu(2)
    40. 基于用户兴趣的搜索结果动态聚类算法
    李 营 1,2,王儒敬 1,2,王大为 1,2,魏保子 1,2
    计算机工程与应用    2008, 44 (4): 187-189.  
    摘要2449)      PDF(pc) (617KB)(828)    收藏
    目前搜索引擎返回的结果往往比较多,而且各类文档混合在一起,没有针对性,使用者仍然需要花费大量时间来寻找自己感兴趣的文档。提出了一种对搜索结果动态聚类算法,利用用户的兴趣特点,从搜索结果的文档中抽取摘要,利用这种摘要随着用户的浏览进程进行动态聚类,将这些文档聚成不同类别。用户只需要找出自己感兴趣类别,便可以得到足够多感兴趣的文档。实验证明,这种方法是有效的,并具有抗噪声等良好性能。
    相关文章 | 多维度评价