栏目文章信息

    数据库、数据挖掘、机器学习 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于KNN算法的改进的一对多SVM多分类器
    刘雨康,张正阳,陈琳琳,陈 静
    计算机工程与应用    2015, 51 (24): 126-131.  
    摘要2840)      PDF(pc) (598KB)(1082)    收藏
    针对传统支持向量机(SVM)多分类一对多算法存在的运算量大、耗时长、数据偏斜以及对最优超平面附近点分类易出错问题,提出了一种改进方法。将数据空间分为密集区和稀疏区,各类中密集点归于密集区,其余归于稀疏区。将每类中密集点连同它附近的点用于训练得到相应的SVM分类器。在测试阶段,对密集区的待测样本用传统的一对多判别准则来做类别预测;对稀疏区的待测样本则采用K近邻(KNN)算法。数值实验结果表明,改进的算法在耗时和分类精度上都优于原算法,对解决一对多算法存在的问题有较好的成效。
    相关文章 | 多维度评价
    2. 基于BaseX数据库的OWL本体存储查询研究
    胡甜甜,曹 旻
    计算机工程与应用    2015, 51 (24): 132-136.  
    摘要2115)      PDF(pc) (560KB)(854)    收藏
    针对目前基于关系型数据库等存储模式的本体存储查询效率较低的情况,提出使用XML数据库BaseX进行本体的存储,并设计了相应的本体存储查询架构。在对BaseX存储结构与接口的研究基础上,实现对OWL本体的存储。利用BaseX的查询接口和XQuery查询语言对OWL本体进行检索,在建立推理规则库基础上,实现本体查询扩展与推理。实验将提出的存储查询方法与基于关系型数据库的存储查询方法进行对比,验证了提出的方法具备高效的存储查询性能,同时具备本体查询的推理能力。
    相关文章 | 多维度评价
    3. 二元语义互补判断矩阵的相容性及排序研究
    蔡久顺,张执国,师 鹏,张小刚
    计算机工程与应用    2015, 51 (24): 137-140.  
    摘要1666)      PDF(pc) (528KB)(451)    收藏
    为了衡量二元语义互补判断矩阵之间的差异程度, 对其相容性进行了研究,给出了判断两个二元语义互补判断矩阵是否相容的指标,并提出一种新的排序方法。定义了二元语义的相容度和二元语义互补判断矩阵的相容度,研究了两者的性质,给出了二元语义互补判断矩阵的相容性指标,进而确定专家权重,并结合二元语义的集结算子,得到每一方案优于其他方案的程度并排序。通过实例验证了该方法的有效性和实用性。
    相关文章 | 多维度评价
    4. 基于流形学习和支持向量机的太赫兹谱分类
    刘 坤,李 飚,曾祥鑫
    计算机工程与应用    2015, 51 (24): 141-144.  
    摘要1143)      PDF(pc) (580KB)(496)    收藏
    太赫兹时域光谱技术是一门新兴光谱检测技术,广泛应用于安检及反恐、生物医学和食品质量检测等方面。太赫兹谱的分类识别技术是太赫兹光谱检测技术的一个重要环节。由于受到噪声的影响,太赫兹谱可能在高维空间中成复杂的非线性分布,传统的分类方法难以取得理想的分类效果。流形学习和支持向量机都是当前机器学习领域的研究热点,都采取了核方法来解决非线性问题,正因为两者之间有很多共通之处,将这两种方法充分结合提出了一种称之为ISOMAP-SVM的新算法。这种新算法拥有比传统的支持向量机算法更快的训练速度和更好的分类效果。实验结果表明利用新算法可以实现对不同种类药品的识别,为太赫兹光谱技术用于药品的检测和识别提供了一种新的有效方法。
    相关文章 | 多维度评价
    5. 基于有序树的不确定数据最大频繁项挖掘算法
    刘卫明1,2,蒯海龙1,陈志刚3,毛伊敏1,4
    计算机工程与应用    2015, 51 (24): 145-149.  
    摘要1465)      PDF(pc) (587KB)(411)    收藏
    针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。
    相关文章 | 多维度评价
    6. 粗糙support-intuitionistic模糊集及其聚类分析应用
    梁晨成,杨 勇
    计算机工程与应用    2015, 51 (24): 150-153.  
    摘要1213)      PDF(pc) (483KB)(357)    收藏
    粗糙集和模糊集理论已经被用于各种类型的不确定性建模中。Dubois和Prade研究了将模糊集和粗糙集结合的问题。提出了粗糙support-intuitionistic模糊集。介绍了粗糙集、粗糙直觉模糊集和support-intuitionistic模糊集等的概念;定义了在Pawlak近似空间中的support-intuitionistic模糊集的上下近似,讨论了一些粗糙support-intuitionistic模糊集近似算子的性质,给出了其相似度表达式;将其应用到聚类分析问题中,并通过一个实例验证其合理性。
    相关文章 | 多维度评价
    7. 双论域粗糙集的矩阵表示
    刘 慧,祝 峰,林姿琼
    计算机工程与应用    2015, 51 (24): 154-158.  
    摘要1137)      PDF(pc) (506KB)(360)    收藏
    在双论域粗糙集中,不论是理论上还是应用上,矩阵方法都是一种简单且高效的计算方法。利用矩阵的方法来研究双论域粗糙集。提出了双论域上的关系矩阵,通过关系矩阵以及关系矩阵的转置,构造了两个布尔方阵。利用这两个布尔方阵的特征研究了双论域覆盖粗糙集的一些性质。定义了一种布尔矩阵之间新的运算,并且利用这个运算,简洁地表示了双论域覆盖粗糙集的上近似算子和关系粗糙集的下近似算子。
    相关文章 | 多维度评价
    8. 云计算下保持边界域划分的知识约简算法研究
    常玉慧1,2,吕 萍1,2,钱 进1,2
    计算机工程与应用    2015, 51 (24): 159-164.  
    摘要1578)      PDF(pc) (675KB)(388)    收藏
    知识约简是数据挖掘应用中知识获取的重要步骤。经典的知识约简算法是一次性将小数据集装入内存中进行知识约简,而传统的并行知识约简仅仅利用任务并行来提高约简算法效率,都无法处理海量数据。通过分析经典的知识约简算法,构建了不可辨识的对象对,提出了保持边界域划分的知识约简算法,并探讨了保持边界域划分的知识约简算法之间的关系。深入剖析了知识约简算法中数据和任务同时并行的可行性,提出了云计算环境下保持边界域划分的知识约简算法框架模型,在Hadoop平台上构建了云计算环境并进行了相关实验。实验结果表明该知识约简算法可以处理海量数据集。
    相关文章 | 多维度评价
    9. Ant-FOIL:一种归纳逻辑蚁群学习系统
    颜晨阳
    计算机工程与应用    2015, 51 (23): 112-118.  
    摘要1527)      PDF(pc) (669KB)(908)    收藏
    提出了一种新型的归纳逻辑学习系统Ant-FOIL,该系统结合了蚁群优化元启发方法和FOIL算法,利用蚁群系统优化框架来指导FOIL进行规则构建。系统在若干经典归纳逻辑测试数据集上进行了测试,结果显示Ant-FOIL在预测准确率等关键指标上的表现要优于标准FOIL算法以及FOIL系统的若干改进变体(mFOIL、nFOIL、kFOIL和GILP)和其他一些成熟的归纳逻辑学习算法(Aleph和FOIL)。
    相关文章 | 多维度评价
    10. 一种优化标签的矩阵分解推荐算法
    张 明1,2,郭 娣3
    计算机工程与应用    2015, 51 (23): 119-124.  
    摘要1471)      PDF(pc) (743KB)(630)    收藏
    个性化推荐研究中,垃圾标签不仅会导致数据稀疏性问题,同时影响推荐的实时性和精确性。因此提出一种优化标签的矩阵分解推荐算法OTMFR,该算法分为两个阶段:首先优化标签,在建立三部网络图的基础上提出一种标签排序算法,利用互增强的关系得到关于标签流行度的排序,去除排序靠后的垃圾标签;然后在此基础上利用用户和资源对标签的偏好信息构建用户-资源偏好矩阵,并从矩阵分解的角度为用户产生推荐。在Delicious数据集上的实验结果表明,该算法在推荐精准度上有较为明显的效果。
    相关文章 | 多维度评价
    11. 基于贝叶斯和谐度的特征选择算法
    钟意伟,赵杰煜,朱绍军
    计算机工程与应用    2015, 51 (23): 125-130.  
    摘要1735)      PDF(pc) (628KB)(454)    收藏
    特征选择是高维数据降维的一种关键技术。传统数据降维技术如PCA,只是转化数据的表达形式,不能表达数据的相关程度。近年来提出信息度量方法,使用评价函数表示数据的不确定性程度,虽然能较好地体现数据之间的相关程度,但并没有充分考虑选取的特征对整个样本空间的影响。针对传统方法的不足,提出一种基于贝叶斯和谐度特征选择算法。贝叶斯和谐度来自贝叶斯阴阳和谐学习理论,可以估计整个数据空间的联合概率分布,选取的特征能够较好地反应整个样本空间的变化。根据和谐度的变化来度量类之间的相似度从而得到冗余度较低的特征组合。与传统方法如ReliefF、FCBF等比较后发现,在取同样特征个数的情况下,和谐度度量得到的特征组合对数据分类更有效。
    相关文章 | 多维度评价
    12. 余弦距离下保护型迁移学习聚类算法
    张焱凯1,包 芳2,王士同1
    计算机工程与应用    2015, 51 (23): 131-138.  
    摘要1891)      PDF(pc) (716KB)(456)    收藏
    以往研究者都从公式的合理性出发研究迁移学习和传统机器学习,但他们忽视了对问题的整体性考虑,致使在具体应用到文本分类问题时,无法实现彻底的分类。通过研究文本分类的整个过程,在k-均值算法中使用余弦距离,显著提高了实验结果;提出保护型迭代思想,同时弃用传统的词特征空间,采用隐空间作为特征向量空间,实施归一化约束。以CCI算法为例,结合提出的改进思想,产生改进算法PCCI,在降低计算复杂度的同时显著提高迁移学习的分类正确率。通过在数据集20-NewsGroups和Reuters-21578上测试并与现有其他迁移学习算法进行比较,证明了该改进算法的优越性。
    相关文章 | 多维度评价
    被引次数: Baidu(3)
    13. 基于压缩后缀数组的近似字符串匹配算法
    胥永康1,杨光露2,路松峰3
    计算机工程与应用    2015, 51 (23): 139-142.  
    摘要2072)      PDF(pc) (517KB)(819)    收藏
    近似字符串匹配是模式匹配研究领域中的一个重要研究方向。压缩后缀数组是字符串匹配、数据压缩等领域广泛使用的索引结构,具有检索速度快和适用广泛的优点。利用压缩后缀数组,提出了适合近似字符串匹配搜索算法的数据结构,并在此基础上提出了一种匹配搜索算法。实验结果表明,相对于现有的算法,提出的算法在小字母表的情况下具有计算优势。
    相关文章 | 多维度评价
    14. 基于增强约束条件随机场的Web对象信息抽取
    黄彦姣,吴 秦,梁久祯
    计算机工程与应用    2015, 51 (23): 143-148.  
    摘要1247)      PDF(pc) (579KB)(417)    收藏
    线性链条件随机场模型难以处理Web对象与各个标注属性之间的特征关系,为解决此问题,提出一种增强约束条件随机场模型。通过将约束条件引入推理过程,改进线性链条件随机场模型的Viterbi算法;运用最大间隔理论的思想训练条件随机场模型,提高模型标注的正确率;将该模型与条件随机场模型及层次条件随机场模型进行对比。实验结果表明该模型能在提高标注正确率的基础上有效地解决Web对象信息抽取问题。
    相关文章 | 多维度评价
    被引次数: Baidu(5)
    15. 基于旋转森林的分类器集成算法研究
    邵良杉,马 寒
    计算机工程与应用    2015, 51 (23): 149-154.  
    摘要3307)      PDF(pc) (638KB)(1440)    收藏
    为提高决策树的集成分类精度,介绍了一种基于特征变换的旋转森林分类器集成算法,通过对数据属性集的随机分割,并在属性子集上对抽取的子样本数据进行主成分分析,以构造新的样本数据,达到增大基分类器差异性及提高预测准确率的目的。在Weka平台下,分别采用Bagging、AdaBoost及旋转森林算法对剪枝与未剪枝的J48决策树分类算法进行集成的对比试验,以10次10折交叉验证的平均准确率为比较依据。结果表明旋转森林算法的预测精度优于其他两个算法,验证了旋转森林是一种有效的决策树分类器集成算法。
    相关文章 | 多维度评价
    16. 基于Map/Reduce的外壳片段立方体并行计算方法
    唐珊珊,朱跃龙,朱 凯
    计算机工程与应用    2015, 51 (22): 124-129.  
    摘要1260)      PDF(pc) (649KB)(639)    收藏
    针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;在Reduce过程中,聚合计算得到最终的外壳片段和度量索引表。实验证明,并行外壳片段立方体算法一方面结合了Map/Reduce框架的并行性和高扩展性,另一方面结合了外壳片段立方体的压缩策略和倒排索引机制,能够有效避免高维数据物化时数据量的爆炸式增长,提供快速构建和查询操作。
    相关文章 | 多维度评价
    17. 一种改进的灰色关联度算法及其推广应用
    陈友军,何洪英
    计算机工程与应用    2015, 51 (22): 130-133.  
    摘要955)      PDF(pc) (464KB)(661)    收藏
    以实例计算为依据,指出经典广义灰色关联度模型在实际应用中存在计算结果与灰色行为序列间的现实意义不一致的问题,分析了这种问题形成的原因。给出了以灰色行为序列拆线所围实际面积为计算核心的改进方法和算法步骤,从理论上合理地解释了序列间的接近与相似性的问题;实例分析说明新方法计算结果更有说服力;给出了研究的方向。
    相关文章 | 多维度评价
    被引次数: Baidu(5)
    18. 广义犹豫正态模糊信息集成及其多属性群决策
    马庆功
    计算机工程与应用    2015, 51 (22): 134-140.  
    摘要1149)      PDF(pc) (622KB)(519)    收藏
    定义了犹豫正态模糊元及其运算法则、得分函数、Euclidean距离等概念;提出了广义犹豫正态模糊有序加权平均算子,并研究其性质,该算子不仅尽可能多地保留决策者的偏好信息,还可依据决策者的主观意愿选择不同的参数和属性权重,使得决策结果达到决策者的期望值;紧接着对属性权重和算子参数赋予不同的数值,获取广义犹豫正态模糊有序加权平均算子的若干种特殊算子,并探讨两个常用算子的大小关系;针对属性权重完全未知的多属性群决策问题,构建一种基于广义犹豫正态模糊有序加权平均算子的群决策方法。该方法利用同一属性下所有方案属性值间的距离求得最优权重,然后将同一方案下各属性值集结成为综合属性值,进而得到方案优劣排序。通过实例分析说明该方法的可行性和有效性。
    相关文章 | 多维度评价
    19. 一种基于用户反馈的时间感知推荐方法
    邢 星1,贾志淳1,2,杨玉强1
    计算机工程与应用    2015, 51 (22): 141-144.  
    摘要1819)      PDF(pc) (488KB)(586)    收藏
    将社交网络的动态性和用户反馈信息融入到推荐方法中,提出一种基于用户反馈的时间感知推荐方法。该方法利用时间衰减因子对带有时间加权的动态社交网络进行兴趣衰减分析,使时间间隔较近用户的选择行为对资源对象的推荐作用获得较高的贡献度,体现用户兴趣的时间效应特性。扩展相似度计算方法,将用户反馈表示为正反馈信息和负反馈信息,考虑用户反馈信息对推荐方法的影响。通过在社交网络真实推荐数据集上的对比实验,结果表明该方法优于基于协同过滤的推荐方法。
    相关文章 | 多维度评价
    20. 滑动窗口中数据流最大频繁项集挖掘算法研究
    尹绍宏,单坤玉,范桂丹
    计算机工程与应用    2015, 51 (22): 145-149.  
    摘要1437)      PDF(pc) (518KB)(788)    收藏
    数据流最大频繁项集的项集数目相对很少并且已隐含所有的频繁项集,所以数据流中最大频繁项集的挖掘具有很好的时空效率并且有很大的意义,也受到了业界更多的关注。针对数据流最大频繁项集的挖掘,提出了在滑动窗口中基于矩阵的数据流最大频繁项集挖掘方法SWM-MFI,主要采用两个矩阵来存储数据信息:一个矩阵是事务矩阵,存储事务数据;一个矩阵是二项集矩阵,存放频繁2-项集。通过二项集矩阵扩展得到频繁k-项集,基于SWM-MFI算法挖掘出最大频繁项集。经过理论和实验证明该算法具有很好的时效性。
    相关文章 | 多维度评价
    21. 双隶属度模糊粗糙支持向量机
    韩 虎,党建武
    计算机工程与应用    2015, 51 (22): 150-153.  
    摘要1037)      PDF(pc) (530KB)(526)    收藏
    针对支持向量机方法处理不确定信息系统时存在的两个问题:一方面支持向量机训练对噪声样本敏感,另一方面支持向量机训练未考虑信息系统的不一致,利用模糊理论与粗糙集方法分别计算得到两种隶属度:模糊隶属度与粗糙隶属度,并将两种隶属度引入到标准支持向量机中得到一个新的支持向量机模型——双隶属度模糊粗糙支持向量机(DM-FRSVM)。分析该模型对于不确定问题的解决思路并进行对比研究,实验结果表明,在对于含有不确定信息的样本集进行分类时,DM-FRSVM表现出更好的推广性能。
    相关文章 | 多维度评价
    22. 矩阵与前缀树方法挖掘频繁项集
    丁邦旭,黄永青
    计算机工程与应用    2015, 51 (22): 154-157.  
    摘要1193)      PDF(pc) (478KB)(517)    收藏
    传统频繁项集挖掘算法的执行效率较低。提出了一种基于矩阵与前缀树的频繁项集挖掘算法MPFI,能快速地挖掘事务数据库中的频繁项集。MPFI算法只需扫描事务数据库一次,构建垂直方向的二进制矩阵,应用二进制位向量表达频繁项集信息,利用前缀树压缩存储频繁项集的相关信息,不产生候选项集。理论分析与实验结果表明,MPFI算法能有效地提高频繁项集挖掘效率。
    相关文章 | 多维度评价
    23. 基于粒计算与粗糙集的人工鱼群聚类算法
    陈济舟,罗 可
    计算机工程与应用    2015, 51 (21): 116-120.  
    摘要1485)      PDF(pc) (622KB)(457)    收藏
    针对标准鱼群算法易受到初始鱼群随机性的影响,后期收敛速度减慢,处理边界数据能力低,聚类精度低等缺点,提出了基于粒计算与粗糙集的人工鱼群聚类算法。算法引入粒计算理论,并依据粒密度和最大最小距离积法选择初始化人工鱼群避免算法易受随机性的影响;通过结合粗糙集的决策系统和属性约简,提高算法解决边界数据的能力;采用类内紧致性和类间分离度的原则设计适应度函数,并将其作为算法的终止判断条件。实验结果表明:该算法提高了聚类精度,增强了获取全局极值的能力,具有良好的聚类效果。
    相关文章 | 多维度评价
    24. 随机样本遗传MLP模型算法
    尤志宁,浦云明
    计算机工程与应用    2015, 51 (21): 121-127.  
    摘要1666)      PDF(pc) (651KB)(823)    收藏
    提出的SSGAMLP(Small Set Genetic Algorithm Multilayer Perceptron)模型,是针对MLP模型易陷入局部最优,且模型泛化性不好,而遗传算法可以跳出局部最优,但是种群个体数较多,却带来运算复杂度的提高,目的是为了克服以上不足,将遗传算法与MLP模型相结合,将MLP模型节点的向下连接权值看成是低层向高层的映射,因此每个节点(包括权值和阈值)可以看成是一个特征表达,即遗传算法的基因表达,同时个体MLP模型训练使用的随机样本子集以及算法的交叉变异,相当于引入随机因子,存在获得未知特征表达的可能性。实验基于MNIST数据集,印证了SSGAMLP模型在性能上的优势。模型降低了个体运算复杂度,提高了泛化性,在一定程度上克服了过拟合性。
    相关文章 | 多维度评价
    25. 基于空间重叠度的DTBSVM多类分类算法
    胡小莉,陈秀宏
    计算机工程与应用    2015, 51 (21): 128-132.  
    摘要1165)      PDF(pc) (572KB)(497)    收藏
    针对传统的DTBSVM算法中判断类间的可分的难易程度时可能造成的错误判断,提出了基于空间重叠度的DTSVM多类分类方法。该方法通过计算已知的类别样本在空间中的重叠度,合并有重叠的类,组合为一个新的类,再基于一种有效的类间可分性准则进行划分,使得容易划分的类能从决策树的根节点开始逐层分割出来,再划分有类间重叠的类,这样就可以尽量地避免“误差累积”的风险,构造出分类效果好的决策树结构。实验结果表明,该方法大大提升了DTSVM多类分类算法的分类正确率。
    相关文章 | 多维度评价
    26. 基于聚类权重分阶段的SVM解不平衡数据集分类
    王超学1,张 涛1,马春森2
    计算机工程与应用    2015, 51 (21): 133-137.  
    摘要2510)      PDF(pc) (550KB)(591)    收藏
    SVM在处理不平衡数据分类问题(class imbalance problem)时,其分类结果常倾向于多数类。为此,综合考虑类间不平衡和类内不平衡,提出一种基于聚类权重的分阶段支持向量机(WSVM)。预处理时,采用K均值算法得到多数类中各样本的权重。分类时,第一阶段根据权重选出多数类内各簇边界区域的与少数类数目相等的样本;第二阶段对选取的样本和少数类样本进行初始分类;第三阶段用多数类中未选取的样本对初始分类器进行优化调整,当满足停止条件时,得到最终分类器。通过对UCI数据集的大量实验表明,WSVM在少数类样本的识别率和分类器的整体性能上都优于传统分类算法。
    相关文章 | 多维度评价
    27. 蜂群算法优化性能综合测试研究
    梁 禹1,2,刘 宇1,2
    计算机工程与应用    2015, 51 (21): 138-143.  
    摘要1590)      PDF(pc) (561KB)(503)    收藏
    对蜂群算法的性能进行全面的测试和研究,实验分析了维数和粒子数对算法的影响,侦察蜂的活动对算法的影响以及初始解的位置对算法的影响。同时受遗传算法的启发,将典型的选择机制应用到蜂群算法并对其进行改进,并比较不同选择机制下蜂群算法的性能。实验结果表明,在粒子数为40,维数为10或者30,均匀分布初始解的位置,采用确定式选择法和无放回余数选择法代替蜂群算法中轮盘赌的选择方法的条件下,蜂群算法得到整体最好的优化结果。
    相关文章 | 多维度评价
    28. 基于概率的两层最近邻自适应度量分类算法
    仝伯兵,王士同
    计算机工程与应用    2015, 51 (21): 144-149.  
    摘要1846)      PDF(pc) (565KB)(332)    收藏
    针对有限样本下,KNN算法距离量的选择以及以前距离量学习研究中没有充分考虑样本分布的情况,提出了一种新的基于概率的两层最近邻自适应度量算法(PTLNN)。该算法分为两层,在低层使用欧氏距离来确定一个未标记的样本局部子空间;在高层,用AdaBoost在子空间进行信息提取。以最小化平均绝对误差为原则,定义一个基于概率的自适应距离度量进行最近邻分类。该算法结合KNN与AdaBoost算法的优势,在有限样本下充分考虑样本分布能降低分类错误率,并且在噪声数据下有很好的稳定性,能降低AdaBoost过度拟合现象发生。通过与其他算法对比实验表明,PTLNN算法取得更好的结果。
    相关文章 | 多维度评价
    29. 粗糙集上下近似的矩阵刻画及应用
    李少阳,李巧艳,宋卫妮
    计算机工程与应用    2015, 51 (20): 107-110.  
    摘要1056)      PDF(pc) (545KB)(389)    收藏
    主要对粗糙集中上下近似的矩阵刻画及应用进行了研究。给出等价关系、一般二元关系、基于邻域的覆盖粗糙集下一种上下近似的新的矩阵刻画;作为应用,提出关系矩阵方程,并对上下近似的逆问题进行了研究,即在已知关系矩阵[MR,]上(下)近似[R(X)][(R(X))]的情况下反解[X,]给出了求解[X]的方法。
    相关文章 | 多维度评价
    30. 一种快速、贪心的高斯混合模型EM算法研究
    邢长征,苑 聪
    计算机工程与应用    2015, 51 (20): 111-115.  
    摘要1182)      PDF(pc) (602KB)(1220)    收藏
    针对传统EM算法存在初始模型成分数目需要预先指定以及收敛速度随样本数目的增长而急剧减慢等问题,提出了一种快速、贪心的高斯混合模型EM算法。该算法采用贪心的策略以及对隐含参数设置适当阈值的方法,使算法能够快速收敛,从而在很少的迭代次数内获取高斯混合模型的模型成分数。该算法通过与传统EM算法、无监督EM算法和鲁棒EM算法的聚类结果进行比较,实验结果证明该算法具有很强的鲁棒性,并且能够提高算法的效率以及模型成分数的准确性。
    相关文章 | 多维度评价
    31. 基于图论的飞机典型装配工艺数据挖掘方法
    张 森,余剑峰,俞 琳,张 杰
    计算机工程与应用    2015, 51 (20): 116-119.  
    摘要936)      PDF(pc) (524KB)(445)    收藏
    为实现飞机装配指令编制的快速化、智能化,提出基于图论的飞机典型装配工艺数据挖掘方法。该方法将停用词表和分隔数组两个约束引入语义分词法完成装配工艺指令的分词处理,并以装配工艺特征向量结构化地表达分词后的装配工艺指令。将装配工艺特征向量映射为单向有序链,以此构建装配工艺图。通过定义装配工艺图的节点支持度和边支持度,给出了典型装配工艺挖掘方法。以某型飞机的平尾装配工艺为例,在多个支持度下验证了方法的有效性。
    相关文章 | 多维度评价
    32. 基于方向约束的对称距离聚类算法
    陈强业1,2,李际军1
    计算机工程与应用    2015, 51 (20): 120-125.  
    摘要1568)      PDF(pc) (567KB)(493)    收藏
    K-means算法是数据挖掘领域研究、应用都非常广泛的一种聚类算法,其各种衍生算法很多,其中包括近年出现的以点对称距离为测度的K-means聚类算法。在点对称距离聚类算法的基础上提出一种新的聚类算法,根据对对称性的分析,为对称性的描述增加方向约束,提高对称距离的描述准确性,以此来提高聚类的准确性。同时,针对对称点成对出现的特点,调整了聚类过程中的收敛策略,以对称点对连线中点计算聚类中心,改善了基于对称距离的聚类算法收敛性能。通过数值仿真比较了所提算法与原有算法的优劣,结果显示该算法在计算复杂度不变的条件下获得了更准确的结果,聚类结果更接近数据的真实分类。
    相关文章 | 多维度评价
    33. 面向OWS地理信息服务的描述词汇约简模型研究
    胥 婕1,2,苗立志1,3,程文超4,周 亚4
    计算机工程与应用    2015, 51 (20): 126-130.  
    摘要1669)      PDF(pc) (544KB)(448)    收藏
    地理信息服务在发展进程中缺乏对服务信息的语义描述,处于数据丰富而知识缺乏的境地,要充分利用大量的已有数据信息,则必须对数据做一些精化处理,就迫切需要一种从大数据量中发现、提取知识的有效方法。该研究以OGC网络服务(OGC Web Service,OWS)为研究对象,基于OWS服务的XML文档和描述词汇,对搜集到的OWS服务进行解析,并引入粗糙集理论的约简方法,建立面向OWS服务的描述词汇约简模型,从而对解析后的OWS服务进行约简,最终形成OWS服务最优描述词汇集,为后续OWS语义推理奠定基础。
    相关文章 | 多维度评价
    34. 覆盖粗糙直觉Fuzzy集模型的一点注记
    石素玮,李进金,李克典
    计算机工程与应用    2015, 51 (20): 131-134.  
    摘要1004)      PDF(pc) (471KB)(385)    收藏
    通过对一类覆盖粗糙直觉模糊集模型中粗糙度定义的分析,对其所存在疏漏进行了改进;再将粗糙熵的概念引入到该模型,研究直觉模糊集的不确定度量;通过例子说明该度量的有效性。
    相关文章 | 多维度评价
    35. 商品隐式评价对象提取的方法研究
    邱云飞1,倪学峰1,邵良杉2
    计算机工程与应用    2015, 51 (19): 114-118.  
    摘要1898)      PDF(pc) (603KB)(820)    收藏
    网络评论中没有明确指出评价对象的评论,如评论“东西有点贵”中并没有明确指出评价的是商品的价格。针对这种评论,提出一种在评论文本数据集上提取商品的隐式评价对象的方法。根据评论短文本的句式结构特点,构建出候选评价对象模型,并利用HowNet2000概念词典对候选评价对象中的特征词进行扩充,以缓解候选评价对象中信息缺乏的问题;基于[k-means]聚类算法利用候选评价对象中特征词之间的相似度,对候选评价对象进行聚类,得到若干隐式评价对象;利用[χ2]统计量来衡量候选评价对象中的特征词对隐式评价对象的指示能力,从而提取出评论中的隐式评价对象。实验结果表明,该方法提高了提取隐式评价对象的准确率。
    相关文章 | 多维度评价
    36. 微博语言的复杂网络特征研究
    马宏炜,陆 蓓,谌志群,黄孝喜,王荣波
    计算机工程与应用    2015, 51 (19): 119-124.  
    摘要1243)      PDF(pc) (560KB)(789)    收藏
    基于大规模微博语料库,构建了3个词同现语言网络,并采用复杂网络分析工具对这些语言网络进行分析。主要目的是探索复杂网络分析方法应用于微博文本的可行性,进而研究微博语言网络的个性特征。研究结果表明,复杂网络分析方法在微博文本上是可行的,在复杂网络的相关参数,如度分布、聚类系数、平均最短路径等方面反映了微博语言的语体特征。该研究不仅拓展了复杂网络方法在语言学领域的应用,而且为基于复杂网络的微博内容挖掘提供了可行途径。
    相关文章 | 多维度评价
    37. 基于支持向量数据描述的报警融合方法
    曹薇薇1,尹传环1,牟少敏2
    计算机工程与应用    2015, 51 (19): 125-128.  
    摘要1402)      PDF(pc) (535KB)(349)    收藏
    报警融合是入侵检测系统中很重要的一个环节,然而不同的攻击类型具有不同的数据特点,统一的无差别的处理方法势必会存在缺陷。提出了采用基于支持向量数据描述的报警融合算法,并且结合模拟退火的思想,根据不同的攻击类型,选择适合它的属性和核参数,剔除冗余特征,避免样本不均衡产生的影响,通过局部检测、数据融合以及最终的决策分析,提高了报警的检测率,降低了漏报率。通过KDD99数据集对提出的方法进行了验证。
    相关文章 | 多维度评价
    38. “把”字句的自动释义与句式变换研究
    王璐璐1,孙薇薇2,袁毓林2
    计算机工程与应用    2015, 51 (19): 129-137.  
    摘要1536)      PDF(pc) (672KB)(828)    收藏
    针对“把”字句在机器翻译中的困难,探索一种规则和统计相结合的“把”字句的自动释义和句式变换的方法。具体的计算步骤为:(1)根据“把”字句与其他句式的变换关系,将“把”字句分为不同的小类,并总结出每一小类的句法语义特征,得到“把”字句的语言模型;(2)选取北大中文树库中的“把”字句作为语料,并标注上每一小类句式的句法语义特征,从而得到富含句法语义信息的标注文本;(3)在此基础上,分别用组块分析的方法和完全句法分析的方法来对“把”字句进行自动识别;(4)再利用判别式机器学习的方法来对“把”字句进行自动分类。在识别结果和分类结果的基础上,根据释义模板和变换模板得到了一个“把”字句的自动释义与句式变换程序。
    相关文章 | 多维度评价
    39. 基于情景感知与约束的移动用户序列行为研究
    张晓滨,李园园,郭 斌
    计算机工程与应用    2015, 51 (19): 138-140.  
    摘要810)      PDF(pc) (469KB)(373)    收藏
    行为研究是为用户推送个性化服务的关键问题之一。针对移动环境下用户行为的情景敏感性,以及前一行为与后续行为之间的关联性、序列性特征,提出一种以情景感知和情景约束为基础的移动用户序列行为挖掘方法;实验表明了该方法在用户序列行为挖掘的有效性和准确性。
    相关文章 | 多维度评价
    40. 交互式问答中基于话语结构的指代消解研究
    张 超,孔 芳,周国栋
    计算机工程与应用    2015, 51 (19): 141-145.  
    摘要1176)      PDF(pc) (448KB)(541)    收藏
    交互式问答系统能够与用户进行对话式交互进而处理用户提出的一系列问题,但指代现象阻碍了系统准确地理解用户的问题。深入研究了交互式问答中的指代消解任务,在交互式问答文本语料中标注指代链信息和话语结构信息,并在基准平台的基础上提出了基于话语结构的特征集。实验研究了新闻文本上提出的基准特征集在交互式问答文本中的性能,并在此基础上引入话语结构特征。实验结果表明,与基准系统相比,改进系统的[F]值提高了2.6%,指代消解平台的性能有较大的提升。
    相关文章 | 多维度评价