计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (15): 74-79.DOI: 10.3778/j.issn.1002-8331.1904-0156
易成岐,郭鑫,童楠楠,窦悦,陈东,王建冬
YI Chengqi, GUO Xin, TONG Nannan, DOU Yue, CHEN Dong, WANG Jiandong
摘要:
专利网络是复杂网络领域重要的组成部分,研究专利网络对理解和把握技术创新方向具有重要指导作用。利用专利文本数据构建无向加权专利网络图,并基于启发式社团发现模型提出一种创新态势研判算法。为了缓解专利标题和摘要短文本引发的文本向量稀疏问题,采用非监督的稀疏向量稠密化方法;为了解决专利网络构建过程中的相似度阈值自动化选择问题,以实验驱动的方法对比相似度阈值与专利网络常用统计指标的变化关系,最终选用平均聚类系数这一指标实现了最优相似度阈值的自动化判定。以我国数字中国及大数据领域真实发明专利数据为驱动,验证了方法的有效性并分析了数字中国及大数据领域创新态势。