基于Solr的司法大数据检索模型研究与实现

doi:10.3778/j.issn.1002-8331.1708-0046

计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (20): 249-253.DOI: 10.3778/j.issn.1002-8331.1708-0046

基于Solr的司法大数据检索模型研究与实现

贾贺1，艾中良1，2，贾高峰2，刘忠麟1，2，陈伯雄2

1.华北计算技术研究所，北京 100083
2.中国司法大数据研究院有限公司，北京 100083

出版日期:2017-10-15 发布日期:2017-10-31

Research and realization on judicial large data retrieval model

JIA He1, AI Zhongliang1，2, JIA Gaofeng2, LIU Zhonglin1，2, CHEN Boxiong2

1.North China Institute of Computing Technology, Beijing 100083, China
2.China Justice Big Data Institute CO., Ltd, Beijing 100083, China

Online:2017-10-15 Published:2017-10-31

摘要/Abstract

摘要： 围绕司法领域信息要素的高维性特征以及司法信息要素间的紧耦合性特征，针对司法数据检索技术中由高维信息要素间的紧耦合性导致的检索效率问题，研究和实现了一个基于Solr的司法大数据检索模型。该模型采用Solr超级集群作为数据索引库，采用HBase集群作为数据存储库，通过引入数据与索引分离、redis缓存、动态参数调整、动态cache释放等设计思路，实现了一个高效、可靠、可扩展的司法大数据检索模型。

关键词: 司法大数据, 信息检索, Solr, HBase

Abstract: Based on the high dimensionality and the tight coupling of judicial fields and the retrieval efficiency, a judicial big data retrieval model based on Solr is studied and implemented. This model uses the Solr supercluster as the data index library, and uses the HBase cluster as the data repository. By introducing the separation of data and index, redis cache, dynamic parameter adjustment and dynamic cache release, a high efficiency, reliable and scalable judicial big data retrieval model is designed.

Key words: justice big data, information retrieval, Solr, HBase

贾贺1，艾中良1，2，贾高峰2，刘忠麟1，2，陈伯雄2. 基于Solr的司法大数据检索模型研究与实现[J]. 计算机工程与应用, 2017, 53(20): 249-253.

JIA He1, AI Zhongliang1，2, JIA Gaofeng2, LIU Zhonglin1，2, CHEN Boxiong2. Research and realization on judicial large data retrieval model[J]. Computer Engineering and Applications, 2017, 53(20): 249-253.

[1]	朱松杰，娄渊胜，叶枫，李凌，陈勇. 基于协处理器的HBase内存索引机制的研究[J]. 计算机工程与应用, 2020, 56(1): 98-105.
[2]	郭红，周健倩，张瑛瑛，郭昆. 基于协处理器的HBase二级索引方法[J]. 计算机工程与应用, 2019, 55(21): 87-92.
[3]	张瑞芳1，郭克华1，2. 面向个性化站点的用户检索意图建模方法[J]. 计算机工程与应用, 2018, 54(6): 37-43.
[4]	马振，哈力旦·阿布都热依木，李希彤. 海量样本数据集中小文件的存取优化研究[J]. 计算机工程与应用, 2018, 54(22): 80-84.
[5]	徐熙超1，2，杨铮1，马廷淮1，2. 基于HBase的气象结构化数据查询优化[J]. 计算机工程与应用, 2017, 53(9): 80-84.
[6]	沈夏炯1，2，叶曼曼2，甘甜2，韩道军1，2. 基于概念格的信息检索及其树形可视化[J]. 计算机工程与应用, 2017, 53(3): 95-99.
[7]	孙亭，丁杰. 异构政务信息资源集成检索技术研究[J]. 计算机工程与应用, 2017, 53(2): 103-106.
[8]	陈亚楠，朱习军. 基于Hadoop的中医哮喘用药组合关联分析[J]. 计算机工程与应用, 2017, 53(13): 95-98.
[9]	王晓博，李晓，马博. 基于频繁词义序列的检索结果聚类算法研究[J]. 计算机工程与应用, 2015, 51(1): 13-20.
[10]	万福成，李冬晨，何向真，徐涛. 面向信息检索的藏文文本索引策略研究[J]. 计算机工程与应用, 2014, 50(7): 208-211.
[11]	王旭阳，万里. 信息检索中语义相似度算法研究[J]. 计算机工程与应用, 2014, 50(10): 124-127.
[12]	张杰1，范三霞1，周海燕1，秦裕林1，2. 信息检索中基本水平类概念加工优势的研究[J]. 计算机工程与应用, 2012, 48(22): 209-212.
[13]	汪材印1，崔琳2，李鸿2，3. 基于链接预测思想的问句检索方法研究[J]. 计算机工程与应用, 2012, 48(10): 132-136.
[14]	王彪1，2，高光来1. 界模型信息检索及其参数优化[J]. 计算机工程与应用, 2012, 48(1): 153-156.
[15]	金小峰. 一种大容量文本集的智能检索方法[J]. 计算机工程与应用, 2011, 47(7): 143-145.

基于Solr的司法大数据检索模型研究与实现

Research and realization on judicial large data retrieval model

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics