联系人:
所在地:
1、系统介绍 卓朗智能搜索引擎系统[简称:搜索引擎]V2.0旨在建立一套可用的政策采集系统,通过政策采集系统可以定向的对具体的政策源网站进行采集,对采集回来的原始HTML文档进行持久化存储来支持后续的再次处理,通过配置数据抽取规则完成对源HTML文档的数据抽取(结构化)。对结构化的政策进行持久化存储。将结构化的政策交与后续模块进行进一步处理,例如建立倒排索引。 2、主要功能 卓朗智能搜索引擎系统[简称:搜索引擎]V2.0汇集国内各级政府机构发布的政策,经过整理、编排再为企业用户、个人用户提供方便、快捷的政策查找服务,解决了以往用户政策查找困难的问题。卓朗智能搜索引擎系统[简称:搜索引擎]V2.0以政策数据为核心,通过现代的计算机技术为企业提供便捷的服务。 2、技术特点 卓朗智能搜索引擎系统[简称:搜索引擎]V2.0的后台服务采用先进的数据采集、数据分析以及内容分发技术为引导为前端服务提供数据支撑、业务支撑以及算法支撑。前台采用Web技术以浏览器的方式为用户提供服务。 4、软硬件环境 4.1 硬件环境 X86 Linux 企业服务器。 4.2 软件环境 JDK 1.8 MySQL Redis Spark