X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00109933]LJParser大数据搜索与挖掘平台

交易价格: 面议

所属行业: 智能交通

类型: 非专利

技术成熟度: 可以量产

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

  成果简介:LJParser 大数据搜索与挖掘开发平台针对互联网内容处理的需要, 融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开 发的基础工具集。开发平台由多个中间件组成,各个中间件API 可以无缝地 融合到客户的各类复杂应用系统之中,可兼容 Windows,Linux, Android, Maemo5, FreeBSD 等不同操作系统平台,可以供 Java,C,C#等各类开发语 言使用。LJParser 是一套专门针对原始文本集进行处理和加工的软件,提供 了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。

  项目来源:自行开发

  技术领域:信息技术

  应用范围:应用于网络舆情监测;

  现状特点:国内领先,2010 年获得钱伟长中文信息处理科学技术奖

  技术创新:

  1)汉语词法分析: 对原始语料进行分词、自动识别人名地名机构名等未登录词、新词标注以及 词性标注。并可在分析过程中,导入用户定义的词典。

  2)新词发现: 从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还 可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适 应新的语言变化。

  3)文本聚类及热点分析: 能够从大规模数据中自动分析出热点事件,并提供事件话题的关键特征描 述。同时适用于长文本和短信、微博等短文本的热点分析。

  4)分类过滤: 针对事先指定的规则和示例样本,系统自动从海量文档中筛选出符合需求的样本。

  5)自动摘要: 能够对单篇或多篇文章,自动提炼出内容的精华,方便用户快速浏览文本内容。

  6)关键词提取: 能够对单篇文章或文章集合,提取出若干个代表文章中心思想的词汇或短 语,可用于精化阅读、语义查询和快速匹配等。

  7)文档去重: 能够快速准确地判断文件集合或数据库中是否存在相同或相似内容的记录,同时找出所有的重复记录。

  所在阶段: 成熟应用

  成果知识产权: 独立知识产权

  成果转让方式:合作开发

  市场状况及效益分析: 已经有30 万的共享用户。

  成本投资估算:

image.png

image.png

image.png

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467