X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00019548]一种改进的SimHash代码相似度检测方法

交易价格: 面议

所属行业: 分析仪器

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:CN201611203147.6

交易方式: 完全转让 许可转让 技术入股

联系人: 林老师

进入空间

所在地: 浙江杭州市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

一种改进的SimHash代码相似度检测方法,包括以下步骤1)分词;2)hash;3)加权;4)合并将各个特征向量经过hash加权之后的结果累加,变成只有一个序列串;5)减值通过整理分析,选择一个阈值T,将最后合并得到的结果序列串每一项减去设定的阈值T,得到最终的结果序列串;6)降维对于n‑bit签名的累加结果进行降维处理,即对于最终序列串上的每一位,若大于0则置1,否则置0,从而得到该语句的simhash值,最后根据不同语句的simhash值的海明距离来判断它们的相似度。本发明提供了一种准确性较高的改进的SimHash代码相似度检测方法。

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467