[00003244]基于MapReduce的概率频繁项集挖掘方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201410231646.0
交易方式:
完全转让
许可转让
技术入股
联系人:
许尔杰
进入空间
所在地:
江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种基于MapReduce的概率频繁项集挖掘方法,包含以下步骤1)读入不确定数据集T1;2)在Map端依次处理不确定数据集T1中的每一个事务,将事务中每一项及其概率值映射成键值对;3)在Reduce端接收Map端的输出,利用正态近似方法生成概率频繁1项集;4),将3)中所输出的概率频繁1项集,生成列表F_list;5),读入存储在分布式文件系统HDFS上的不确定数据集T1,按照列表F_list进行处理,生成不确定数据集T2;6),运行基于MapReduce的UApriori方法不断处理5)中得到的不确定数据集T2生成候选项集,然后利用正态近似的方法从候选项集中生成概率频繁项集,直到生成所有的概率频繁项集为止。