[00005765]基于分布式计算平台的层次聚类改进方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201710403380.7
交易方式:
完全转让
许可转让
技术入股
联系人:
邱老师
进入空间
所在地:
江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开一种基于分布式计算平台的层次聚类改进方法,采用K‑均值算法将数据聚类为N个簇,对N个簇进行全排列,形成顺序不同的N!个序列,再利用BIRCH算法在Spark平台上计算,Spark平台利用分区的调配,并行化进行计算;根据数据簇的紧密性对结果进行筛选,保留数据簇紧密性最好且离群点个数最少的一组数据。本发明增强数据聚合的质量,提高了聚合效率。