本发明涉及利用数据挖掘技术进行中文文本处理的信息技术领域,设计一种基于不确定推理的文本层次分类方法和装置。包括:a)从训练文本中提取特征;b)确定分类问题的便是框焦元;c)利用特征的权重构造基本可信度分配函数;d) 利用特征的基本可信度分配函数合成测试文本的信度分布;e) 利用信度分布根据分类规则进行分类。基本发明有以下特征:通过将非叶子类构造成虚拟的叶子类参与分类,很好的区分了父类与子类之间的不同特征;利用基本可信度分配函数,分配给非叶子类参的信度以及pignistic概率将文本的分类可信度表示为一个三角模糊数,该分类是充分地利用了不确定信息,提高了分类的准确度。