本发明涉及基于句法树和领域特征的生物文本蛋白质指代消解方法,用于解决现有基于规则的方法中F值低的问题,其步骤包括对原始文本进行预处理;从句法树中查找关系代词和距离该关系代词最近的名词短语,作为该关系代词的先行语;从句法树中查找人称代词,并从句法树的并列短语结构、子句句法树或前一句子的句法树中查找该人称代词的先行语;利用句法树得到限定性名词短语和候选先行语集,并基于生物领域特征如单复数、实体类型、数量等性质从候选先行语集中挑选出最优的作为先行语;非蛋白质指代消解过滤。本发明实现了生物文本中的蛋白质指代消解,能够获得较高的F值。