联系人:
所在地:
在传统的分词处理方法中,利用特征进行分词处理的方法需要进行特征的有效验证,并且难以保存问题语义的长距离依赖关系。双向长短期记忆神经网络(BI-LSTM)能够自主地通过记忆单元和控制门保存语义的长距离依赖关系,不需要特征验证。但是,该模型自身结构复杂,训练与预测时间代价大。 针对现有分词方法难以保证文本语义的长距离依赖关系和训练预测时间长的问题,提出了一种基于混合网络中文分词处理方法。该方法将双向门循环神经网络模型(BI-GRU)应用于中文分词处理,并利用条件随机场(CRF)模型对语句进行序列标注,有效地解决了文本语义的长距离依赖关系,缩短了网络训练和预测的时间。