技术简介: 本发明提出了基于新型神经网络的自然语言并列结构的自动识别方法,包括:先对待分析的句子进行句法分析处理,得到一个并列结构的候选集合,然后利用新型的神经网络学习器对候选集合中的并列结构…… 查看详细 >
技术简介: 本发明提供一种基于词向量、卷积神经网络的实体消歧方法,包括实体识别阶段、实体语义表示阶段、神经网络学习训练阶段和实体分类阶段等四个阶段。本方法依托word2vec训练的词向量和卷积神经网络…… 查看详细 >
技术简介: 本发明提出了一种利用基于词上下文的字嵌入与神经网络的中文分词方法,在大规模的自动切分数据上学习字嵌入,将学习得到的字嵌入作为神经网络分词模型的输入,可以有效帮助模型学习。具体步骤如…… 查看详细 >
技术简介: 本发明公开了一种基于词向量的多平台控件对应方法,包括如下步骤寻找与控件、UI设计、页面布局文件相关的英文文档组成词向量的训练集;使用stanford工具对英文文档进行分词得到单词序列;对得到…… 查看详细 >
技术简介: 本发明公开了一种基于主题模型的裁判文书相似度分析方法。该方法采用机器学习中的LDA(Latent 查看详细 >
技术简介: 本发明提出了一种计算机中限定翻译片段的交互式翻译方法,包括:用户输入需要翻译的句子,由系统给出原始翻译结果,当用户对系统给出的翻译结果的顺序有不同意见,通过点击操作对源语言片段进行…… 查看详细 >
技术简介: 本发明提出了一种机器翻译中翻译单元表的抽取方法,本发明运行于Hadoop并行计算平台上,包括以下步骤:根据输入的双语对齐语料和词对齐文件,选择想要抽取的内容,并对相关信息进行合并;根据需…… 查看详细 >
技术简介: 本发明公开了一种基于词预测的神经机器翻译方法,包括在基于注意力机制的端到端神经机器翻译系统的训练过程中加入词预测机制。其分为两个方面,一是对源端即编码端加入词预测机制,二是在目标端…… 查看详细 >
技术简介: 本发明公开了一种基于Spark的大规模短语翻译模型的训练方法,包括以下步骤:首先采取Spark分布式地调用单机多线程词对齐训练工具MGIZA++的模式,在大规模平行语料库中使用期望最大化算法进行词…… 查看详细 >
技术简介: 本发明公开了一种自动探索更多参考译文信息的机器翻译优化方法,利用图扩展参考译文的信息,对机器翻译得到的译文进行更充分的评价,同时在利用译文信息扩展的评价方法参与训练过程时,帮助系统…… 查看详细 >
技术简介: 本发明公开了一种数字图像检索中的主动半监督相关反馈方法,包括以下步骤:(1)接受用户的实例图像,包括相关图像和不相关图像;(2)依据实例图像初步计算图像的相似度;(3)基于图像的初步相似度…… 查看详细 >
技术简介: 本发明公开了一种数字图像检索中的主观相似度度量方法,其特征是该方法包括以下步骤:(1)数字图像检索装置从数字图像存储设备中获取数字图像,并接受用户的查询图像,包括相关图像和不相关图像…… 查看详细 >