联系人:
所在地:
本发明公开了一种基于深度关系自注意力网络的场景图生成方法。本发明步骤如下:1、数据预处理及数据集的划分,2、使用预训练的目标检测网络对图像提取特征,3、构建目标的空间特征,4、构建目标的语言特征,5、构建相对关系特征,6、构建深度神经网络,7、损失函数,8、训练模型、9、网络预测值计算。本发明用于同时建模目标上下文和关系上下文的RSAN网络在场景图生成的任务上取得了显著性的提升效果,超越了该任务上的大部分主流方法。并且本发明的RSAN网络在其他跨模态相关领域中如图像内容问答和视觉关系检测中也具有十分重要的应用价值和巨大的潜力。