说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111634366.0 (22)申请日 2021.12.2 9 (71)申请人 西安工程大 学 地址 710048 陕西省西安市碑林区金花 南 路19号 (72)发明人 张晓滨 马瑛超  (74)专利代理 机构 西安弘理专利事务所 61214 专利代理师 王奇 (51)Int.Cl. G06F 40/295(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于领域适应的服装实体识别方法 (57)摘要 本发明公开了一种基于领域适应的服装实 体识别方法, 步骤包括: 步骤1, 构建实体分类标 准; 步骤2, 构建源域训练数据; 步骤3, 使用步骤2 构建的源域数据集S训练针对源域的命名实体识 别模型Ms, 并保存预训练的模型嵌入层参数 ParamE和注意力层参数Paramatt; 步骤4, 构建及 训练基于 领域适应的服装实体识别模型Mt; 步骤 5, 参照图5, 对服装领域进行实体识别, 即成。 本 发明的方法, 有效解决服装领域实体识别缺乏大 量训练集的问题, 促进服装领域知识抽取相关工 作, 有效地促进了服装信息智能化发展和其下游 任务的开展。 权利要求书5页 说明书7页 附图2页 CN 114580412 A 2022.06.03 CN 114580412 A 1.一种基于领域 适应的服装实体识别方法, 其特 征在于, 按照以下步骤实施: 步骤1, 构建实体分类标准; 步骤2, 构建源域训练数据; 步骤3, 使用步骤2构 建的源域数据集S训练针对源域的命名实体识别 模型Ms, 并保存预 训练的模型嵌入层参数ParamE和注意力层参数Paramatt; 步骤4, 构建及训练基于领域 适应的服装实体识别模型Mt; 步骤5, 参照图5, 对服装领域进行实体识别, 即成。 2.根据权利要求1所述的基于领域适应的服装实体识别方法, 其特征在于: 所述的步骤 1的具体过程是: 1.1)依据服装领域知识与专家知识构建实体统计实体分类标准, 对服装领域的实体类 型进行划分; 1.2)结合实体类型的划分标准, 构建实体字典文件DICNER, DICNER=[Concepts, Material s,Examples,Proc esses,Brands], 其中五个项目分别表示概念、 材料、 实例 、 工艺、 品牌的实体 类型; 1.3)构建标注字典, 将识别出的实体以BIO标注, 其中, B为实体开始位置、 I为实体开始 出现位置以外的表示、 O为非实体表示, 结合实体字典文件DICNER的标注形式为B ‑Concepts、 I‑Concepts, 形成标注字典DIClable。 3.根据权利要求1所述的基于领域适应的服装实体识别方法, 其特征在于: 所述的步骤 2的具体过程是: 2.1)利用公开的训练数据, 构成初始数据集; 2.2)对初始数据集进行初步筛选, 去除初始数据集中实体标签不包含于实体字典文件 DICNER的数据; 2.3)对步骤2.2)处理后的数据集中不属于BIO标注的标注方式进行调整, 按照数据标 注规范对应BIO标注规范的规则转换为BIO标注; 2.4)对步骤2.3)处理后的数据集进行清洗, 对于语料长度大于256字符的进行截断操 作, 得到源域数据集S; 2.5)对领域专家提供的少量服装领域文本依据BIO标准进行标注, 得到目标域数据集 T, 用作基于领域 适应的服装实体识别模型Mt的训练和模型效果验证的数据。 4.根据权利要求1所述的基于领域适应的服装实体识别方法, 其特征在于: 所述的步骤 3的具体过程是: 3.1)对源域数据集S中的文本进行编码, 依据Bert中文版本BERT_BASE_CHINAESE所提 供的的Token字典实施编码, 得到编码ES; 3.2)对源域数据集S中的标签进行编码 转化, 依据标注字典DIClable, 对数据的标签进行 转化, 将对应标签的下 标进行编码; 3.3)构建一个使用源域数据训练的命名实体识别模型Ms, 包括编码层、 学习层、 输出 层, 由Bert预训练模型作为编码层, 由注意力 层、 Dropout层和一个全 连接层组成学习层, 由 CRF层构成输出层, 预训练其中的编码层和注意力层, 小步骤 包括: 3.3.1)将预训练的B ert层加载到命名实体识别模型Ms的网络中, 作为命名实体识别模 型Ms的编码层; 设置预训练的参数, 其中设置Bert层参数为可训练的, 即在网络训练过程权 利 要 求 书 1/5 页 2 CN 114580412 A 2中, Bert层 参数随训练过程而优化, Bert层的输入为步骤3.1)生成的编码ES, 输出为包含上 下文特征的维度为512*768的隐藏层张量SourceBouti; 3.3.2)为命名实体识别模型Ms添加由注意力层、 Dropout层和全连接层组成的学习层, 注意力层对SourceBouti进行计算, 注意力权 重Source_ai计算式如下: Source_ai=softmax(s(SourceBouti,Sq))        (1) 其中, 公式中的黑圆点为张量点积, SW为可训练的参数, Sq为输入的注意力 对象, d为维 度大小, SourceBouti为命名实体识别模型Ber t层输出的隐藏层张量, 对计算得到的注意力权重Source_ai与隐藏层张量SourceBouti相乘, 得到注意力层的 输出SAttout; 3.3.3)构建模型的输出层, 应用CRF对输出SAttout进行计算, 得到的输出为每个字对应 字典DIClabel的向量, 其中每一个位置的数值 为对应标签lable的概 率; 3.4)对步骤3.3)中构建的编码层、 学习层、 输出层按顺序组合成命名实体识别模型Ms 并使用源域数据进行训练, 优化器为ADAM, 指定训练批次为200及批次大小为64; 并在不断 训练时进行验证, 待数据在验证数据上准确 率保持稳定时结束训练, 保存命名实体识别模 型Ms; 3.5)对步骤3.4)训练好的命名实体识别模型Ms中编码层的参数进行保存得到参数权 重ParamE, 对学习层中的注意力层进行保存得到Paramatt。 5.根据权利要求1所述的基于领域适应的服装实体识别方法, 其特征在于: 所述的步骤 4的具体过程是: 4.1)构造训练数据集Trai nData, 小步骤 包括: 4.1.1)对源域数据集S与目标域数据集T进行标注, 标注其域分类标签, 其中属于源域 数据集S的标记为1, 属于目标域数据集T的标注为0; 4.1.2)将源域数据集S与目标域数据集T 进行混合, 得到训练数据集Trai nData; 4.1.3)将训练数据集TrainData参照步骤3.1)的方式进行编码得到Etrain, 将编码Etrain 作为基于领域 适应的服装实体识别模型Mt的总体输入; 4.2)搭建用于控制迁移的目标 可迁移注意力机制层, 小步骤 包括: 4.2.1)对输入特征TargetLSTMouti进行目标注意力权重Target_ai的计算, 计算 公式如 下: Target_ai=softmax(s(TargetLSTMouti,Tq))        (3) 其中, TW为可训练 的参数, Tq为输入的注意力对象, d为维度 大小, TargetLSTMouti为领 域适应的服装实体识别模 型双向长 短期记忆网络LSTM层输出的 隐藏层张量, 将得到的注 意 力权重Target_ai与输入特 征TargetLSTMouti相乘, 得到新的特 征张量Target_fi; 4.2.2)将特征张量Target_fi划分为K个部分, 并建立对应的K个特征判别器 对样本 特征所属领域进行判别, 通过多个特征判别器对多个特征级别进行源域与目标域的匹配,权 利 要 求 书 2/5 页 3 CN 114580412 A 3

.PDF文档 专利 基于领域适应的服装实体识别方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于领域适应的服装实体识别方法 第 1 页 专利 基于领域适应的服装实体识别方法 第 2 页 专利 基于领域适应的服装实体识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:56:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。