说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210543747.6 (22)申请日 2022.05.19 (71)申请人 中国海洋大学 地址 266100 山东省青岛市崂山区松岭路 238号中国海 洋大学 (72)发明人 于树松 郭保琪 刘晓菲 石硕  丁香乾 杨宁 刘国敬 牛迪  (74)专利代理 机构 青岛联智专利商标事务所有 限公司 37101 专利代理师 王笑 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/268(2020.01) G06F 40/253(2020.01) (54)发明名称 一种众包设计资源的语义分析方法 (57)摘要 本发明公开了一种众包设计资源的语义分 析方法, 包括: 步骤1、 将众包设计资源短句进行 词分隔和词性标注; 步骤2、 将步骤1处理后的短 句切分为多个独立短句; 步骤3、 针对每个独立短 句进行以下处理: 依存关系分析、 以并列关系和 独立结构提取独立短句中的独立功能成分, 针对 每个独立功能成分构建多级语义模 型; 本发明将 众包设计资源短句分词、 进行词性标注、 划分独 立短句、 针对每个独立短句划分独立功能成分、 针对每个独立功能成分构建多级语义模型, 从而 将非结构化的自然语言短句描述转换为结构化 的关系集合, 实现了众包设计资源的统一建模, 对后续的检索、 匹配都具有重要的意 义。 权利要求书1页 说明书9页 附图5页 CN 114970543 A 2022.08.30 CN 114970543 A 1.一种众包设计资源的语义分析 方法, 其特 征在于, 包括: 步骤1、 将众包设计资源短句进行词分隔和词性标注; 步骤2、 将步骤1处 理后的短句切分为多个 独立短句; 步骤3、 针对每 个独立短句进行以下处 理: 1) 依存关系分析; 2) 以并列关系和独立结构提取独立短句中的独立功能成分; 3) 针对每 个独立功能成分构建多 级语义模型: (1) 遍历独立功能成分找到核心动谓词, 以检测到的广义动宾关系得到一级语义; 所述 广义动宾关系包括直接宾语关系、 间接宾语关系、 前置宾语关系、 核心动谓词 与其支配的名 词短语为状中关系、 核心动谓词与其支配的名词短语为主谓关系、 当核心动谓词的宾语缺 失时以定中关系表达的修饰词; (2) 对一级语义中的谓词中心词和宾语中心词检测其 修饰成分得到二级语义; (3) 对二级语义的中心词检测其 修饰成分得到三级语义; (4) 将检测到的高于三级的语义成分补全到其隶属的中心词上。 2.根据权利要求1所述的众包设计资源的语义分析方法, 其特征在于, 在步骤2中, 通过 空格、 顿号、 逗 号和正反斜杆将短句切分为多个 独立短句。 3.根据权利要求1所述的众包设计资源的语义分析方法, 其特征在于, 以并列关系和独 立结构关系提取独立短句中的独立功能成分, 包括: (1) 当检测到的并列关系位于广义宾语修饰区域时, 以核心动谓词为基础同等划分为 两个独立功能成分; (2) 当检测到的并列关系位于核心动谓词之间时, 同等划分为两个 独立功能成分; (3) 当并列关系和独立结构同时存在时, 若独立结构是动词性谓语且存在并列关系时, 以所述独立结构的动词性谓语为基础同等划分为两个独立功能成分; 若独立结构非动词性 谓语时, 不建立独立功能成分。 4.根据权利要求1所述的众包设计资源的语义分析方法, 其特征在于, 针对每个独立功 能成分构建多 级语义模型, 包括: 当检测到一级语义 不存在核心宾语时, 将其 修饰部分视为 其宾语, 构建到一级语义中。权 利 要 求 书 1/1 页 2 CN 114970543 A 2一种众包设计资源的语 义分析方 法 技术领域 [0001]本发明属于计算机数据处理技术领域, 具体地说, 是涉及一种众包设计资源的语 义分析方法。 背景技术 [0002]众包设计资源在互联网众包平台上大多以文字、 数字、 图像数据混合表达, 而众包 服务自组织的特点使得设计资源之间的相关内容存在很大差异, 要管理好设计资源, 需要 对其所涉及的相关服 务内容进行 结构化处 理。 发明内容 [0003]本发明提出一种众包服务资源的语义分析方法, 以互联网众包平台上的设计资源 为研究对象, 通过短语划分和依存关系分析, 将众包设计资源划分为独立功能成分, 针对独 立功能成分进 行多级语义表示, 从而将非结构化的自然语言短句描述转换为结构化的关系 集合, 以实现众包设计资源的统一建模。 [0004]本发明采用以下技 术方案予以实现: 提出一种众包设计资源的语义分析 方法, 包括: 步骤1、 将众包设计资源短句进行词分隔和词性标注; 步骤2、 将步骤1处 理后的短句切分为多个 独立短句; 步骤3、 针对每 个独立短句进行以下处 理: 1) 依存关系分析; 2) 以并列关系和独立结构提取独立短句中的独立功能成分; 3) 针对每 个独立功能成分构建多 级语义模型: (1) 遍历独立功能成分找到核心动谓词, 以检测到的广义动宾关系得到一级语义; 所述广义动宾关系包括直接宾语关系、 间接宾语关系、 前置宾语 关系、 核心动谓词与其支配 的名词短语为状中关系、 核心动谓词与其支配的名词短语为主谓关系、 当核心动谓词的宾 语缺失时以定中关系表达的修饰词; (2) 对一级语义中的谓词中心词和宾语中心词检测其 修饰成分得到二级语义; (3) 对二级语义的中心词检测其 修饰成分得到三级语义; (4) 将检测到的高于三级的语义成分补全到其隶属的中心词上。 [0005]进一步的, 在步骤2中, 通过空格、 顿号、 逗号和正反斜杆将短句切分为多个独立短 句。 [0006]进一步的, 以并列关系和独立结构关系提取独立短句中的独立功能成分, 包括: (1) 当检测到的并列关系位于广义宾语修饰区域时, 以核心动谓词为基础同等划 分为两个 独立功能成分; (2) 当检测到的并列关系位于核心动谓词之间时, 同等划分为两个 独立功能成分; (3) 当并列关系和独立结构同时存在 时, 若独立结构是动词性谓语且存在并列关说 明 书 1/9 页 3 CN 114970543 A 3

.PDF文档 专利 一种众包设计资源的语义分析方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种众包设计资源的语义分析方法 第 1 页 专利 一种众包设计资源的语义分析方法 第 2 页 专利 一种众包设计资源的语义分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:06:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。