说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111542359.8 (22)申请日 2021.12.13 (71)申请人 中国人民解 放军国防科技大 学 地址 410073 湖南省长 沙市开福区德雅路 109号 (72)发明人 张洋 蔡孟栾 王涛 王怀民  吴逸文 陈婷婷 邬小军  (74)专利代理 机构 长沙国科天河知识产权代理 有限公司 432 25 代理人 李杨 (51)Int.Cl. G06Q 10/10(2012.01) G06F 16/9535(2019.01) G06F 16/955(2019.01) G06F 16/903(2019.01)G06K 9/62(2022.01) (54)发明名称 一种多模型融合的开发任务关联方法、 装 置、 设备及 介质 (57)摘要 本发明公开了多模型融合的开发任务关联 方法, 根据预设指标在协同开发社区构建活跃开 源项目集; 在活跃开源项目集中, 利用API采集所 有项目开发任务报告数据以构建备选任务报告 数据库; 在备选任务报告数据库中利用正则表达 式抽取所有任务报告中的URL链接信息以生成任 务报告数据集; 在任务报告数据集中构建查询任 务数据组和候选任务数据组, 获得计算查询任务 和每个候选任务之间的相似性得分; 将查询任务 和每个候选任务之间的相似性得分进行加权求 和并得到每个任务报告之间的最终相似度得分, 根据最终相似度得分构建基于多模型融合的开 发任务关联模型, 生成任务报告关联工具。 权利要求书2页 说明书8页 附图1页 CN 114186974 A 2022.03.15 CN 114186974 A 1.一种多模型融合的开发任务关联的方法, 其特 征在于, 所述方法包括: 根据预设指标在协同开发社区中构建活跃开源项目集; 在所述活跃开源项目集中, 利用API采集所有项目的开发任务报告数据以构建备选任 务报告数据库; 在所述备选任务报告数据库中利用正则表达式抽取所有任务报告中的URL链接信 息以 生成任务报告数据集; 在所述任务报告数据集中构建查询任务数据组和候选任务数据组, 分别利用结构数据 解析模型、 文本语义表示模型和历史关联度模型, 获得计算查询任务和每个候选任务之间 的相似性得分; 将所述查询任务和每个候选任务之间的相似性得分进行加权求和并得到每个任务报 告之间的最 终相似度得分, 根据所述最 终相似度得分构建基于多模型融合的开发任务关联 模型, 以生成任务报告关联工具。 2.如权利要求1所述的方法, 其特征在于, 所述根据 预设指标在协同开发社区中构建活 跃开源项目集的步骤, 包括: 在协同开发社区GitHub中, 利用API搜集项目的基本信息数据, 并根据Star、 Fork、 Delete以及Creati on time指标筛 选出流行开源项目; 将所述筛 选出的流行开源项目构建活跃开源项目集。 3.如权利要求1所述的方法, 其特征在于, 所述在所述活跃开源项目集中, 利用API采集 所有项目的开发任务报告数据以构建备选任务报告数据库的步骤, 包括: 在所述活跃开源项目集中, 利用GitHub的Issue  API和Pull  Request(PR)API采集所有 项目的任务报告数据, 具体数据搜集内容为: 任务ID、 任务处理状态、 提交者、 任务标题、 任 务描述、 任务评论、 提交时间、 类别、 标签、 里程碑等; 根据所述搜集到的报告数据构建备选任务报告数据库。 4.如权利要求1所述的方法, 其特征在于, 所述在所述备选任务报告数据库中利用正则 表达式抽取 所有任务报告中的URL链接信息以生成任务报告数据集的步骤, 包括: 在所述备选任务报告数据库中, 利用正则表达式抽取 所有任务报告中的URL链接信息; 利用GitHub的Cross ‑referenced  API检查所述任务报告中的URL链接信息, 筛选出实 际的任务报告关联 连接, 根据所述任务报告关联 连接构建 关联信息基准库; 在所述关联信 息基准库中去除不包含链接信 息的任务报告数据, 形成最终的任务报告 数据集。 5.如权利要求1所述的方法, 其特征在于, 所述在所述任务报告数据集中构建查询任务 数据组和 候选任务数据组, 分别利用结构数据解析模型、 文本语义表示模型和历史关联度 模型, 获得计算 查询任务和每 个候选任务之间的相似性得分的步骤之前, 还 包括: 在所述任务报告数据集中提取每个任务报告数据中的文本数据, 包括任务报告标题、 描述和评论; 在所述文本数据中删除停用词、 数字、 标点符号和其 他非字母字符; 使用NLTK中的Snowball  Stemmer技术将剩余单词转换为根形式, 以减少特征维度并将 相似的单词统一 为一个共同的表示, 以获得 预处理后的任务报告数据。 6.如权利要求1所述的方法, 其特征在于, 所述在所述任务报告数据集中构建查询任务权 利 要 求 书 1/2 页 2 CN 114186974 A 2数据组和 候选任务数据组, 分别利用结构数据解析模型、 文本语义表示模型和历史关联度 模型, 获得计算 查询任务和每 个候选任务之间的相似性得分的步骤, 包括: 在所述任务报告数据集中, 根据任务报告的创建时间选取最新的40%样本作为查询任 务数据组, 将所述任务报告数据作为 候选任务数据组; 使用结构数据解析模型计算所述查询任务和每个候选任务之间的结构信息 (Structural informati on)相似度ScoreS; 使用文本语义表示模型计算所述查询任务和每个候选任务之间的文本信息(Textual   informati on)相似度ScoreT; 使用历史关联度模型计算所述查询任务和每个候选任务之间 的历史信息(Historical   informati on)相似度ScoreH。 7.如权利要求1所述的方法, 其特征在于, 所述将所述查询任务和每个候选任务之间的 相似性得分进 行加权求和并得到每个任务报告之间的最 终相似度得分, 根据所述相似度得 分构建基于多模型融合的开发任务关联模型, 以生成任务报告关联工具的步骤, 包括: 将所述查询任务和每个候选任务之间的相似性得分进行加权求和以获得最终相似度 得分, 并根据所述 最终相似度得分构建基于多模型融合的开发任务关联模型; 利用Top‑k召回率评价指标, 以及所述任务报告数据集, 对 模型进行评估; 根据评估结果选取最优子模型权 重组合形成任务报告关联工具。 8.一种多模型融合的开发任务关联装置, 其特 征在于, 所述装置包括: 项目构建模块, 用于根据预设指标在协同开发社区中构建活跃开源项目集; 数据构建模块, 用于在所述活跃开源项目集中, 利用API采集所有项目的开发任务报告 数据以构建备选任务报告数据库; 链接获取模块, 用于在所述备选任务报告数据库中利用正则表达 式抽取所有任务报告 中的URL链接信息以生成任务报告数据集; 任务计算模块, 用于在所述任务报告数据集中构建查询任务数据组和候选任务数据 组, 分别利用结构数据解析模型、 文本语义表示模 型和历史关联度模 型, 获得计算查询任务 和每个候选任务之间的相似性得分; 工具生成模块, 用于将所述查询任务和每个候选任务之间的相似性得分进行加权求和 并得到每个任务报告之 间的最终相似度得分, 根据所述最终相似度得分构建基于多模型融 合的开发任务关联模型, 以生成任务报告关联工具。 9.一种多模型融合的开发任务关联设备, 其特征在于, 所述设备包括: 存储器、 处理器 及存储在所述存储器上并可在所述处理器上运行的多模型融合的开 发任务关联程序, 所述 多模型融合的开发任务关联程序配置为实现如权利要求1至7中任一项所述的多模型融合 的开发任务关联 方法的步骤。 10.一种介质, 其特征在于, 所述介质上存储有多模型融合的开发任务关联程序, 所述 多模型融合的开发任务关联程序被处理器执行时实现如权利要求1至7任一项所述的多模 型融合的开发任务关联 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114186974 A 3

.PDF文档 专利 一种多模型融合的开发任务关联方法、装置、设备及介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多模型融合的开发任务关联方法、装置、设备及介质 第 1 页 专利 一种多模型融合的开发任务关联方法、装置、设备及介质 第 2 页 专利 一种多模型融合的开发任务关联方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:38:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。