说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111566440.X (22)申请日 2021.12.20 (71)申请人 南京邮电大 学 地址 210023 江苏省南京市栖霞区文苑路9 号 (72)发明人 张卫丰 程逸凡  (51)Int.Cl. G06F 30/27(2020.01) G06F 119/02(2020.01) (54)发明名称 一种基于多元回归模型分析影响Pull Request被拒绝的方法 (57)摘要 本发明公开了一种基于多元回归模型分析 影响Pull  Request被拒绝的方法, 包括以下步 骤: 1)获取多个GitHub开源项目数据集, 选择 Pull Request数量多的项目; 2)进行数据预处 理: 过滤数据中的异常值以及非编码Pull   Request; 3)使用提供的GitHub  API编写导出数 据和分析收集的程序: 导出的数据包括Pull   Request编号, 是否被合并, 社会关系, 是否第一 次Pull Request, 删除计数, 新增计数, 提交计 数, 代码更改计数等; 4)建立多个变量之间多元 回归模型并利用样本数据进行统计分析影响 Pull Request被拒绝的因素; 5)进行统计和分 析: 统计和分析影响P ull Request合并失败的因 素, 并将影响因素和合并之间的关系制成图表。 本发明是属于统计 分析方法技术领域, 具体实现 了一种建立多个变量之间多元回归模型并利用 样本数据进行统计分析影响Pull  Request被拒绝的方法。 权利要求书1页 说明书4页 附图4页 CN 114239409 A 2022.03.25 CN 114239409 A 1.一种基于多元回归模型分析影响Pull  Request被拒绝的方法; 在GitHub开源开发模 式的Pull  Request分析过程中, 考虑了社会关系、 是否第一次Pull  Request、 删除计数、 新 增计数、 提交计数、 代码更改计数和情感分析结果诸多因素; 然后使用代码程序在多因素数 据中建立多元回归 模型来统计分析Pul l Request被拒绝的因素。 2.根据权利要求1所述的基于多元回归模型分析影响Pull  Request被拒绝的方法, 其 特征包括以下几个步骤: 1)进行数据预处 理: 过滤数据中的异常值以及非编码Pul l Request; 2)使用提供的GitHub  API编写导出数据和分析收集的程序: 导出的数据包括Pull   Request编号, 是否被合并, 社会关系, 是否第一次Pull  Request, 删除计数, 新增计数, 提交 计数, 代码更改计数; 3)建立多个变量之间多元回归模型并利用导出的数据进行统计分析影响pull   request被拒绝的因素。 3.根据权利要求2所述的一种基于多元回归模型分析影响Pull  Request被拒绝的方 法, 其特征是步骤1)中, 通过编写程序调用GitHub应用程序接口得到开源项目中每条Pull   Request相关信息; 判断每条P ull Request是否为编码性P ull Request, 即P ull Request是 否进行代码变动, 过滤其中的非编码性Pull  Request, 然后去除存在异常值的Pull   Request, 即计数中存在非整数。 4.根据权利要求2所述的一种基于多元回归模型分析影响Pull  Request被拒绝的方 法, 其特征是步骤2)中, 通过编程导出项目每条Pull  Request的编号, 判断每条Pull   Request是否被合并, 判断Pull  Request贡献者与项目核心组的社会关系, 判断Pull   Request贡献者是否是第一次进行贡献, 分别将每条Pull  Request的删除计数, 新增计数, 提交计数, 代码更改计数与其中位数相对比, 对每条Pull  Request的评论进 行情感分析, 分 析结果分为积极, 中立和 消极。 5.根据权利要求2所述的一种基于多元回归模型分析影响Pull  Request被拒绝的方 法, 其特征是步骤3)中, 计算在 模型中花费 的预算即自由度, 使用斯皮尔曼等级相关性系数 检验来解释变量的相似性和相关性, 将所有原始数据被转换成等级数据, 对原始数据进行 冗余性检验, 使用多元回归模型来描述X即一组解释变量, 社会关系, 是否第一次Pull   Request, 删除计数, 新增计数和响应变量Y即Pull  Request是否合并失败的关系; 对于每个 项目, 构建两个解释性模型, 一个使用在持续集 成前Pull  Request, 另一个使用在持续集 成 后Pull Request; 评估线性回归模型的拟合度, 计算拟合度的乐观度下降来评估模型的稳 定性, 计算用于拟合原始模型 的自由度, 然后选择一个引导样本来拟合另一个具有原始模 型相同自由度的模型; 计算适用于自举和原始样本的两个模型的拟合度, 在分析中, 拟合了 自举样本的模型, 计算出乐观度降低值, 评估每个解释 变量对拟合的模型的影响, 分析解释 变量即影响因素与响应 变量即Pul l Request是否合并失败之间的关系。权 利 要 求 书 1/1 页 2 CN 114239409 A 2一种基于多元回归模型分析影响Pul l Request被 拒绝的方 法 技术领域 [0001]本发明属于统计分析方法技术领域, 具体涉及建立多个变量之间多元回归模型、 并利用样本数据统计分析影响Pul l Request被拒绝的因素。 背景技术 [0002]作为一种流行的分布式版本控制系统, Git被广泛用于软件行业开源项目中的源 代码管理和控制。 分布式版本控制系统(DVCS)支持协作软件开发的模式, 使开发人员可以 控制多个远程存储库, 从而使不同小组可以同时在同一项目上进行联合工作。 DVCS的一个 重要功能是系统化外部团队成员与核心团队成员的协作。 外部成员可以克隆存储库、 更改 代码, 然后请求将更改合并回主存储库。 请求将更改合并到存储库的过程是通过Pull   Request完成 的。 在GitHub中, 当开发人员希望将其代码更改合并到项目的主存储库时, 将 提交Pull  Request。 Pull  Request状态指示将源代码合并到主存储库中的权限, 可以是接 受或拒绝。 目前GitHub上大部分的Pull  Request事务都会被拒绝, 这将会影响到开发项目 的进度。 开发人员需要编辑 或更改其代码, 直到Pull  Request被接受。 这个过程需要大量的 努力才能完成。 [0003]因此有需要找到影响Pull  Request合并的解决方案、 影响审阅者决定接受或拒绝 Pull Request的因素。 现有研究集中于接受Pull  Request的影响因素分析, 即如果Pull   Request具有这些特征因素, Pull  Request将更可能被接受。 本发明旨在分析拒绝Pull   Request的影 响因素, 不仅包括开源代码的特征因素, 而且还包括每个Pull  Request事务的 代码质量指标因素。 这些影响因素可以添加到组织或开源项目的编码指南中, 成为开发人 员将其代码更改合并到主存储库之前验证源代码的清单。 还可以在其单元测试代码上添加 检查规则, 以帮助开发人员提交的Pul l Request尽量避免被拒绝。 发明内容 [0004]为完成上述目标, 本 发明提出了一种基于多元回归模型分析影响Pull  Request被 拒绝的方法。 首先, 获取多个GitHub 开源项目数据集, 选择Pull  Request数量多的项目。 其 次, 进行数据预处理: 过滤数据中的异常值以及非编码Pull  Request。 然后, 使用提供的 GitHub API编写导出数据和分析收集的程序: 导出的数据包括Pu ll Request Id、 是否被合 并、 社会关系、 是否第一次Pull  Request、 删除计数、 新增计数、 提交计数、 代码更改计数等。 再然后, 建立多个变量之间的多元回归模型, 并利用样本数据进行统计分析影响Pull   Request被拒绝的因素。 最后, 进行统计和分析: 统计和分析影响Pull  Request合并失败的 因素, 并将影响因素和合并之间的关系制成图表。 针对以上问题, 本发明的工作和贡献如 下: [0005]1.获取多个GitHub开源项目数据集, 选择Pull  Request数量多的项目。 所获取多 个GitHub开源项目数据集包括星星数高的受欢迎的GitHub开源项目、 项目中每个具体的 Pull Request编号、 GitHub  API调用地址 。说 明 书 1/4 页 3 CN 114239409 A 3

.PDF文档 专利 一种基于多元回归模型分析影响Pull Request被拒绝的方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多元回归模型分析影响Pull Request被拒绝的方法 第 1 页 专利 一种基于多元回归模型分析影响Pull Request被拒绝的方法 第 2 页 专利 一种基于多元回归模型分析影响Pull Request被拒绝的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 05:18:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。