说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210897373.8 (22)申请日 2022.07.28 (66)本国优先权数据 202111612185.8 2021.12.27 CN (71)申请人 博思数采科技发展 有限公司 地址 350005 福建省福州市长乐区数字福 建产业园东湖路3 3号2号研发楼4层 (72)发明人 陈荣木 林傅荣 童晓婷 林妍  陈小雷 林镇勋 牛京杰 查道鹏  (74)专利代理 机构 福州市鼓楼区京华专利事务 所(普通合伙) 35212 专利代理师 王牌 (51)Int.Cl. G06F 40/151(2020.01) G06F 40/194(2020.01)G06F 40/289(2020.01) G06F 40/295(2020.01) G06K 9/62(2022.01) G06Q 30/02(2012.01) G06Q 30/08(2012.01) (54)发明名称 一种基于电子投标文件比对的围串标行为 检测方法及装置 (57)摘要 本发明提供一种基于电子投标文件比对的 围串标行为检测方法及装置, 方法包括: 将投标 文件转换为纯文本, 将纯文本进行去噪, 并将其 中和招标的采购文件中信息一致的内容去除, 得 到有效文本文档; 将所有的有效文本文档进行分 句, 筛选其中设定句子, 并计算句子的simhash 值, 将不同有效文本文档的相似句子查找出来, 并将其中连续的句子拼接, 得到相似信息; 将所 有的有效文本文档中提取基础关键信息、 报价信 息、 供应商电子投标文件制作信息以及投标保证 金缴费账户信息; 根据法规、 上述得到信息进行 对比判断投标人是否为围串 标行为; 可以更为直 观准确的定位出可能存在的围串标行为, 进一步 减少平时专 家的工作量, 提升 评审专家的效率。 权利要求书4页 说明书12页 附图3页 CN 115249007 A 2022.10.28 CN 115249007 A 1.一种基于电子投标文件比对的围串标 行为检测方法, 其特 征在于: 包括: 步骤1、 将投标文件转换为纯文本, 将纯文本进行去噪, 并将其中和招标的采购文件中 信息一致的内容去除, 得到有效文本文档; 步骤2、 将所有的有效文本文档进行分句, 筛选其中设定句子, 并计算句子的simhash 值, 将不同有效文本文档的相似句子查找出来, 并将其中连续的句子拼接, 得到相似信息; 步骤3、 将所有的有效文本文档中提取基础关键信息、 报价信息、 供应商电子投标文件 制作信息以及投标保证金缴费账户信息; 步骤4、 根据法规、 步骤2中得到信息以及步骤3中得到信息进行对比判断投标人是否为 围串标行为。 2.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法, 其特征 在于: 还包括步骤5、 根据设定需求将步骤2中的信息、 步骤3中的信息以及步骤4中的结果进 行显示。 3.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法, 其特征 在于: 所述步骤2进一步具体为: 根据设定的标点符号作为句子的分 隔符将所有的有效文本 文档进行分句; 筛选其中设定句子: 首先将同一有效文本文档 中相同的句子做去重处理, 然后将选出 长度大于预设定 长度的句子; 计算每句选出句子的simhash值; 遍历取出一有效文本文档的所有simhash值, 依次和另一有效文本文档的所有simhash 值做海明距离计算; 将海明距离小于预设值的两组simhash值所对应的句子标记为相 似句 子; 若其中存在连续的句子, 则进行拼接, 得到相似信息 。 4.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法, 其特征 在于: 所述步骤3进一步具体为: 将所有的有效文本文档中提取基础关键信息、 报价信息、 供 应商电子投标文件制作信息以及投标保证金缴费账户信息; 所述基础关键信息包括: 中文姓名、 电话 号码、 地址、 电子邮箱以及公司名称; 所述中文姓名提取: 基于mmseg算法以及中文姓氏词库, 将有效文本文档中的姓名信息 识别并提取 出来, 并将提取 出的姓名信息存 储进数据库中; 所述电话号码提取: 使用正则表达式提取出有效文本文档 中的电话号码, 并将提取出 的电话号码信息存 储进数据库中; 所述地址提取: 基于mmseg算法、 行政区划词库及地址词库, 将有效文本文档中地址信 息识别并提取 出来, 并将提取 出的地址信息存 储进数据库中; 所述电子邮箱提取: 使用正则表达式提取出有效文本文档 中的电子邮箱信息, 并将提 取出的电子邮箱信息存 储进数据库中; 所述公司名称提取: 基于mmseg算法以及公司名称词库, 将有效文本文档中的公司名称 信息识别并提取 出来, 并将提取 出的公司名称信息存 储进数据库中; 所述报价信息: 根据供应商从数据库中获取对应的报价信息; 所述供应商电子投标文件制作信息: 在供应商上传电子投标文件时, 记录下该电子投 标文件加密电脑以及上传电脑的mac地址和ip地址; 所述投标保证金缴交账户信息: 在供应商缴交保证金时, 记录下供应商的转出账户户权 利 要 求 书 1/4 页 2 CN 115249007 A 2号以及转入的唯一虚拟保证金户号。 5.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法, 其特征 在于: 所述 步骤4进一 步具体为: 将不同供应商的供应商电子投标文件制作信 息进行两两比对, 如果不同供应商的投标 文件加密或上传电脑的mac地址一 致, 则判定这两家供应商具有围串标嫌疑; 将不同供应商的基础信息进行两两比对, 如果存在姓名、 电话号码、 电子邮箱、 公司名 称以及地址中的一个或多个一 致, 则将这两家供应商标记为具有围串标 可疑行为; 将不同供应商的报价信息进行两 两比对: ①、 若两家或多家供应商报价均畸高或者畸低, 且报价数额偏差率小于所有供应商报 价的整体偏差率; 报价畸高或畸低的判定方法: 若两家或多家供应商的报价与各供应商的平均报价差异在畸高 畸低差异阈值以上, 则 为报价畸高或畸低; 评标基准 价=所有供应商投标报价中最低的报价; 偏差率=|(投标 人报价‑评标基准 价)|/评标基准 价×100%; 整体偏差率 =参与计算的各 供应商投标报价偏差率的平均值; ②、 两家以上 供应商报价存在阶梯报价情况 阶梯报价判定方法: 计算所有供应商投标报价两两间的差值绝对值, 找出计算得出的差值绝对值一样且相 同个数大于2的所关联的供应商, 该关联的供应商的报价即是阶梯报价; 当报价信息满足以上任意 一个条件时, 将对应供应商标记为具有围串标 可疑行为; 计算出不同投标文件间的相似度值; 两份有效文本文档的相似度值Sab计算方法为: 计算得出的两份有效文本文档的相似信息内容的文本 长度为S; 一有效文本文档的文本 长度为La; 另一有效文本文档的文本 长度为Lb; 则相似度值Sab=S/Min(La,Lb)*100%, 若该相似度值大于设定阈值, 则判定这两家供 应商具有围串标嫌疑; 将对不同供应商的投标保证金缴交账户信 息进行两两比对, 如果存在不同供应商使用 相同的转出账户户号, 或者相同的转入的唯一虚拟保证金户号, 则直接判定对应供应商存 在围串标 行为。 6.一种基于电子投标文件比对的围串标 行为检测装置, 其特 征在于: 包括: 投标文件预处理模块, 将投标文件转换为纯文本, 将纯文本进行去噪, 并将其中和招标 的采购文件中信息一 致的内容去除, 得到有效文本文档; 投标文件相似内容检测模块, 将所有的有效文本文档进行分句, 筛选其中设定句子, 并 计算句子的simhash值, 将不同有效文本文档的相似句子查找出来, 并将其中连续的句子拼 接, 得到相似信息; 投标文件关键信 息提取模块, 将所有的有效文本文档中提取基础 关键信息、 报价信 息、 供应商电子投标文件制作信息以及投标保证金缴费账户信息; 投标文件检测模块, 根据法规、 投标文件相似内容检测模块中得到信息以及投标文件权 利 要 求 书 2/4 页 3 CN 115249007 A 3

.PDF文档 专利 一种基于电子投标文件比对的围串标行为检测方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于电子投标文件比对的围串标行为检测方法及装置 第 1 页 专利 一种基于电子投标文件比对的围串标行为检测方法及装置 第 2 页 专利 一种基于电子投标文件比对的围串标行为检测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:28:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。