说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211034507.X (22)申请日 2022.08.26 (71)申请人 税友软件集团股份有限公司 地址 310053 浙江省杭州市滨江区浦沿街 道南环路3738号 (72)发明人 陈鹏飞 刘子星 丁乐 计春龙  徐煌 王伟  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 赵怡琳 (51)Int.Cl. G06F 40/289(2020.01) G06F 16/11(2019.01) G06N 20/00(2019.01) G06Q 40/00(2012.01)G06Q 50/08(2012.01) (54)发明名称 一种税收风险检测方法、 装置、 设备及存储 介质 (57)摘要 本申请公开了一种税收风险检测方法、 装 置、 设备及存储介质, 包括: 获取与待检测企业的 目标项目相关的全部发票数据和第三方数据; 从 全部所述发票数据中提取出所述目标项目的项 目属性信息, 并对提取到的全部所述项目属性信 息进行归集处理, 得到归集后信息; 基于所述归 集后信息和所述第三方数据构建与所述目标项 目对应的项目台账, 并通过判断根据所述项目台 账生成的风险指标值是否满足预设条件的方式 对所述待检测企业的税收风险进行检测。 可见, 本申请通过对税务数据做项目属性信息归集, 从 而综合第三方数据构造企业的项目台账, 并在此 基础上识别风险企业, 提高税收风险的检测效率 和准确度。 权利要求书2页 说明书9页 附图3页 CN 115455960 A 2022.12.09 CN 115455960 A 1.一种税收风险检测方法, 其特 征在于, 包括: 获取与待检测企业的目标项目相关的全部发票数据和第三方 数据; 从全部所述发票数据中提取出所述目标项目的项目属性信 息, 并对提取到的全部所述 项目属性信息进行归集处 理, 得到归集后信息; 基于所述归集后信 息和所述第 三方数据构建与 所述目标项目对应的项目台账, 并通过 判断根据所述项目台账生成的风险指标值是否满足预设条件的方式对所述待检测企业的 税收风险进行检测。 2.根据权利要求1所述的税收风险检测方法, 其特征在于, 所述获取与待检测企业的目 标项目相关的全部发票数据之前, 还 包括: 以税务登记中的行业编码为索引确定出建筑行业中为正常户、 为一般纳税人、 且开具 建筑服务类型的发票金额的占比超过 预设阈值的全部企业得到企业白名单; 将所述待检测企业与所述企业 白名单进行匹配, 如果匹配成功, 则执行获取发票数据 的步骤。 3.根据权利要求1所述的税收风险检测方法, 其特征在于, 所述从全部所述发票数据中 提取出所述目标项目的项目属性信息, 包括: 通过正则匹配对 全部所述发票数据备注栏中的信息进行初步清洗; 通过正则表达式对全部所述发票数据初步清洗后的备注栏中与地址相关的前后文进 行定位并识别定位 位置的地址, 得到项目地址; 对全部所述发票数据初步清洗后的备注栏中的项目名称进行提取, 得到包含所述项目 地址和所述项目名称的所述项目属性信息 。 4.根据权利要求3所述的税收风险检测方法, 其特征在于, 所述通过正则表达式对全部 所述发票数据初步清洗后的备注栏中与地址相关的前后文进行定位并识别定位位置的地 址之后, 还 包括: 如果位置识别失败, 则对初步清洗后的备注栏中的信息进行整体分词, 并与全国区划 地址进行匹配, 得到所述项目地址 。 5.根据权利要求3所述的税收风险检测方法, 其特征在于, 所述对提取到的全部所述项 目属性信息进行归集处 理, 得到归集后信息, 包括: 利用SimBERT模型对所述项目名称进行格式转化, 得到符合归集模型输入格式的所述 项目名称; 其中, 所述归集模型的框架为对比句向量表征的框架; 将格式转化后的所述项目名称输入所述归集模型, 以便所述归集模型对包含归集后项 目名称的所述归集后信息进行输出。 6.根据权利要求5所述的税收风险检测方法, 其特 征在于, 还 包括: 通过词重复方法对训练样本中的字词进行随机复制, 以构建正例; 通过动量对比方法将动 量模型生成的新文本放入队列并从队列中剔除旧文本, 以构建 负例; 利用构建后的正例和负例对由对比句向量表征的框架搭建的空白模型进行训练, 得到 所述归集模型。 7.根据权利要求1至6任一项所述的税收风险检测方法, 其特征在于, 所述第三方数据 包括项目申报数据和三方招投标 数据;权 利 要 求 书 1/2 页 2 CN 115455960 A 2相应的, 所述基于所述归集后信 息和所述第 三方数据构建与 所述目标项目对应的项目 台账, 并通过判断根据所述项目台账生成的风险指标值是否满足预设条件的方式对所述待 检测企业的税收风险进行检测, 包括: 基于所述归集后信 息、 所述项目申报数据和所述三方招投标数据构建与所述目标项目 对应的所述项目台账; 根据所述项目台账中的建安服务收入、 合同金额及 建安服务发票金额计算各级风险指 标值; 判断各级风险指标值是否满足所述预设条件, 如果是, 则判定所述待检测企业存在税 收风险。 8.一种税收风险检测装置, 其特 征在于, 包括: 获取模块, 用于获取与待检测企业的目标项目相关的全部发票数据; 提取及归集模块, 用于从全部所述发票数据中提取出所述目标项目的项目属性信息, 并对提取到的全部所述项目属性信息进行归集处 理, 得到归集后信息; 构建及检测模块, 用于基于所述归集后信息构建与所述目标项目对应的项目台账, 并 通过判断根据所述项目台账生成的风险指标值是否满足预设条件的方式对所述待检测企 业的税收风险进行检测。 9.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器; 其中所述存储器用 于存储计算机程序, 所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一 项所述的税收风险检测方法。 10.一种计算机可读存储介质, 其特征在于, 用于存储计算机可执行指令, 所述计算机 可执行指令被处理器加载并执行时, 实现如权利要求1至7任一项所述的税收风险检测方 法。权 利 要 求 书 2/2 页 3 CN 115455960 A 3

.PDF文档 专利 一种税收风险检测方法、装置、设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种税收风险检测方法、装置、设备及存储介质 第 1 页 专利 一种税收风险检测方法、装置、设备及存储介质 第 2 页 专利 一种税收风险检测方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:03:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。