说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111679407.8 (22)申请日 2021.12.31 (71)申请人 成都卫士通信息产业股份有限公司 地址 610041 四川省成 都市高新区云华路 333号 (72)发明人 邱星煜 吴杰 (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 刘源 (51)Int.Cl. G06F 16/22(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种数据库表分级方法、 装置、 可读存储介 质及电子设备 (57)摘要 本公开涉及一种数据库表分级方法、 装置、 可读存储介质及电子设备, 本公开采用多层复合 结构的神经网络模型实现了数据库表的智能分 级, 对于来自不同行业、 不同部门的任意数据库 表, 均可经过神经网络模型直接输出对应的保密 级别, 无需任何额外的规则判定, 无需针对不同 分级标准训练不同的模型, 实现了模 型的泛化应 用; 而且, 本公开通过模型本身对数据库表的信 息进行语义理解, 不需要专家先验知识和人为理 解语义, 使得模型更具普遍适用性, 提高了库表 分级效率。 权利要求书3页 说明书15页 附图4页 CN 114297205 A 2022.04.08 CN 114297205 A 1.一种数据库表分级方法, 其特 征在于, 包括: 获取不同行业、 不同部门的数据库表信息, 并基于所述数据库表信息构建训练数据集; 构建多层复合结构的神经网络模型; 其中, 所述神经网络模型用于根据数据库表的信 息确定所述数据库表的保密级别; 利用所述训练数据集对所述神经网络模型进行训练, 得到训练完成的数据库表分级模 型; 获取待分级数据库表, 并将所述待分级数据库表输入至所述数据库表分级模型, 得到 所述待分级数据库表的保密级别。 2.如权利要求1所述的数据库表分级方法, 其特征在于, 所述数据库表信 息包括不同数 据库表各自的部门名称、 库表表名、 表内信息项名称及所述不同数据库表各自对应的分级 标签和行业标签。 3.如权利要求2所述的数据库表分级方法, 其特征在于, 基于所述数据库表信 息构建训 练数据集, 包括: 对每个所述数据库表的部门名称、 库表表名及表内信 息项名称均进行去重和去除不合 法信息的处 理; 随机增加或剔除每 个所述数据库表所包 含的信息项中对分级结果无影响的信息项; 为每个所述数据库表所包含的信息项构造新特征; 其中, 所述新特征为与表内信息项 相关联且 对分级结果有影响的特 征变量; 将每个所述数据库表对应构造的新特征与每个所述数据库表最终处理后的部门名称、 库表表名和表内信息项名称, 以及每个所述数据库表对应的分级标签和行业标签组合起 来, 构成所述训练数据集。 4.如权利要求3所述的数据库表分级方法, 其特征在于, 构建多层复合结构的神经网络 模型, 包括: 构建第一神经网络结构; 所述第一神经网络结构用于基于所述数据库表的部门名称、 库表表名及表内信息项名称一一对应生成预设维度的语义特征向量, 并将同一数据库表内 的信息项名称对应的语义特征向量相加, 得到语义特征聚合向量, 且将所述语义特征聚合 向量进行映射, 得到维度不变的第一特 征向量; 构建第二神经网络结构; 所述第 二神经网络结构用于将所述同一数据库表对应构造的 新特征进行组合, 得到组合特征, 并基于所述组合特征生成与所述语义特征向量维度相同 的第二特 征向量; 构建第三神经网络结构; 所述第 三神经网络结构用于基于所述数据库表的部门名称对 应的语义特 征向量对所述数据库表进行 行业分类; 构造第四神经网络结构; 所述第四神经网络结构用于为所述同一数据库表的部门名称 和库表表名对应的语义特征向量以及所述同一数据库表对应的第一特征向量和第二特征 向量赋予预设向量权重值并相加, 得到第三特征向量, 并基于所述第三特征向量对所述同 一数据库表进行粗粒度分级及细粒度分级; 其中, 细粒度分级对应的分级种类多于粗粒度 分级对应的分级种类; 将所述第一神经网络结构、 所述第二神经网络结构、 所述第三神经网络结构及所述第 四神经网络结构组合 起来, 得到所述多层复合结构的神经网络模型。权 利 要 求 书 1/3 页 2 CN 114297205 A 25.如权利要求 4所述的数据库表分级方法, 其特 征在于, 构建第一神经网络结构, 包括: 构建embedding层; 所述embedding层用于将基于所述数据库表的部 门名称、 库表表名 及表内信息项名称中每 个字符均映射成中文字向量; 构建双层双向的循环神经网络; 所述循环神经网络用于将每个所述中文字向量均转换 为预设维度的语义特 征向量; 构建向量相加层; 所述向量相加层用于将所述同一数据库表内的信 息项名称对应的语 义特征向量相加, 得到语义特 征聚合向量; 构建第一全连接层; 所述第一全连接层用于将所述语义特征聚合向量进行映射, 得到 维度不变的语义特 征映射向量; 构建第一dropout层; 所述第一dropout层用于将所述语义特征映射向量进行映射, 得 到维度不变的第一特 征向量。 6.如权利要求 4所述的数据库表分级方法, 其特 征在于, 构建第二神经网络结构, 包括: 构建第二全连接层; 所述第 二全连接层用于将所述同一数据库表对应构造的新特征进 行组合, 得到组合特征, 并基于所述组合特征生成与所述语义特征向量维度相同的新特征 向量; 构建批度归一化层; 所述批度归一化层用于将所述新特征向量进行数值归一化处理, 得到新特 征数值归一 化向量; 构建激活函数层; 所述激活函数层用于将所述新特征数值归一化向量进行非线性处 理, 得到非线性处 理后的新特 征数值归一 化向量; 构建第二dropout层; 所述第二dropout层用于将非线性处理后的所述新特征数值归一 化向量进行映射, 得到维度不变的第二特 征向量。 7.如权利要求 4所述的数据库表分级方法, 其特 征在于, 构建第三神经网络结构, 包括: 构建第三全连接层; 所述第 三全连接层用于对所述数据库表的部门名称对应的语义特 征向量进行映射, 得到维度不变的部门特 征映射向量; 构建第一分类层; 所述第 一分类层用于基于所述部门特征映射向量对所述数据库表进 行行业分类。 8.如权利要求 4所述的数据库表分级方法, 其特 征在于, 构建第四神经网络结构, 包括: 构建向量权重相加层; 所述向量权重相加层用于为所述同一数据库表的部门名称和库 表表名对应的语义特征向量以及所述同一数据库表对应的第一特征向量和第二特征向量 赋予预设向量权 重值并相加, 得到第三特 征向量; 构建第四全连接层; 所述第 四全连接层用于对所述第三特征向量进行映射, 得到维度 不变的第一映射向量; 构建第二分类层; 所述第 二分类层用于基于所述第 一映射向量对所述同一数据库表进 行粗粒度分级; 构建第五全连接层; 所述第五全连接层用于对所述第三特征向量进行映射, 得到维度 不变的第二映射向量; 构建第三分类层; 所述第 三分类层用于基于所述第 二映射向量对所述同一数据库表进 行细粒度分级。 9.如权利要求4 ‑8任一项所述的数据库表分级方法, 其特征在于, 利用所述训练数据集权 利 要 求 书 2/3 页 3 CN 114297205 A 3
专利 一种数据库表分级方法、装置、可读存储介质及电子设备
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 00:18:45
上传分享
举报
下载
原文档
(675.4 KB)
分享
友情链接
GB/T 25387.2-2021 风力发电机组 全功率变流器 第2部分:试验方法.pdf
GB-T 958-2015 区域地质图图例.pdf
GB-T 13747.26-2022 锆及锆合金化学分析方法 第26部分:合金及杂质元素的测定 电感耦合等离子体原子发射光谱法.pdf
GB-T 39130-2020 镀锌产品锌层附着性试验方法.pdf
GB-T 25068.3-2022 信息技术 安全技术 网络安全 第3部分:面向网络接入场景的威胁、设计技术和控制.pdf
专利 一种安全编排和自动化响应方法.PDF
GB-T 39908-2021 科技计划形成的科学数据汇交 通用代码集.pdf
GB-T 42506-2023 国有企业采购信用信息公示规范.pdf
T-CQJR 001—2022 绿色金融数字化平台建设指南.pdf
T-GDFZ 0001—2018 无缝压胶服装.pdf
国泰君安 计算机行业:态势感知,预见未来 2019.pdf
DB65-T 4536.8—2022 电子政务外网建设规范第8部分:网络质量规范 新疆维吾尔自治区.pdf
HJ 1238—2021 汽车排放定期检验信息采集传输技术规范.pdf
T-CI 032—2022 矿山酸性污染全过程控制与治理技术指南.pdf
GB-T 37830-2019 抗污易洁涂膜玻璃.pdf
GB-T 7931-2008 1500 11 000 12 000 地形图航空摄影测量外业规范.pdf
GB-T 25712-2010 振动时效工艺参数选择及效果评定方法.pdf
HJ 1209-2021 工业企业土壤和地下水自行监测技术指南(试行).pdf
T-CITS 0004—2023 高性能医用冷藏箱技术要求及检测方法.pdf
DB43-T 2091-2021 烤烟与半夏套种技术规程 湖南省.pdf
1
/
3
23
评价文档
赞助1.5元 点击下载(675.4 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。