(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111617957.7
(22)申请日 2021.12.28
(65)同一申请的已公布的文献号
申请公布号 CN 113987593 A
(43)申请公布日 2022.01.28
(73)专利权人 北京妙医佳健康科技 集团有限公
司
地址 100027 北京市朝阳区霄云 路40号院1
号楼5层0 5-169
(72)发明人 赵红文 赵进 刘邦长 赵阳
孙振兴
(74)专利代理 机构 北京中索 知识产权代理有限
公司 11640
代理人 高海涛
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G06F 40/242(2020.01)
G06F 21/60(2013.01)
(56)对比文件
CN 106951411 A,2017.07.14CN 113436612 A,2021.09.24
CN 113486659 A,2021.10.08
US 2011055192 A1,201 1.03.03
CN 112836484 A,2021.0 5.25
杨旭东. 《深度学习语义相似度系列:
Ranking Similarity》 . 《ht tps://
zhuanlan.zhihu.com/p/141545 370》 .2020,第1-
8页.
TonyZhou110229. 《深度学习解决N LP问题:
语义相似度计算— —DSSM》 . 《https://
blog.csdn.net/u013 074302/article/detai ls/
76422551》 .2017,第1-14页.
杨清琳等. 《云计算下支持语义的可搜索加
密方法研究》 . 《计算机技 术与发展》 .2020,第3 0
卷(第3期),第1 11-116页. (续)
审查员 刘婷
(54)发明名称
一种数据处 理方法
(57)摘要
本申请提供了一种数据处理方法, 其中, 在
得到主题部分中包括的关键词后, 通过各关键词
对该主题部分的价值对应的得分, 确定该主题部
分中价值较高的目标关键词, 从而得到该主题部
分中价值较高的词语, 然后再确定出与目标关键
词表达内容相似的相似词, 然后确定出的各相似
词和目标关键词采用不同的加密方式进行加密,
以增加健康档案泄漏出去后解密的难度, 并根据
各个需要加密 的词语的先后顺序生成用于解密
的标识串序列, 并生成用于对健康档案进行解密
的解密二维码, 以便只有用户才能对健康档案进行解密, 通过上述方法, 可 以避免健康档案中的
内容泄漏出去, 从而提高了健康档案中的内容的
安全性。
[转续页]
权利要求书1页 说明书6页 附图1页
CN 113987593 B
2022.03.15
CN 113987593 B
(56)对比文件
xwz_new. 《对加密数据的高效相似性 查询
(二) 》 . 《ht tps://blog.csdn.net/u010452816 /
article/detai ls/50208359》 .2020,第1-4页.
Zhangjie Fu. 《Multi-keyw ord ranked search supporting synonym query over
encrypted data i n cloud computi ng》 . 《2013
IEEE 32nd I nternati onal Performance
Computing and Com munications Conference
(IPCCC)》 .2014,第1-8页.2/2 页
2[接上页]
CN 113987593 B1.一种数据处 理方法, 其特 征在于, 包括:
在检测到对健康档案进行关闭的操作指令时, 对于所述健康档案中的每一主题部分,
提取该主题部分中包括的关键词;
根据为该主题部分中包括的每一关键词所表征意思进行的赋值, 通过反文档概率计算
用于表示该关键词在该主题部分下的价 值的得分值;
确定该主题部分中得分值高于预设得分值的目标关键词;
对于每个目标关键词, 通过以下公式确定该主题部分中与该目标关键词为语义相似的
相似词, 以将该目标关键词和所述相似词作为待加密词语:
其中,
为该目标关键词,
为对该主题部分中的文本进行切词后得到的各个备选
词语,
为大于数值0的阈值,
为
之间的边赋予的权重的最短路
径长度;
对于每个待加密词语, 利用随机算法, 从词语加密库中选择该待加密词语对应的加密
算法;
利用所述加密算法对对应的待加密词语进行加密, 并根据 各所述待加密词语在该主题
部分下的文本中位置的先后顺序对各待加密词语对应的加密算法的标识进行排序;
对得到的排序 结果和该主题部分的标识进行配对, 以得到包含该主题部分的标识和所
述排序结果的标识串;
在得到所述健康档案包括的所有主题部分的标识串后, 按照各主题部分在所述健康档
案中的先后顺序, 对得到的多个标识串 进行排序, 得到标识串序列;
根据所述标识串序列和所述健康档 案对应的标识生成所述健康档案的解密二维码, 并
将所述解密二维码发送给用户端, 以使用户根据所述用户端中的解密二 维码对所述健康档
案进行解密。
2.如权利要求1所述的方法, 其特 征在于, 所述 提取该主题部分中包括的关键词, 包括:
对获得的语音信息进行语义识别, 将得到的目标语义下的词语作为所述关键词;
或者,
根据预设词典, 确定该主题部分中包括的关键词;
或者,
对该主题部分下的文本内容进行分词, 以将分词结果中除停用词之外的词语作为所述
关键词。
3.如权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
在通过二维码扫描设备得到目标解密二维码后, 对所述目标解密二维码进行识别, 确
定所述目标解密二维码中包括的目标 标识和目标 标识串序列;
根据所述目标 标识确定目标健康档案;
按照所述目标健康档 案中各主题部分中的加密词语的先后 顺序, 使用所述目标标识串
序列中该主题部分对应的标识串对加密词语进行解密, 以对加密词语进行还原。权 利 要 求 书 1/1 页
2
CN 113987593 B
3
专利 一种数据处理方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 04:13:41上传分享