说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210318526.9 (22)申请日 2022.03.29 (71)申请人 江苏科技大学 地址 212008 江苏省镇江市京口区梦溪路2 号 (72)发明人 汪锦 窦慧莉 束鑫 杨习贝  (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 专利代理师 柏尚春 (51)Int.Cl. G06F 8/34(2018.01) G06F 9/451(2018.01) (54)发明名称 一种基于粗糙集理论的度量可视化工具的 实现方法 (57)摘要 本发明公开了一种基于粗糙集理论的度量 可视化工具的实现方法, 其特征在于, 所述度量 可视化工具将用于属性评价的度量 以可视化展 示, 其以粗糙集模型和邻域分类器为基础, 关联 四种常用度量: 近似质量、 条件熵、 邻域鉴别指 数、 邻域决策错误率; 步骤如下: (1)解析csv格式 文件,结合邻域粗糙集理论求解邻域关系和决策 信息; (2)进行近似质量、 条件熵、 邻域鉴别指数、 邻域决策错误率的可视化过程; (3)进行数据分 布散点图显示; (4)进行数据集表 格化展示。 本发 明使得度量可视化方便快捷, 提高人机交互效 率。 权利要求书3页 说明书7页 附图7页 CN 114675818 A 2022.06.28 CN 114675818 A 1.一种基于粗糙集理论的度量可视化工具的实现方法, 其特征在于, 所述度量可视化 工具将用于属 性评价的度量以可视化展示, 其以粗糙集模型和邻域分类器为基础, 关联四 种常用度量: 近似质量、 条件熵、 邻域 鉴别指数、 邻域决策错 误率; 步骤如下: (1)解析csv格式文件,结合邻域 粗糙集理论求解邻域关系和决策信息: 步骤001, 用户通过文件上传组件提交需要解析的csv格式文件, 所述度量可视化工具 解析文件, 获取文件中数据的属性名、 条件属性、 决策属性 等信息; 步骤002, 由步骤001解析出的数据信息, 结合拓扑空间中的球形邻域概念, 对于包含所 有样本的目标数据集合U, 用A表示U中条件属性集合, D表示U中决策属性集合, 其条件属性 子集B上的邻域关系可表示 为: 上式δ为邻域半径, 所述度 量可视化工具中, 选定0.02至0.2之间, 步长为0.02的10个数 值作为邻域半径构建目标数据集的10个邻域关系, 此外, 上式中的x,y分别表示U中任意两 点, ΔB(x,y)则表示U中任意两点的欧几里 得距离; 步骤003, 由步骤0 02的邻域关系, 条件属性子集B中的邻域信息粒 可表示为: 所述度量可视化工具中构建了10个邻域关系也 就有10个邻域信息粒; 步骤004, 依据邻域粗糙集模型理论, 给定一个决策系统, 由条件属性子集 所提供 的对样本的描述信息, 其 不可分辨关系I NDB的计算公式为: 上式中a∈B,a(x)表示样本x在条件属性B上的取值; 步骤005, 利用步骤004获得的不可分辨关系得到样本集合上的一组类别划分, 将同类 样本集合用下述公式表示: [x]d={y∈U:d(x)=d(y)} 式中d(x)表示样本x的决策属性 值; 类似地, 将异类样本集 合用下述公式表示: [x]~d={y∈U:d(x)≠d(y)} 步骤006, 使用JavaScript语言实现上述 步骤002至步骤0 05, 求解公式中的各参数值; (2)进行近似质量、 条件熵、 邻域 鉴别指数、 邻域决策错 误率的可视化过程。 2.根据权利要求1所述的一种基于粗糙集理论的度量可视化工具的实现方法, 其特征 在于, 所述 步骤(2)中近似质量度量可视化过程具体包括以下步骤: 步骤101, 根据步骤0 06中所求结果, 带入近似质量AQ计算公式: 近似质量AQ的取值范围在0 到1之间, 且近似质量越大, 条件属性 集合越好; 步骤102, 将步骤101中计算所得的各属性近似质量作为参数传入ECharts图库的柱状 图、 折线图和漏斗图组件中, 这些可视化图形组件将其渲 染在浏览器页面上, 通过柱状图高 低、 折线图起伏和漏斗图的粗细可以直观的获取某些属 性近似质量大小, 可认为近似质量 取值越大的属性表现越好; 步骤103, 在步骤102所画三个图表中添加时间轴关联, 以10个不同的邻域半径作为时权 利 要 求 书 1/3 页 2 CN 114675818 A 2间轴上的动态数据, 开发实现三图联动功能, 可通过柱状图、 折线图、 漏斗图的动态变化分 析出在不同邻域半径下各属性近似质量的走向趋势, 通过观察趋势掌握表现较好邻域半径 的取值; 步骤104, 近似质量可视化过程结束。 3.根据权利要求1所述的一种基于粗糙集理论的度量可视化工具的实现方法, 其特征 在于, 所述 步骤(2)中条件熵度量可视化实现具体包括以下步骤: 步骤201, 根据步骤0 06所求结果, 带入条件熵C E计算公式: 条件熵CE的取值范围在0 到|U|/e之间, 且条件熵越小, 条件属性 集合越好; 步骤202, 将步骤201中计算所得的各属性条件熵作为参数传入ECharts图库的柱状图、 折线图和漏斗图组件中, 这些可视化图形组件将其渲 染在浏览器页面上, 通过柱状图高低、 折线图起伏和漏斗图的粗细可以直观的获取某些属性条件熵大小, 条件熵取值越小可认为 该属性对刻画不同决策类的不确定性表现越好; 步骤203, 在步骤202所画三个图表中添加时间轴关联, 以10个不同的邻域半径作为时 间轴上的动态数据, 实现上述 三个图表的联动功能; 步骤204, 条件熵可视化过程结束。 4.根据权利要求2或3所述的一种基于粗糙集理论的度量可视化工具的实现方法, 其特 征在于, 所述度量可视化工具在绘制出整体近似质量和条件熵的同时还实现了局部近似质 量和条件熵的可视化, 以局部 视角考虑当前决策类中的样本, 忽略当前决策类外的样本 。 5.根据权利要求1所述的一种基于粗糙集理论的度量可视化工具的实现方法, 其特征 在于, 所述 步骤(2)中邻域 鉴别指数度量可视化实现具体包括以下步骤: 步骤301, 根据步骤0 06所求结果, 带入邻域 鉴别指数NDI计算公式: 邻域鉴别指数NDI的取值范围在0到log|U|之间, 且邻域鉴别指数越小, 条件属性集合 越好; 步骤302, 将步骤301中计算所得的各属性邻域鉴别指数作为参数传入ECharts图库的 柱状图、 折线图和漏斗图组件中, 这些可视化图形组件将其渲染在浏览器页面上, 通过页面 展示结果可以发现对于邻域鉴别指数小的属性, 可认为其对于不同决策类的鉴别能力表现 较好; 步骤303, 在步骤302所画三个图表中添加时间轴关联, 以10个不同的邻域半径作为时 间轴上的动态数据, 实现上述 三个图表的联动功能; 步骤304, 邻域鉴别指数 可视化过程结束。 6.根据权利要求1所述的一种基于粗糙集理论的度量可视化工具的实现方法, 其特征 在于, 所述 步骤(2)中领域决策错 误率度量可视化实现具体包括以下步骤: 步骤401, 根据步骤0 06所求结果, 带入邻域决策错 误率NDER计算公式:权 利 要 求 书 2/3 页 3 CN 114675818 A 3

.PDF文档 专利 一种基于粗糙集理论的度量可视化工具的实现方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于粗糙集理论的度量可视化工具的实现方法 第 1 页 专利 一种基于粗糙集理论的度量可视化工具的实现方法 第 2 页 专利 一种基于粗糙集理论的度量可视化工具的实现方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:23:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。