说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210594624.5 (22)申请日 2022.05.27 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 赵旭 任志星 李湛 陈林平  马丁士博   (74)专利代理 机构 北京同钧律师事务所 16 037 专利代理师 杜叶蕊 许怀远 (51)Int.Cl. G06K 9/62(2022.01) G06F 40/30(2020.01) G06N 20/00(2019.01) (54)发明名称 负载特征确定方法、 语义模型训练方法、 装 置及设备 (57)摘要 本申请实施例提供一种负载特征确定方法、 语义模型训练方法、 装置及设备, 该方法包括确 定N个标签词, N为大于1的整数; 对N个标签词进 行语义分析和聚类处理, 以确定多个应用类别, 一个应用类别对应至少一个标签词; 根据多个应 用类别和多个实例规格确定多个场景类别, 实例 规格指示实例的资源大小, 实例用于运行应用; 获取场景类别对应的负载数据, 并根据场景类别 对应的负载数据确定场景类别对应的负载特征。 提高了确定不同场景 下的负载特 征的精确度。 权利要求书2页 说明书18页 附图9页 CN 114997302 A 2022.09.02 CN 114997302 A 1.一种负载 特征确定方法, 其特 征在于, 包括: 确定N个标签词, 所述 N为大于1的整数; 对所述N个标签词进行语义分析和聚类处理, 以确定多个应用类别, 一个所述应用类别 对应至少一个标签词; 根据所述多个应用类别和多个实例规格确定多个场景类别, 所述实例规格指示实例的 资源大小, 所述实例用于运行应用; 获取所述场景类别对应的负载数据, 并根据 所述场景类别对应的负载数据确定所述场 景类别对应的负载 特征。 2.根据权利要求1所述的方法, 其特征在于, 对所述N个标签词进行语义分析处理和聚 类处理, 以确定多个 应用类别, 包括: 通过语义模型对所述N个标签词进行处理, 得到所述N个标签词对应的N个语义特征向 量; 对所述N个语义特征向量进行聚类处 理, 以确定所述多个 应用类别。 3.根据权利要求2所述的方法, 其特征在于, 对所述N个语义特征向量进行聚类处理, 以 确定所述多个 应用类别, 包括: 通过预设算法对所述N个语义特征向量进行聚类处理, 得到多个聚类集合, 所述聚类集 合中包括至少一个 语义特征向量; 确定每个聚类集合对应的应用类别, 以得到所述多个应用类别; 其中, 所述应用类别对 应的至少一个标签词包括: 所述应用类别对应的聚类集合中各语义特征向量所对应的标签 词。 4.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 根据 所述多个应用类别和多个实 例规格确定多个场景类别, 包括: 获取所述多个实例规格; 对所述多个应用类别和所述多个实例规格进行组合处理, 得到所述多个场景类别, 其 中, 一个所述场景类别包括 一个所述应用类别和一个所述实例规格。 5.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 获取所述场景类别对应的负载数 据, 包括: 根据所述场景类别, 确定多个第一实例, 所述第一实例的实例规格与所述场景类别 中 的实例规格相同, 所述第一实例中运行 的第一应用对应的标签词包括: 所述场景类别中的 应用类别所对应的标签词中的至少一个; 将所述多个第一实例的负载 数据, 确定为所述场景类别对应的负载 数据。 6.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 根据 所述场景类别对应的负载数 据确定所述场景类别对应的负载 特征, 包括: 在所述场景类别对应的负载 数据中确定多类负载 数据; 确定每类负载数据对应的数据统计值; 根据每类负载数据对应的数据统计值, 确定所述场景类别对应的负载 特征。 7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 根据 所述场景类别对应的负载数 据确定所述场景类别对应的负载 特征之后, 还 包括: 在预设数据库中存 储所述场景类别和所述场景类别对应的负载 特征。权 利 要 求 书 1/2 页 2 CN 114997302 A 28.根据权利要求1 ‑7任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取负载 特征查询请求, 所述负载 特征查询请求中包括第一实例规格和第一标签词; 查询预设数据库中是否存在所述第一实例规格和所述第一标签词匹配的目标场景类 别, 所述目标场景类别包括所述第一实例规格和所述第一标签词; 若是, 则将所述目标场景类别对应的负载特征确定为目标负载特征; 显示所述目标负 载特征, 或者, 发送所述目标负载 特征。 9.一种语义模型训练方法, 其特 征在于, 包括: 获取实例标签数据, 所述实例标签数据包括多个用户对多个实例进行标记的标签数 据; 根据所述实例标签数据确定每 个用户对应的X个标签词, 所述X为大于1的整数; 根据每个用户对应的X个标签词, 生成每个用户对应的样本数据, 所述样本数据包括所 述用户对应的每 个标签词的N维向量和所述用户对应的X个标签词的N*X维向量; 根据所述多个用户对应的样本数据进行模型训练, 得到语义模型, 所述语义模型用于 确定标签词的语义特 征向量。 10.根据权利要求9所述的方法, 其特征在于, 针对所述多个用户中的任意一个用户; 根 据所述实例标签数据确定所述用户对应的X个标签词, 包括: 在所述实例标签数据中确定所述用户标记的多个标签词、 以及所述用户对每个标签词 的标记次数; 按照所述用户对每个标签词的标记次数从大到小的顺序, 对所述用户标记的多个标签 词进行排序; 将排序后的多个标签词中的前 X个标签词, 确定为所述用户对应的X个标签词。 11.根据权利要求9或10所述的方法, 其特征在于, 针对所述多个用户中的任意一个用 户; 根据所述用户对应的X个标签词, 生成所述用户对应的样本数据, 包括: 按照预设编码规则, 对所述用户对应的X个标签词进行编码, 得到X个N维向量; 根据所述X个N维向量, 确定所述X个标签词的N*X维向量; 其中, 所述样本数据包括所述X个N维向量和所述 N*X维向量。 12.根据权利要求9 ‑11任一项所述的方法, 其特征在于, 所述语义模型包括输入层、 中 间层和输出层; 其中, 所述中间层用于 输出标签词的语义特 征向量。 13.一种电子设备, 其特 征在于, 包括: 存 储器和处 理器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 使得所述处理器执行如权利要求 1至8任一项所述的负载特征确定方法, 或者权利要求9至12任一项所述的语义模型训练方 法。 14.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 执行指令, 当所述计算机执行指 令被处理器执行时用于实现权利要求 1至8任一项 所述的负 载特征确定方法, 或者权利要求9至12任一项所述的语义模型训练方法。权 利 要 求 书 2/2 页 3 CN 114997302 A 3

.PDF文档 专利 负载特征确定方法、语义模型训练方法、装置及设备

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 负载特征确定方法、语义模型训练方法、装置及设备 第 1 页 专利 负载特征确定方法、语义模型训练方法、装置及设备 第 2 页 专利 负载特征确定方法、语义模型训练方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。