(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210998318.8
(22)申请日 2022.08.19
(71)申请人 上海东普信息科技有限公司
地址 201707 上海市青浦区外 青松公路
5045号508室U区4 4号
(72)发明人 蒋晓天 杨周龙
(74)专利代理 机构 上海汉声知识产权代理有限
公司 3123 6
专利代理师 胡晶
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/08(2012.01)
G06F 16/901(2019.01)
(54)发明名称
基于字典树的地址预测方法、 装置、 设备和
存储介质
(57)摘要
本发明公开了一种基于字典树的地址预测
方法、 装置、 设备和存储介质, 针对现有的基于神
经网络的地址预测算法准确率低的问题, 通过服
务端获取历史揽派件成功的物 流数据, 提取物流
数据中物 流订单的包括揽件网点的地址、 始发分
拨中心的地址、 目的分拨中心的地址和目的网点
的地址在内的地址数据; 采用双数组字典树算
法, 以物流订单为单位, 对地址数据进行归集, 得
到地址数据集; 获取目标物流订单数据, 将目标
物流订单的寄件地址及收件地址输入基于地址
数据集的地址预测模块, 得到目标物 流订单的揽
件网点的地址、 始发分拨中心的地址、 目的分拨
中心的地址和目的网点的地址。 用字典树代替神
经网络的分类器, 对叶节点进行精细化管理, 提
高地址预测准确率。
权利要求书3页 说明书9页 附图2页
CN 115456251 A
2022.12.09
CN 115456251 A
1.一种基于 字典树的地址预测方法, 其特 征在于, 包括:
服务端获取历史揽派件成功的物流数据, 提取物流数据中每个物流订单的包括揽件 网
点的地址、 始发分拨中心的地址、 目的分拨中心的地址和目的网点的地址在内的地址数据;
采用双数组字典树算法, 以物流订单为单位, 对所述地址数据进行归集, 得到地址数据
集;
获取目标物流订单数据, 将目标物流订单的寄件地址及收件地址输入基于地址数据集
的地址预测模块, 得到所述目标物流订单的揽件网点的地址、 始发分拨中心的地址、 目的分
拨中心的地址和目的网点的地址 。
2.如权利要求1所述的基于字典树的地址预测方法, 其特征在于, 所述采用双数组字典
树算法, 以物流 订单为单位, 对所述 地址数据进行归集进一 步包括:
获取每个物流订单的寄件地址对应的网点标识和收件地址的对应的网点标识, 从而确
定揽件网点的地址及目的网点的地址;
对揽件网点的地址、 始发分拨中心 的地址、 目的分拨中心 的地址和目的网点的地址进
行编码;
对所述编码进行基于双数组字典树的地址归集, 得到地址数据集。
3.如权利要求2所述的基于字典树的地址预测方法, 其特征在于, 所述对编码进行基于
双数组字典树的地址归集进一 步包括:
一个编码即为 一个节点;
在构造双数组时, 根据当前活动节点层中节点的直接 子节点数, 计算 概率评价函数:
得到:
其中, i*为当前活动节点层的第i个活动节点下的直接子节点数, N为 当前活动节点层下
的所有活动节点的直接 子节点数的总和, n 为当前活动节点层共有n个活动节点;
赋予当前活动节点层中所有节点的插 入概率区间:
在[0,1]区间内随机生成一个插入因子, 确定所述插入因子所属的插入概率区间, 将所
述插入概率区间的活动节点选入。
4.如权利要求2所述的基于字典树的地址预测方法, 其特征在于, 所述获取每个物流订
单的寄件地址对应的网点标识和收件地址的对应的网点标识, 从而确定揽件网点的地址及
目的网点的地址进一 步包括:
在揽件区域找到满足预设条件 的若干POI核心点, POI核心点包含名称、 类别、 坐标、 分
类在内的信息;
给每一POI核心点添加围栏, 表示出每 个揽件区域, 具体为:
创建每一POI核心点 为一个中心点 坐标;权 利 要 求 书 1/3 页
2
CN 115456251 A
2按照预设半径值添加圆形围栏, 形成一适配的揽件区域, 建立所述揽件区域与网点标
识的适配关系;
确定寄件地址所处的揽 件区域, 得到所述揽 件区域对应的网点标识。
5.如权利要求1所述的基于字典树的地址预测方法, 其特征在于, 所述获取目标物流订
单数据, 将目标物流订单 的寄件地址及收件地址输入基于地址数据集的地址预测模块, 得
到所述目标物流订单 的揽件网点的地址、 始发分拨中心的地址、 目的分拨中心的地址和目
的网点的地址进一 步包括:
将目标物流订单的寄件地址及收件地址输入所述地址预测模块, 得到包含寄件地址对
应的网点标识及收件地址对应的网点标识的第一中间结果;
所述地址预测模块根据所述第一中间结果, 查询网点信息表, 得到包含揽件网点地址
的编码及目的网点 地址的编码的第二中间结果;
根据所述第二中间结果, 查询所述地址数据集, 得到所述目标物流订单的揽件网点的
地址、 始发分拨中心的地址、 目的分拨中心的地址和目的网点的地址信息 。
6.如权利要求1所述的基于字典树的地址预测方法, 其特征在于, 得到所述目标物流订
单的揽件网点的地址、 始发分拨中心的地址、 目的分拨中心的地址和目的网点的地址 之后,
还包括:
对得到的揽件网点的地址、 始发分拨中心 的地址、 目的分拨中心 的地址和目的网点的
地址进行验证, 若出现异常, 则按预设算法进行地址纠错。
7.一种基于 字典树的地址预测装置, 其特 征在于, 包括:
数据预处理模块, 用于服务端获取历史揽派件成功 的物流数据, 提取物流数据中每个
物流订单 的包括揽件网点的地址、 始发分拨中心的地址、 目的分拨中心的地址和目的网点
的地址在内的地址数据;
地址归集模块, 用于采用双数组字典树算法, 以物流订单为单位, 对所述地址数据进行
归集, 得到地址数据集;
地址预测模块, 用于获取目标物流订单数据, 将目标物流订单的寄件地址及 收件地址
输入基于地址数据集的地址预测模块, 得到所述 目标物流订单的揽件网点的地址、 始发分
拨中心的地址、 目的分拨中心的地址和目的网点的地址 。
8.如权利要求7所述的基于字典树的地址预测装置, 其特征在于, 所述地址归集模块包
括:
初始地址获取模块, 用于获取每个物流订单的寄件地址对应的网点标识和收件地址的
对应的网点标识, 从而确定揽 件网点的地址及目的网点的地址;
编码模块, 用于对揽件网点的地址、 始发分拨中心的地址、 目的分拨中心的地址和目的
网点的地址进行编码;
归集模块, 用于对所述编码进行基于双数组字典树的地址归集, 得到地址数据集。
9.一种基于字典树的地址预测设备, 其特征在于, 包括: 存储器和 处理器, 所述存储器
中存储有计算机可读指令, 所述计算机可读指令被所述处理器执行时, 使得所述处理器执
行如权利要求1至 6中任意一项所述的基于 字典树的地址预测方法中的步骤。
10.一种存储有计算机可读指令的存储介质, 其特征在于, 所述计算机可读指令被一个
或多个处理器执行时, 使得一个或多个处理器执行如权利要求1至6中任意一项 所述的基于权 利 要 求 书 2/3 页
3
CN 115456251 A
3
专利 基于字典树的地址预测方法、装置、设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:25:46上传分享