专利一种基于视觉分析的食物营养评估方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210023062.9 (22)申请日 2022.01.10 (71)申请人北京工商大学地址 100048 北京市海淀区阜成路3 3号 (72)发明人李海生　王薇　董笑笑　李楠　李勇　 (74)专利代理机构北京科迪生专利代理有限责任公司 1 1251 专利代理师金怡 (51)Int.Cl. G06V 20/68(2022.01) G06V 10/26(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06T 7/62(2017.01) G06T 17/20(2006.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G16H 20/60(2018.01) (54)发明名称一种基于视觉分析的食物营养评估方法及系统 (57)摘要本发明涉及一种基于视觉分析的食物营养评估方法及系统，其方法包括： S1：获取进食前后的食物RGB图像和深度图像； S2：使用Mask R‑CNN 获取RGB食物图像的类别及其视觉区域，并对深度图像中食物区域进行标记； S3：构建并训练3D 卷积神经网络，将标记好的深度图像输入训练好的3D卷积神经网络，预测得到对视图深度图像； S4：将深度图像和对视图的深度图像注册到同一世界坐标中，得到食物的三维点云； S5：将点云应用于每个食物对象，使用基于凸包的算法对食物对象进行网格划分以计算食物体积； S6：根据食物体积和食物的类别，计算食物质量和营养量，将进食前后的食物营养量相减，得到准确的食物摄入量。本发明提供的方法，有效解决了日常生活中的膳食评估问题。权利要求书3页说明书6页附图4页 CN 114463740 A 2022.05.10 CN 114463740 A 1.一种基于视觉分析的食物营养评估方法，其特征在于，包括：步骤S1：获取进食前和进食后的食物的RGB图像和深度图像，其中，所述RGB图像和所述深度图像的拍摄角度保持一致；步骤S2：使用MaskR ‑CNN神经网络获取所述RGB图像的食物的类别及其视觉区域，并对所述深度图像中相应的食物区域进行标记，得到标记好的深度图像；步骤S3：构建并训练3D卷积神经网络，将标记好的所述深度图像输入训练好的所述3D 卷积神经网络，预测得到所述深度图像的对视图深度图像；其中，所述3D卷积神经网络包括：初始层、编码器、全连接层和解码器；步骤S4：将所述深度图像和所述对视图的深度图像注册到同一世界坐标中，得到目标对象的完整三维点云；步骤S5：将所述点云应用于每个标记的食物对象，使用基于凸包的算法对所述食物对象进行网格划分以计算食物体积；步骤S6：根据所述食物体积和所述食物的类别，计算食物质量，与食物营养表进行对比，计算进食前和进食后的食物营养量，二者相减，得到准确的食物摄入量。 2.根据权利要求1所述的基于视觉分析的食物营养评估方法，其特征在于，所述步骤 S3：构建并训练3D卷积神经网络，将标记好的所述深度图像输入训练好的所述3D卷积神经网络，预测得到所述深度图像的对视图深度图像；其中，所述3D卷积神经网络包括：初始层、编码器、全连接层和解码器，具体包括：步骤S31：构建3D卷积神经网络，包括：初始层：由多层不同卷积核大小的卷积层连接在一起构成；一个编码器：由若干个具有不同卷积核的卷积层构成；若干个全连接层：经过所述全连接层共享特征，并对齐特征维度；一个解码器：由所述编码器经过逆置后与若干个卷积层共同构成；步骤S32：使用公开的二维视图和对应的三维模型数据集训练所述3D卷积神经网络，得到训练好的3D卷积神经网络；其中，所述3D卷积神经网络输出为输入图像对侧遮挡角度的深度图像，即对视图深度图像；定义所述3D卷积神经网络的损失函数如公式(1)所示：其中，为所述对视图深度图像的像素值， d(u,v)为所述深度图像的像素值， w和h 分别表示图像的宽度和高度， λ是损失函数中的正则化项， b为偏置量；步骤S33：将所述标记好的深度图像输入训练好的所述3D卷积神经网络，生成所述深度图像的对视图深度图像。 3.根据权利要求1所述的基于视觉分析的食物营养评估方法，其特征在于，所述步骤 S4：将所述深度图像和所述对视图的深度图像注册到同一世界坐标中，得到目标对象的完整三维点云，具体包括：步骤S41：将世界坐标的原点的位置移动到拍摄所述深度图像的相机中心，将所述深度图像重新投影到以下公式(2)的世界坐标中：权　利　要　求　书 1/3 页 2 CN 114463740 A 2其中， u,v表示所述深度图像中的坐标， X,Y,Z表示世界坐标中的坐标； Z是一个标量，表示depthmap(u,v)；是相机矩阵，其中fx,fy表示焦距的参数； cx,cy为主点偏移，即主点位置相对于图像平面(投影面)的位置；步骤S42：通过旋转和平移矩阵分别进行180度相机旋转和平移，可简化为以下公式 (3): 其中， θ 是相机沿y轴旋转的角度；步骤S43：通过以下公式(4)注册到相同的世界坐标，合成食物点云：其中，为旋转矩阵，为平移矩阵。 4.根据权利要求1所述的基于视觉分析的食物营养评估方法，其特征在于，所述步骤 S5：将所述点云应用于每个标记的食物对象，使用基于凸包的算法对所述食物对象进行网格划分以计算食物体积，具体包括：步骤S51：将所述食物点云自下而上，按照预设的等间距进行分层，并将每一层点云存储为一个独立单元；步骤S52：对分层后的所述食物点云进行z轴投影，之后对每层所述食物点云使用凸包算法对其进行外层凸包构建，得到凸包轮廓；步骤S53：设置边长阈值Llimit，对所述凸包轮廓以及每条大于变长阈值Llimit的边围直径作圆形区域，选取圆内的点为疑似边界点；寻找所述疑似边界点中与直径端点组成最大角的点作为新边界点，从而收缩食物边界，剔除空隙；步骤S54：重复步骤S52 ～S53，直到所有边长小于阈值，则停止迭代计算；步骤S55：计算每一层的体积，将所有层体积相加即为食物体积。 5.一种基于视觉分析的食物营养评估系统，其特征在于，包括下述模块：获取RGB图像和深度图像模块，用于获取进食前和进食后的食物的RGB图像和深度图像，其中，所述RGB图像和所述深度图像的拍摄角度保持一致；获取食物的类别和视觉区域模块，用于使用MaskR ‑CNN神经网络获取所述RGB图像的食物的类别及其视觉区域，并对所述深度图像中相应的食物区域进行标记，得到标记好的深度图像；预测对视图深度图像模块，用于构建并训练3D卷积神经网络，将标记好的所述深度图像输入训练好的所述3D卷积神经网络，预测得到所述深度图像的对视图深度图像；其中，所述3D卷积神经网络包括：初始层、编码器、全连接层和解码器；权　利　要　求　书 2/3 页 3 CN 114463740 A 3

专利 一种基于视觉分析的食物营养评估方法及系统

专利一种基于视觉分析的食物营养评估方法及系统