ICS 35.020
CCS L 70T/GZBZ
团 体 标 准
T/GZBZ 7—2021
儿童病理语音
MFCC 特征结构化采样规范
Specification for structured sampling of MFCC features in pediatric
pathological speech
2021-03-22 发布 2021-03-30 实施
广州市标准化协会 发布
全国团体标准信息平台
全国团体标准信息平台
T/GZBZ 7—2021
I目 次
前言..................................................................................................................................................................... Ⅲ
1 范围................................................................................................................................................................. 1
2 规范性引用文件 ............................................................................................................................................. 1
3 术语和定义 ..................................................................................................................................................... 1
4 采样方式 ......................................................................................................................................................... 1
4.1 人工病理语音采样 ................................................................................................................................. 1
4.2 智能病理语音采样 ................................................................................................................................. 1
5 采样过程 ......................................................................................................................................................... 1
5.1 采样点环境要求 ..................................................................................................................................... 1
5.2 采样设备要求 ......................................................................................................................................... 1
5.3 采集样本及数据采集 ............................................................................................................................. 2
5.4 采样处理 ................................................................................................................................................. 2
5.5 采样分析 ................................................................................................................................................. 2
附录 A(规范性) 中国构音障碍语音评估系统词表 ................................................................................... 6
全国团体标准信息平台
全国团体标准信息平台
T/GZBZ 7—2021
Ⅲ前 言
本文件按照 GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规
定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由广州科慧健远医疗科技有限公司提出。
本文件由广州市标准化协会归口。
本文件由广州科慧健远医疗科技有限公司负责具体解释和实施情况收集。
本文件起草单位:广州科慧健远医疗科技有限公司、澳门国际人工智能学会、永讯亚洲有限公司、
广州言成智能设备股份有限公司、武汉昱呈星医疗科技有限责任公司、科慧健远(广州)智能设备有限
公司、广州鹏远智能设备有限公司。
本文件主要起草人:柯慧明、李胜、陈亮、江晨银、钟志成、黄建恺、卢国友。
全国团体标准信息平台
全国团体标准信息平台
T/GZBZ 7 —2021
1儿童病理语音 MFCC 特征结构化采样规范
1 范围
本文件规定了儿童病理语音 MFCC特征结构化采样的术语和定义、采样方式、采样过程等要求。
本文件适用于 2 岁~6岁儿童病理语音 MFCC 特征结构化采样。
2 规范性引用文件
本文件没有规范性引用文件。
3 术语和定义
下列术语和定义适用于本文件。
3.1
病理语音采样 pathological speech sampling
通过数码音频系统将病变语音声波波形转换成一连串的二进制数据, 从而记录下原始模拟声波在某
一时刻的状态的过程。
3.2
采样类型辨别 sample type discrimination
在病理语音采样过程中,智能辨别儿童病理语音种类的操作。
4 采样方式
4.1 人工病理语音采样
在采样点,受试者使用普通话或汉藏语系汉语族汉语方言按照附录A《中国构音障碍语音评估系统
词表》(简称词表)的顺序读取 82 个汉语的语音,检查者通过采样设备进行病理语音采样。
4.2 智能病理语音采样
通过采样分析技术筛选出评估各型儿童病理语音的权重声学特征参数, 基于权重声学特征通过构建
ANN(Artificial Neural Network,人工神经网络)实现 2 岁~6 岁儿童病理语音的采样类型辨别。
5 采样过程
5.1 采样点环境要求
最佳采样点环境是在具有隔音门、吸音岩棉的隔音室内进行,隔音度不小于 40dB。
5.2 采样设备要求
全国团体标准信息平台
T/GZBZ 7 —2021
2采样设备应具备不低于 44.1kHz 的采样频率和 16bit 的采样位数。
5.3 采集样本及数据采集
5.3.1按照词表中的 82 个汉语词汇,对受试者进行录音,采集 82 个汉语语音的病理语音样本。
5.3.2受试者应端坐,口唇距采样设备约 10cm,语速自然平稳(大约240 音节/分钟) 、音量适中的朗
读词表 2 次并进行录音。受试者如遇不认识的字,检查者应予以告知。
5.4 采样处理
5.4.1用语音剪辑软件(能实时、非破坏编辑并可进行相位分析的软件)将受试者第 1 次录音的 82
个目标音档剪切出来。
5.4.2按照单元音 28个、复合元音 23 个、辅音 21 个、序列语音 10 个进行分类归档。
5.4.3如果第 1 次录音出现噪音、干扰、波形超过窗口值、波形提示能量不足等情况,则选用第 2 次
录音数据进行处理。如果再次出现噪音、干扰、 波形超过窗口值、波形提示能量不足等情况应重新采样。
5.5 采样分析
5.5.1 采样分析流程图
采样分析流程图见图 1。
图1采样分析流程图
5.5.2 概述
通过预加重、分帧、加窗、快速傅里叶变换、三角带通滤波器、滤波代入、扩展分帧等处理过程,
提取每个音节的每一个数字语音信号的 MFCC 特征,形成 MFCC 语音库。
5.5.3 预加重
将采样点采集的病理语音采样信号通过高通滤波器进行高通预加重处理,其处理公式(1
T-GZBZ 7—2021 儿童病理语音MFCC特征结构化采样规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2022-12-15 01:32:51上传分享