基于太赫兹技术的小麦粉品质快速检测研究

刘冬阳,孙晓荣*,刘翠玲,杜 馨,李雅鑫

(北京工商大学 计算机与信息工程学院 食品安全大数据技术北京市重点实验室,北京 100048)

摘 要:该研究针对目前小麦粉品质方面检测方法存在的问题,提出利用太赫兹光谱技术对小麦粉进行快速无损品质检测研究。使用光谱仪与成像仪,采集了不同种类小麦粉样本的太赫兹光谱,使用TQ Analyst软件结合距离匹配法对小麦粉的太赫兹扫描光谱进行定性分析研究,富强粉和麦芯粉成功分类,模型性能指数达到88.9%,预测准确率达100%。使用OPUS软件结合偏最小二乘法(PLS)和一阶导数+矢量归一化(SNV)进行定量分析研究,水分定量模型R2为91.18%,交叉验证均方根为0.182;灰分定量模型R2为83.37%,交叉验证均方根为0.064,最终通过实验结果分析得出太赫兹技术在食品品质检测方面的可行性。

关键词:太赫兹光谱;无损检测;距离匹配;偏最小二乘法;定性分析;定量分析

小麦粉中含有多种人体所需的营养物质,并且用其加工成的食品种类也很多。小麦粉在市面上也分为麦芯粉、富强粉和标准粉等种类,价格上不尽相同,消费者仅从小麦粉的外观上并不能辨别其种类,这就给了一些不法商贩可乘之机,以假乱真来欺骗消费者[1-3]

小麦粉的品质直接影响到最终小麦粉制品的口感及品质,而小麦粉的品质受到影响的因素主要有水分和灰分。国家标准的规定中明确指出,小麦粉的水分含量不能超过14%,水分含量过高的小麦粉特别容易结块发霉[4-5]。小麦粉经高温焚烧后的残留物就是灰分,也常被称作麦皮,通常用小麦粉中的灰分值来反映小麦粉的加工精度高低。目前国内小麦粉品质检测方法严重浪费人力、物力和时间,检测效率特别的低,达不到企业和监管部门的要求,因此非常有必要研究出一种简单、高效的小麦粉品质无损检测技术[6]

太赫兹(tera hertz,THz)是介于光和微波之间的一段频谱,其频谱范围为300吉赫兹(giga hertz,GHz)~3 THz(波长1 mm~100μm,有时频率会达到10 THz)[7]。在这一频段的技术和分析研究只能借鉴其他频段的特性,所以这一频段的分析研究具有一定的挑战性,但是这一频段在科学研究和应用方面都具有很高的价值所在。到目前为止,基于太赫兹波段的光谱分析和成像技术的研究虽然还在起步阶段,但在公共安全检查、THz雷达、生物医学、军事及通信技术、食品安全检测等方面都有所进展[8-13]

结合现在的食品安全问题,设想可以将太赫兹技术应用到食品品质检测中,并且结合光谱分析法,进行食品方面的定性、定量的快速分析检测,这样既能解决传统检测方法对食品有所损害的问题,又能加快食品检测速度,提高效率,对推动国家食品产业科技创新、确保国家食品安全意义重大[14]。本实验在此基础上,依据采集到的小麦粉的太赫兹时域光谱中的吸收系数谱图和折射率谱图,运用TQ Analyst软件里的距离匹配法进行定性建模,利用偏最小二乘法(partial least squares,PLS)进行定量建模,分析水分和灰分在小麦粉中的含量,并用已知样品的数据验证模型的准确性,研究太赫兹技术在小麦粉定性和定量分析上的可行性[15-16]

1 材料与方法

1.1 材料与试剂

1.1.1 用于定性分析的样本

46个小麦粉样本(富强粉29个,麦芯粉17个):北京古船食品有限公司。首先在不同时间段用Terapulse 4000太赫兹脉冲成像与光谱仪对这46个样本进行随机抽取扫描,其次是对采集到的光谱进行格式转换。

1.1.2 用于定量分析的样本

采用38个小麦粉样本进行水分建模,40个小麦粉样本进行灰分建模,每份样品不经过任何处理,直接对小麦粉样品进行太赫兹光谱扫描[17-19]。本实验中小麦粉样品的水分、灰分的实际含量均使用国标方法测得,所得的结果作为模型建立时水分、灰分的真实含量使用。

1.2 仪器与设备

TeraPulse4000太赫兹脉冲成像与光谱仪:英国TeraView公司。

1.3 方法

1.3.1 距离匹配法原理

距离匹配法的原理是以数据的协方差距离为根据,对两个未知样本的相似度进行计算[20]。距离匹配法原理的计算过程如下,首先需要计算出待测样本的新光谱值,计算公式如下:

式中:Xinew为待测样本的新光谱值;Xi为待测的样本光谱;Xc为已知类别样本集的中心光谱;Xcstd为已知类别样本集的准偏差光谱[21]

计算出待测样本的新光谱值后,需要计算该待测样本与已知类别的匹配值[22]。在距离匹配方法中,匹配值范围一般为0~100,0表示最匹配。如果其中有若干个类别,那么通过比较匹配值的大小就可以知道待测样本的类别应该属于哪一类。本文采用TQ Analyst光谱分析软件结合距离匹配法对样本进行定性分析,距离匹配限值设定为5。

1.3.2 偏最小二乘法原理

偏最小二乘法就是一个独立变量Y与一个预测变量组X之间的关系,如式(2)所示:

式中:b0为截距,bp的值为数据点1到p的回归系数。

偏最小二乘法的分析建立在多元线性回归分析、主成分分析和典型相关分析的基础上[23-28]。在主成分分析中,偏最小二乘法要对光谱矩阵X进行分解,再对浓度矩阵Y主成分分析,计算公式如式(3)所示:

式中:T和U分别为X和Y的得分矩阵;P和Q分别为X和Y的载荷矩阵;E和F分别为运用偏最小二乘法去拟合矩阵X和Y时所引进的误差[29]

在偏最小二乘法中,要求描述变量Y中因子的同时也在描述变量X,为了达到这个目的,可以以矩阵Y中的列去计算矩阵X的因子,同样由矩阵X中的列去预测矩阵Y的因子。这样分解得到的T和U矩阵就已经除去了大部分测量误差的信息。偏最小二乘法就是利用各列向量相互正交的特征响应矩阵T和特征浓度矩阵U,即将矩阵T和矩阵U做线性回归,用对角矩阵B关联,即:

得到回归系数矩阵,又称关联矩阵B,如式(5)所示:

未知样品光谱矩阵X预测的得分矩阵T由载荷矩阵P求出,可得浓度预测矩阵Y,如式(6)所示:

因此,偏最小二乘法的步骤就是对矩阵Y和矩阵X的主成分分解以及对关联矩阵B的计算[30-33]

1.3.3 数据处理

利用Terapulse软件采集吸收系数谱图和折射率谱图,结合OPUS7.2软件对光谱格式进行转换,用TQAnalyst软件进行定性,用OPUS7.2定量分析建模。

2 结果与分析

2.1 基于太赫兹光谱结合距离匹配法建立小麦粉定性模型

2.1.1 采集样品的吸收系数谱图

取上述46个小麦粉样本逐一放置在衰减全反射(attenuatedtotalreflectance,ATR)的样品台上,然后进行太赫兹光谱采集。在温度和光线恒定的室内,环境温度为20~23℃,样本扫描区间在0.2~275 cm-1范围内,扫描次数为25次,得到的单个小麦粉样本太赫兹吸收系数谱图见图1。其中,波数在120 cm-1以上的谱图多为噪音,一般情况下将其忽略不计,实验选择波数范围50~120 cm-1

图1 小麦粉单个样本的太赫兹吸收系数谱图
Fig.1 Terahertz absorption coefficient spectra of single sample of wheat flour

2.1.2 定性分析模型的建立和预测

在46个样本中抽取5个富强样本和4个麦芯样本作为预测样本,剩下的37个样本作为建模样本,剔除了2个异常样本,使用距离匹配法进行定性分析时,预处理采用的是原始光谱数据。根据TQ软件计算出来的模型图如图2所示。由图2可知,X表示富强粉,Y表示麦芯粉,建模集样本分别位于两坐标轴上,富强粉(麦芯粉)预测样本与富强粉(麦芯粉)的距离更近,此时模型性能指数达到88.9%。

图2 小麦粉距离匹配法定性分析模型图
Fig.2 Qualitative analysis model of wheat flour by distance matching method

模型结果如表1所示。由表1可知,9个校验样本都分类正确,可以看出此方法对小麦粉进行定性分类检测还是具有可行性的。

表1 小麦粉距离匹配法定性分析模型结果
Table 1 Qualitative analysis model results of wheat flour by distance matching method

光谱序号 用途 实际类别 预测类别 与A富强的距离 与A麦芯的距离1 2 3 4 5 6建模预测建模建模忽略建模A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强0.000 0 0.291 5 0.000 0 0.000 0 0.020 8 0.000 0 0.208 2 0.416 4 0.499 7 0.541 3 0.416 4 0.437 2

续表

光谱序号 用途 实际类别 预测类别 与A富强的距离 与A麦芯的距离7 8 9 1 0 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46建模预测建模建模建模建模建模预测建模建模忽略建模建模建模预测建模建模建模建模预测建模建模建模预测建模预测建模建模建模建模建模建模建模预测建模建模建模建模预测建模A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A富强A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯A麦芯0.000 0 0.249 8 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.374 8 0.000 0 0.000 0 0.020 8 0.000 0 0.000 0 0.000 0 0.270 7 0.000 0 0.000 0 0.000 0 0.000 0 0.270 7 0.000 0 0.000 0 0.000 0 0.166 6 0.353 9 0.166 6 0.520 5 0.395 6 0.520 5 0.395 6 0.353 9 0.437 2 0.187 4 0.583 0 0.957 7 0.208 2 0.145 7 0.145 7 0.395 6 0.229 0 0.395 6 0.270 7 0.770 4 0.374 8 0.270 7 0.458 0 0.583 0 0.520 5 0.458 0 0.291 5 0.655 4 0.562 1 0.499 7 0.374 8 0.333 1 0.520 5 0.145 7 0.520 5 0.416 4 0.416 4 0.312 3 0.187 4 0.541 3 0.166 6 0.000 0 0.145 7 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.541 3 0.000 0 0.000 0 0.000 0 0.000 0 0.333 1 0.000 0

2.2 基于太赫兹光谱结合偏最小二乘法建立小麦粉定量分析模型

2.2.1 采集样品的折射率谱图

取上述共78个小麦粉样本逐一放置在ATR的样品台上,然后进行太赫兹光谱采集。在温度和光线恒定的室内,环境温度为20~23℃,样本扫描区间在0.2~275 cm-1范围内,扫描次数为25次,得到的太赫兹折射率谱图如图3所示。其中,波数在120 cm-1以上的谱图多为噪音,一般情况下将其忽略不计,实验选择波数范围50~120 cm-1

图3 小麦粉单个样本的太赫兹折射率谱图
Fig.3 Terahertz refractive index spectra of single sample of wheat flour

2.2.2 基于折射率谱图的小麦粉定量分析模型的建立和预测

在38个用于水分建模的样本中,随机抽取了6个包含各种品种小麦粉的样本作为预测样本,剔除了6个异常样本,剩下的26个样本作为建模样本,在52.05~0 cm-1范围内采用了一阶导数+矢量归一化的方法对光谱进行预处理,并平滑了17个点,水分定量模型如图4所示,水分建模集样本均匀分布在回归线附近;在40个用于灰分建模的样本中,随机抽取了6个包含各种品种小麦粉的样本作为预测样本,剔除了11个数据不理想的异常样本,剩下的23个样本作为建模,水分样本,在468.2~363.9 cm-1和52.05~0 cm-1范围内采用了减去一条直线的光谱预处理方法,灰分定量模型如图5所示,灰分建模集样本均匀分布在回归线附近。建模结果如表2所示。由表2可知,水分定量分析模型R2为91.18%,交互验证均方根误差为0.182,灰分定量分析模型R2为83.37%,交互验证均方根误差为0.063 9,模型有很好的稳健性。

图4 基于折射率光谱小麦粉水分的定量分析模型
Fig.4 Quantitative analysis model of water in wheat flour based on refractive index spectrum

图5 基于折射率光谱小麦粉灰分的定量分析模型
Fig.5 Quantitative analysis model of ash in wheat flour based on refractive index spectrum

表2 水分和灰分建模结果
Table 2 Modeling results of water and ash

组分 推荐维数 维数(方法) R2 交叉验证均方根 马氏距离水分灰分10 6 10 6 91.18%83.37%0.182 0.0639 1.1 0.88

表3和表4表示分别为水分模型和灰分模型预测的结果,由表3、表4可以看出,偏差均在允许范围之内,建模效果很好。

表3 水分模型预测结果
Table 3 Prediction results of water model

序号 真值 预测值 预测误差 马氏距离1 2 3 4 5 6 14.0 13.8 13.9 14.2 14.5 13.4 14.228 14.066 14.139 13.944 14.082 13.602-0.228-0.266-0.239 0.256 0.418-0.202 0.51 0.28 0.16 0.19 0.47 0.79

表4 灰分模型预测结果
Table 4 Prediction results of ash model

序号 真值 预测值 预测误差 马氏距离1 2 3 4 5 6 0.60 0.61 0.48 0.62 0.50 0.53 0.790 26 0.570 71 0.711 48 0.560 63 0.716 82 0.731 05-0.190 26 0.039 29-0.231 48 0.059 37-0.216 82-0.201 05 0.690 0.280 0.031 0.150 0.017 0.110

研究得出,使用小麦粉样本的折射率谱图,建模效果很好,相关系数均在0.8以上,误差也全部在允许的范围内。因此可以得到,运用OPUS软件,基于太赫兹光谱结合偏最小二乘法(PLS)对小麦粉建立的定量分析模型可以高效、准确的检测出小麦粉中水分和灰分的含量,并且应用于日常小麦粉品质的无损快速检测中。

3 结论

本研究通过实验对小麦粉的太赫兹光谱进行定性定量分析建模,探索基于太赫兹技术的食品品质快速检测是否可行。在基于小麦粉的太赫兹光谱进行定性分析的实验中,初步实验结果表明,采用距离匹配法建立的小麦粉定性分析模型可以判别出小麦粉的种类;通过基于小麦粉的太赫兹光谱进行定量分析的实验,使用OPUS软件将太赫兹技术与偏最小二乘法(PLS)相结合,建立出小麦粉水分和灰分的定量分析模型。模型中的相关系数在0.8以上,说明分析模型精度较高,而且模型的交互验证均方差(即误差)均在国家标准允许的范围内。实验结果表明,在现有的样本中,利用太赫兹技术结合偏最小二乘法分析光谱数据,能够无损、快速地检测出小麦粉中水分和灰分的含量。

在模型的稳健性和可移植性上进行研究,扩充样本数量,并在此基础上探索更加适合的样本筛选、光谱预处理及建模方法,或者引入其他算法、借助其他分析软件,提高模型的准确性及稳定性。本次研究尚属于探索性研究,只是探索太赫兹技术在食品品质无损检测方面应用的一个开始,为今后太赫兹技术应用于快速、准确和无损检测小麦粉品质方面的研究提供有力的数据支持,奠定良好的基础。同时有望将此技术扩展应用于整个食品行业,为解决食品安全问题提供一个可靠的技术保障。

参考文献:

[1]张琪,方虹霞,秦丹,等.太赫兹时域光谱技术定性定量分析抗结核药物中的吡嗪酰胺饿异烟肼[J].药物分析杂志,2016,36(6):1082-1088.

[2]马微,程丽,单艺,等.太赫兹科学技术在食品质量安全领域的应用研究进展[J].肉类研究,2015,29(11):39-43.

[3]齐娜,张卓勇,相玉红.太赫兹技术在医学检测和诊断中的应用研究[J].光谱学与光谱分析,2013,33(8):2064-2070.

[4]马品,杨玉平.运用太赫兹光谱技术检测天麻中的水分含量[J].太赫兹科学与电子信息学报,2017,15(1):26-28.

[5]刘乔,陈志强,雷江波,等.医用棉纱布的太赫兹波段透射特性[J].太赫兹科学与电子信息学报,2014,12(5):667-670.

[6]方虹霞,张琪,张慧丽,等.小麦粉中偶氮甲酰胺的太赫兹时域光谱检测[J].中国粮油学报,2016,31(1):107-111.

[7]王文涛,王舒妍,陈响.基于太赫兹技术的中国专利申请分析[J].中国发明与专利,2015(7):35-44.

[8]王建国.太赫兹液晶器件的研究发展[J].光电技术应用,2013,28(5):24-29.

[9]张帅,曲元刚,廉玉姬,等.光照引起的叶绿素a和β-胡萝卜素在太赫兹和可见区的光谱变化研究[J].中国科学:生命科学,2017,47(2):230-235.

[10]王潇霖,连艳,郑潇潇,等.太赫兹光谱技术在中药鉴别中的研究概况[J].中药与临床,2017,8(1):14-17.

[11]BIN L,LIPING C.Exploration on precision farming pollution detection using THz technology[J].Infrared and Laser Eng,2016,45(4):1-6.

[12]何明霞,陈涛.太赫兹科学技术在生物医学中的应用研究[J].电子测量与仪表学报,2012,26(6):471-480.

[13]张卓勇,张欣.太赫兹时域光谱技术应用研究进展[J].光谱学与光谱分析 2016,36(10):54-55.

[14]李鹏鹏,张元,葛宏义,等.太赫兹技术在食品质量安全检测中的应用研究发展[J].食品工业科技,2017,38(3):372-375.

[15]朱礼国,孟坤,彭龙瑶,等.美国核武器实验室太赫兹技术与应用研究[J].太赫兹科学与电子信息学报,2013,11(4):501-506.

[16]陈韬,孟坤,朱礼国,等.基于太赫兹光谱成像技术的智能处理方法分析[J].太赫兹科学与电子信息学报,2016,14(1):7-12.

[17]张文涛,王思远,占平平,等.基于太赫兹时域光谱技术的红木检测方法[J].光学学报,2017,37(2):1-6.

[18]孙营伟,周萍.小麦粉湿面筋近红外定量分析中的光谱预处理方法研究[J].中国酿造,2016,35(1):137-140.

[19]李明亮,常天英,崔洪亮.基于太赫兹时域光谱分析红层泥岩风化样本[J].光谱学与光谱分析,2016,36(4):929-933.

[20]兰红,王秋丽.基于聚类和马氏距离的SURF昆虫图像匹配算法[J].计算机应用与软件,2016,33(4):201-207.

[21]吴静珠,张宇靖,石瑞杰,等.拉曼光谱结合距离匹配法快速鉴别掺伪食用油[J].中国粮油学报,2015,30(9):119-122.

[22]窦颖,孙晓荣,刘翠玲,等.基于拉曼光谱技术的小麦粉品质快速检测[J].食品科学,2014,35(22):185-189.

[23]陈善雄,彭茂玲,彭喜化.一种基于偏最小二乘的网络入侵检测方法分析[J].信息网络安全,2016(1):6-10.

[24]TANHY,ZHENGDZ,LIX,etal.The Application of THz spectroscopy and GA-BP in methanol concentration detection[J].Spectrosc Spect Anal,2016,36(11):3752-3757.

[25]王芳,仇大剑,夏红岩,等.基于太赫兹时域光谱技术的饲用维生素鉴别的研究初探[J].内蒙古农业大学学报:自然科学版,2016,37(4):129-135.

[26]樊双喜,钟其顶,李国辉,等.近红外光谱法快速检测黄酒的酒精度、总糖和总酸[J].中国酿造,2015,34(2):135-138.

[27]王祥,冯瑞梅,魏珍,等.Logratio变换与偏最小二乘法在多目标混料均匀设计药物处方配比优化中的应用[J].中国卫生统计,2016,33(4):571-574.

[28]WANG J R,ZHANG Z Y,YANG Y P,et al.Identification of rhuharb samples by terahertz time domain spectroscopy combined with principal component analysis-linear discriminant analysis and support vector machine[J].Spectrosc Spect Anal,2017,37(5):1606-1611.

[29]陈涛.基于主成分分析和模糊识别的生物分子太赫兹光谱识别[J].量子电子学报,2016,33(4):392-397.

[30]杨帅,左剑,刘尚建,等.太赫兹光谱技术在中药大黄炮制品检测中的应用研究[J].光谱学与光谱分析,2016,36(12):3870-3874.

[31]胡晓华,刘伟,刘长虹,等.基于太赫兹光谱和支持向量机快速鉴别咖啡豆产地[J].农业工程学报,2017,33(9):302-305.

[32]胡玉君,刘翠玲,窦森磊,等.基于近红外光谱的小麦湿面筋含量检测[J].四川大学学报:自然科学版,2015,52(4):800-804.

[33]CHEN T,LIZ,HU F R,et al.Discrimination of GMOs using Terahertz spectroscopy and CS-SVM[J].Spectrosc Spect Anal,2017,37(2):618-623.

Rapid detection of wheat flour quality based on terahertz technique

LIU Dongyang,SUN Xiaorong*,LIU Cuiling,DU Xin,LIYaxin
(Beijing Key Laboratory of Big Data Technology for Food Safety,School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China)

Abstract:In order to solve the problems existing in the detection methods of wheat flour quality,the method using terahertz spectroscopy to study the rapid and nondestructive detection of wheat flour quality was proposed.The terahertz spectra of different kinds of wheat flour samples were studied and collected by spectrometer and imager,and the terahertz scanning spectrum of wheat flour was qualitatively analyzed by the TQ Analyst software combined with distance matching.The strong flour and wheat core powder were successfully classified,the model performance index reached 88.9%,and the prediction accuracy reached 100%.Qualitative analysis studies were performed using OPUS software combined with partial least squares(PLS)and first derivative+vector normalization(SNV).The water quantitative model R2 was 91.18%,the cross-validation root mean square was 0.182;the ash quantitative model R2 was 83.37%,and the cross-validation root mean square was 0.064.Finally,the feasibility of terahertz technology in food quality detection was obtained through the analysis of experimental results.

Key words:terahertz spectroscopy;nondestructive detection;distance matching;partial least squares method;qualitative analysis;quantitative analysis

中图分类号:S03

文章编号:0254-5071(2019)01-0174-05 doi:10.11882/j.issn.0254-5071.2019.01.035

引文格式:刘冬阳,孙晓荣,刘翠玲,等.基于太赫兹技术的小麦粉品质快速检测研究[J].中国酿造,2019,38(1):174-178.

收稿日期:2018-10-20

修回日期:2018-12-13

基金项目:北京市教委科技计划一般项目(KM201810011006);北京市自然科学基金项目(4182017);全国大学生科学研究与创业行动计划(201810011090)

作者简介:刘冬阳(1995-),女,硕士研究生,研究方向为光谱快速检测食品。

*通讯作者:孙晓荣(1976-),女,副教授,硕士,研究方向为智能测量技术与数据处理、系统建模与仿真方法研究、智能控制方法。