近红外光谱技术结合波段筛选用于白酒基酒总酯定量分析

高 畅1,张宇飞1,辛 颖1,李艳敏1,魏金旺1,朱婷婷1 *,李子文2,孙海波1

(1.北京顺鑫农业股份有限公司牛栏山酒厂,北京 101301;2.中国食品发酵工业研究院有限公司,北京 100015)

摘 要:采用近红外光谱(NIRS)分析技术对白酒基酒中的总酯含量进行定量分析,通过偏最小二乘法(PLS)法建立分析模型,同时后向间隔偏最小二乘法(BiPLS)对整个谱区进行光谱特征波段筛选。用决定系数(R2)、校正均方根误差(RMSEC)以及预测均方根误差(RMSEP)对模型进行评价。结果表明:特征波段筛选能够对基酒总酯模型起到显著的优化作用,模型的决定系数R2从0.484提升至0.937,RMSEC及RMSEP值分别从0.490、0.476降低至0.172和0.177,在减少模型复杂程度的同时,有效地提高了模型的稳定性与准确度,经过基酒盲样验证,说明波段优化所建立的模型有较为准确的预测结果。

关键词:白酒;基酒;近红外光谱技术;定量分析;波段筛选

白酒是以淀粉质原料或糖质原料,加入糖化发酵剂,经固态、半固态或液态发酵、蒸馏、贮存、勾兑而制成的蒸馏酒。发酵后的酒醅经过蒸馏后得到基酒,基酒经过存储陈化处理后进行勾兑得到成品酒。不同酒厂成品酒勾兑的方法不同,但基酒组分分析是必不可少的,总酯作为基酒品质的关键指标,用国家标准所规定的化学滴定法,存在操作过程复杂、工作量大,消耗大量化学试剂、耗时长以及对环境产生污染的缺点[1],且对化验人员的技术水平有一定要求,无法满足基酒快速分析的需求。因此,为了满足酿酒生产需要、降低实验成本、保护环境,开发一种快速、精准、高效的分析技术来检测酿酒生产中的关键性指标显得尤为重要。

近红外光谱(near-infrared spectroscopy,NIRS)法具有检测快速、样品无损耗、操作简单、分析效率高,无需前处理且无污染,可同时对样品的多项指标进行检测等优点[2-4],已被广泛应用于酒类行业中原料、半成品及成品酒质量检测中[5-7]。薛磊等[8]用近红外光谱技术对黄酒风格进行判别。谢广发等[9]建立了能够同时定量分析黄酒中酒精度、总酸以及氨基酸态氮的校正模型。熊雅婷等[10]利用近红外光谱技术对白酒酒醅主要成分进行定量分析,通过偏最小二乘法建立分析模型,实现对白酒酒醅主要成分的快速检测。卢中明等[11]对白酒酒醅近红外模型进行分析研究,酒醅中低含量组分测定时存在的数据差异进行了说明,并找到了影响数据准确性的因素。刘建学等[12-14]将基酒中酸类、醇类、醛类物质含量用气相色谱法与近红外光谱进行关联,建立了快速准确的检测方法。买书魁等[15-16]应用近红外光谱技术对高粱中直链淀粉和支链淀粉含量进行定量分析,通过建立模型能够快速、准确地测定酿酒原料高粱中直链淀粉和支链淀粉含量;并且研究了近红外光谱技术在白酒原酒中分析与应用。何超等[17]针对等级酒近红外模型建立的可靠性上进行了初步探索。田育红等[18]以近红外光谱分析技术为基础,采用偏最小二乘法(partial least squares,PLS)分别建立酒精度、总酸、总酯的定量检测模型,为快速测定白酒中重要指标提供参考。以上研究均表明近红外光谱分析技术可应用于白酒酿造生产中,但目前对于基酒品质指标的近红外分析研究仍较少,往往大部分只停留理论研究,未将深入优化的模型应用于白酒实际酿造过程的分析检测中。

针对白酒基酒中的重要品质指标总酯含量进行快速分析研究,采用向后间隔偏最小二乘法(backward interval PLS,BiPLS)对基酒光谱的整个谱区进行波段筛选,探究光谱波段选择对白酒总酯指标建模分析的影响,并结合偏最小二乘法(PLS)[19-20]构建快速分析模型,为白酒基酒品质的快速分析提供一定参考依据。

1 材料与方法

1.1 材料与试剂

基酒样品(共743个,涵盖不同季节、排次以一年为周期的基酒):牛栏山酒厂酿酒生产车间。

氢氧化钠(分析纯):国药集团化学试剂有限公司;硫酸(分析纯):天津光复科技发展有限公司;酚酞:北京化工厂。

1.2 仪器与设备

N500傅里叶变换近红外光谱仪(光源为卤钨灯,检测器为温控InGaAs,配有固体测量池及透反射盖):瑞士步琦有限公司。

1.3 实验方法

1.3.1 总酯含量测定方法

基酒总酯含量根据国标GB/T 10345—2007《白酒分析方法》中的指示剂法测定。

1.3.2 近红外光谱采集

将基酒样品倒入配套的测量池中,压上透反射盖,从测量池底部检查无气泡。利用配套软件NIRWare Operator采集白酒基酒样品的近红外光谱信息,光谱范围为10 000~4 000 cm-1,分辨率为8 cm-1,扫描次数为32次。采用透反射方式扫描采集近红外光谱,标准正态变量变换(standard normal variate transform,SNV)方法对光谱进行预处理。

1.3.3 校正集与验证集的划分

在剔除掉5个异常点的基础上,以2∶1的比例对剩余738个基酒样品进行校正集和验证集划分。本实验采取Kennard-Stone(K-S)法[21]进行建模样品划分。最终分别选择了校正集及验证集样本492个、246个。校正集与验证集基酒样品的总酯含量统计如表1所示。

1 校正集与验证集统计结果
Table 1 Statistical results of calibration set and validation set

1.3.4 光谱变量选择

本实验拟采用后向间隔偏最小二乘法(BiPLS)[22]对全光谱1501个变量进行选择,该方法的特点是将参与运算筛选的谱区划分为一定数量的间隔(子区间),然后分别计算各子区间的交叉验证均方差(root mean square error of cross validation,RMSECV)值,每次剔除最大值所对应的区间,在剩余区间上建立PLS模型并给出相应的RMSECV值,如此循环,直至剩下单一子区间建立PLS模型,在此一一排除过程中,各PLS模型RMSECV值最小时所对应的多个区间即为所优化出的最佳建模组合区间。

1.3.5 数据处理与分析

BiPLS程序在MATLAB环境下运行,偏最小二乘计算应用UnscramblerX10.3光谱分析软件(挪威CAMO公司)实现,模型的精确度与稳定性通过决定系数R2、校正均方根误差(RMSEC)、预测均方根误差(RMSEP)来评价,R2越接近1,RMSEP越接近0,RMSEC与RMSEP越接近,表明模型效果越好[23-24]

2 结果与分析

2.1 光谱波段优选

在运用后向间隔偏最小二乘法(BiPLS)优选谱曲波段时,如果间隔数量过少容易遗漏细节信息,过多时则会导致最后的结果过于复杂[25]。因此在考虑到区间分割数对选择结果及模型的影响后,本研究将白酒基酒全光谱数据共1 501个波数点等分为k个子区间(k=10~40,间隔5),在每种分割情况下运行BiPLS程序,采用留一法来计算RMSECV值。如表2所示,当分割数为20时,BiPLS所得RMSECV值最小为0.177 1,入选子区间为[7,2],所对应的信息区间分别是波数4 304~4 600 cm-1和5 804~6 100 cm-1,BiPLS共选择了150个波长点,占全谱的10.0%。

2 20个区间数的后向间隔偏最小二乘法优化结果
Table 2 BiPLS optimization results of 20 intervals

续表

2.2 偏最小二乘法分析模型的建立与评价

在上述波段筛选的基础上,建立白酒基酒总酯含量指标的全光谱-PLS及BiPLS-PLS,定量分析模型,并通过对决定系数R2、校正标准偏差RMSEC和预测标准偏差RMSEP进行分析对比,从整体上来对模型效果进行评价,具体模型各指标效果见表3。

3 基酒总酯指标的不同偏最小二乘法模型及性能评价结果
Table 3 Different PLS models and performance evaluation results of total esters in base liquor

由表3可知,白酒基酒的总酯模型在使用全光谱进行建立时,效果并不理想,RMSEC与RMSEP值分别达到0.490及0.476,而决定系数(R2)仅有0.484,代表模型整体的相关线性效果并不理想,预测误差较大,难以满足基酒实际生产中的快速分析使用。而在经BiPLS的系统筛选波段后,模型效果有了显著的提升,决定系数R2提升至0.937,为全光谱建模时决定系数(R2)的194.6%,近乎成倍的增长提升,同时RMSEC及RMSEP值分别下降至0.172和0.177,分别为原先的35.1%及37.2%,代表模型的预测精度有了非常显著的提升,变量数也从1 501个降低至150个,充分说明了波段筛选能够有效地对白酒关键指标模型进行优化,在保留关键波长信息的同时,降低了模型复杂程度,加快模型计算速度,显著提升模型预测效果。

BiPLS方法筛选的变量在白酒基酒完整光谱中的分布情况见图1。由图1可知,白酒基酒的吸收全谱在波数为5 164 cm-1及6 884 cm-1处能够看出明显的吸收峰,这两处是吸收峰分别是白酒中水分O-H伸缩和HOH弯曲的组合频,以及O-H伸缩的一级倍频吸收[26],经波段筛选后,并未选用以上两组波数所在的谱段,有效避免了在使用全谱区建立模型时水分的强吸收对于总酯含量分析的干扰。图1中红色谱段为BiPLS方法筛选出的特征谱段,与C-H、C=O等主要官能团的基频与组合频振动吸收峰位置相对应,如波数4 504 cm-1处C-H伸缩振动和C=O伸缩振动的组合频吸收,波数4 514 cm-1处C-H弯曲振动和羰基伸缩振动的组合频吸收以及波数5 960 cm-1处羰基相连甲基的C-H吸收等[27],体现出了白酒基酒样品中总酯成分的特征吸收。

1 后向间隔偏最小二乘法选择的变量分布情况
Fig.1 Distribution diagram of variables selected by BiPLS

2.3 模型验证

将优化后的白酒总酯模型导入仪器,获取实际生产中50个基酒样品的光谱进行模型验证并绘制模型对比图见图2。由图2可知,白酒基酒样品的总酯实测值与模型预测值点呈对角线分布,且经成对t检验,各项指标预测值与实测值无明显差异(P>0.05)。经验证,验证数据R2为0.939,RMSEP为0.176;说明模型预测结果较为准确。

2 基酒总酯后向间隔偏最小二乘法模型理化值与预测值分布
Fig.2 Distribution idealized value and predicted value of total esters in base liquor by BiPLS model

3 结论

本研究采用近红外光谱技术结合向后间隔偏最小二乘法(BiPLS)对白酒基酒的总酯指标进行了定量分析,分析速度快,无需样本预处理,克服了传统检测方法费时费力的缺点。

经波段优化筛选后,采用特征波段所建模型效果相比全谱区所建模型获得了改善,不仅剔除了谱图中的无用信息,减轻了模型的复杂程度,也提升了模型的准确性与稳定性,充分说明了优化波段对建模分析的重要性,表明了BiPLS算法结合偏最小二乘法建模在白酒品质分析应用的巨大潜力,BiPLS方法所建立的基酒总酯定量分析模型,经实际生产验证,具有快速、稳定、准确的特点,可实现对基酒总酯含量的快速无损检测,也可以用于生产过程中的实时在线监测。

参考文献:

[1]沈小梅,刘国英.近红外光谱分析技术在酒醅常规指标检测上的应用[J].酿酒,2019,46(1):97-100.

[2]孙素琴,周群,陈建波.Infrared spectroscopy for complex mixtures:Applications in food and traditional chinese medicine[M].北京:化学工业出版社,2011:10-28.

[3]盛晓慧,李子文,李宗朋,等.基于近红外光谱分析技术测定库尔勒香梨硬度[J].光谱学与光谱分析,2019,39(9):2818-2822.

[4]韩四海,郭玉姗,李璇,等.基于近红外光谱技术检测白酒基酒中乙醇含量的研究[J].中国酿造,2018,37(9):158-161.

[5]邵春甫,李长文,王珊,等.红外光谱技术在中国酿酒行业中的应用研究进展[J].中国酿造,2013,32(4):15-19.

[6]张金玲.近红外光谱法快速检测白酒基酒中甲醇含量[J].酿酒,2019,46(3):120-122.

[7]范明明.基于近红外技术的白酒摘酒在线检测装置开发[D].镇江:江苏大学,2019.

[8]薛磊,吕进,施秧,等.基于近红外光谱的黄酒风格判别方法[J].食品科学,2014,35(8):240-243.

[9]谢广发,徐榕,樊阿萍,等.近红外光谱技术在黄酒理化指标快速检测中的应用[J].中国酿造,2011,30(11):182-185.

[10]熊雅婷,李宗朋,王健,等.近红外光谱波段优化在白酒酒醅成分分析中的应用[J].光谱学与光谱分析,2016,36(1):84-90.

[11]卢中明,郑敏,刘艳,等.基于液体样品近红外模型在白酒酒醅分析中的应用[J].酿酒,2019,46(6):35-38.

[12]刘建学,杨国迪,韩四海,等.白酒基酒中典型醇的近红外预测模型构建[J].食品科学,2018,39(2):281-286.

[13]刘建学,张卫卫,韩四海,等.白酒基酒中己酸、乙酸的近红外快速检测[J].食品科学,2016,37(4):181-185.

[14]张卫卫,刘建学,韩四海,等.白酒基酒中醛类物质的傅里叶变换近红外光谱检测[J].食品科学,2016,37(6):111-115.

[15]买书魁,杨洋,赵小波,等.基于NIR 的白酒酿酒高粱中关键指标的定量分析[J].食品科技,2019,44(2):301-307.

[16]买书魁,吴镇君,陈红光,等.基于近红外光谱技术的白酒原酒中关键成分的定量分析[J].食品与发酵工业,2018,44(11):280-285.

[17]何超,余东,李战国,等.近红外光谱技术在量质摘酒中的应用探索[J].酿酒,2019,46(4):58-60.

[18]田育红,王凤仙,吴青,等.基于近红外光谱分析技术快速检测白酒中的关键指标[J].酿酒,2019,46(5):93-96.

[19]李艳坤.近红外光谱定量分析多模型建模方法研究[D].天津:南开大学,2008.

[20]张玲,于健.基于偏最小二乘(PLS)法白酒含量的中乙醇近红外检测[J].食品工业,2006(4):27-29.

[21]陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社,2007:59-90.

[22]邹小波,赵杰文,黄星奕.用向前和向后间隔偏最小二乘法建立苹果糖度近红外光谱模型[A].中国机械工程学会.2006 年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C].中国机械工程学会,2006:6.

[23]HE K X,CHENG H,DU W L,et al.Online updating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy[J].Chemomet Intelligent Laborat Syst,2014,134(5):79-88.

[24]李晓旭.基于近红外的苹果可溶性固形物含量建模研究[D].济南:济南大学,2019.

[25]屠振华,籍保平,孟超英,等.基于遗传算法和间隔偏最小二乘的苹果硬度特征波长分析研究[J].光谱学与光谱分析,2009,29(10):2760-2764.

[26]李子文,李宗朋,买书魁,等.最小二乘支持向量机的核桃露饮品中脂肪成分的定量分析[J].光谱学与光谱分析,2019,39(12):3916-3920.

[27]WORKMAN J,Jr WEYER L.近红外光谱解析实用指南[M].褚小立,许育鹏,田高友译.北京:化学工业出版社,2009:115-161.

Quantitative analysis of total esters in Baijiu base liquor by near-infrared spectroscopy combined with band selection

GAO Chang1,ZHANG Yufei1,XIN Ying1,LI Yanmin1,WEI Jinwang1,ZHU Tingting1*,LI Ziwen2,SUN Haibo1
(1.Beijing Shunxin Agriculture Co.,Ltd.,Niulanshan Distillery,Beijing 101301,China;2.China National Research Institute of Food&Fermentation Industries Corporation,Beijing 100015,China)

Abstract:The total ester content in base liquor of Baijiu(Chinese liquor)was quantitatively analyzed by near-infrared spectroscopy(NIRS),and the analysis model was established by partial least square(PLS)method.Meanwhile,the spectral characteristic bands in the whole spectral region were screened by the backward interval partial least squares method (BIPLS).The model was evaluated by determination coefficient (R2),root mean square error of correction(RMSEC)and root mean square error of prediction(RMSEP).The results showed that the characteristic of band screening could significantly optimize the total ester model of base liquor,the R2 of model increased from 0.484 to 0.937,the RMSEC and RMSEP value decreased to 0.172 and 0.177 from 0.490 and 0.476,respectively,while reducing model complexity,the stability and accuracy of the model was effectively improved.Through blind validation of base liquor,results showed that the optimized model had more accurate prediction results of the proposed model.

Key words:Baijiu;basic liquor;near-infrared spectroscopy;quantitative analysis;wave band screening

中图分类号:TS262.3;TS261.7

文章编号:0254-5071(2021)04-0155-04

doi:10.11882/j.issn.0254-5071.2021.04.029

引文格式:高畅,张宇飞,辛颖,等.近红外光谱技术结合波段筛选用于白酒基酒总酯定量分析[J].中国酿造,2021,40(4):155-158.

收稿日期:2020-10-15

修回日期:2020-12-08

基金项目:国家重点研发计划项目(2018YFE0196600)

作者简介:高 畅(1985-),女,工程师,本科,研究方向为白酒分析与检测。

*通讯作者:朱婷婷(1982-),女,高级工程师,本科,研究方向为白酒分析与检测。