中红外光谱技术结合竞争性自适应重加权算法快速分析白酒风味组分

宋 艳1,杨 洋1,张学平1,许 驰1,王 毓1,蔡 亮1*,李子文2

(1.泸州老窖股份有限公司,四川 泸州 646000;2.中国食品发酵工业研究院有限公司,北京 100015)

摘 要:采用中红外光谱分析技术结合竞争性自适应重加权算法(CARS)对浓香型白酒基酒中的乳酸乙酯和乙酸乙酯的特征波长变量进行筛选后,建立偏最小二乘法(PLS)模型,并对其进行验证。结果表明,采用中红外光谱分析技术剔除明显噪声区域建立的PLS模型效果较好,而经CARS法进行特征波长选择后建立的CARS-PLS模型效果优于PLS模型,乙酸乙酯和乳酸乙酯的CARS-PLS模型相关系数R2分别为0.995、0.989,预测均方根误差(RMSEP)分别为12.80、4.54,相对分析误差(RPD)分别为8.78及8.60,模型经独立验证均取得了较高的预测精度,验证数据相关系数R2分别为0.994及0.992,RMSEP分别为13.55及4.86。该模型有较高的准确度及稳定性,能够用于白酒基酒中的乳酸乙酯和乙酸乙酯的快速分析,可为白酒酿造过程的质量把控提供技术方法。

关键词:竞争性自适应重加权变量算法;白酒基酒;中红外光谱分析技术;波长变量选择;定量分析

白酒作为我国特有的酒种,种类繁多,根据香型的不同,可分为浓香型、清香型、酱香型、米香型等十二大香型[1-2]。而浓香型白酒因具有窖香浓郁、绵甜爽洌、尾净味长的特色风味,深受我国消费者的青睐[3-4]。其中,浓香型白酒基酒是指白酒酒醅在浓香型独有的泥窖池中充分发酵再经过蒸馏摘酒工艺后得到的基础酒,经过入库存储及陈酿勾调后即可得到浓香型成品白酒[5-6]。因此,基酒的质量与成品白酒的品质直接相关,各酒厂对于基酒关键品质指标的把控也极为严格[7]。对于浓香型白酒来说,酯类是其酒体中含量最多的芳香成分,约占风味成分总量的60%左右[8]。其中己酸乙酯是构成浓香型白酒主体香味的主要物质,而乳酸乙酯及乙酸乙酯也对酒体的风味协调起着不可忽视的作用,尤其在当下浓香型白酒生产中乳酸乙酯及乙酸乙酯含量偏高的问题已在行业内备受关注[9-10]。目前,传统国标方法规定这两项指标的分析方法为色谱法,检测流程复杂同时耗费时间长,行业中需要一种快速、准确的检测方法,以便于即时得到分析结果,对基酒的品质进行把控,从而对基酒入库等生产环节进行指导及调整。

近年来,近红外及中红外光谱分析技术因具有分析速度快、操作简便、不消耗化学试剂,能够实现大批量样品快速检测的优势,在白酒行业中得到了广泛的应用[11]。有较多的白酒企业已成功将近红外光谱分析技术应用于酒醅关键成分的快速检测,同时也有较多学者针对近红外光谱分析技术在白酒领域的应用进行了相关研究[12-16]。然而,由于近红外光谱分析技术对含量较低的成分进行分析时存在误差偏大的问题,使其在白酒基酒风味成分的分析方面存在困难。而中红外区域为有机物的基频吸收区域,具有比近红外区域倍频及组合频吸收强数十倍的特点,在对白酒液体样品进行分析时可能存在优势。然而,目前关于中红外光谱技术在液体白酒关键指标分析方面的研究较少,基本集中在构建酒精度、总酯等相对含量较高的指标方面,同时未对模型的构建及优化进行深入的分析[17-18]。此外,考虑到采用全谱区建立模型时可能会引入噪声以及其他无关信息的干扰,严重影响模型的准确性及稳定性,因此,对特征建模变量进行优化筛选就显得尤为重要,特征变量筛选已成为数据分析、模型建立的重要方法[19]

为获得更好的模型效果,本研究采用中红外光谱分析技术结合竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)对浓香型白酒基酒中的乳酸乙酯及乙酸乙酯的特征波长变量进行筛选后,建立浓香型白酒基酒中乳酸乙酯及乙酸乙酯的偏最小二乘(partial least squares,PLS)模型,并对其进行验证。以期为白酒基酒乳酸乙酯及乙酸乙酯的快速分析及模型构建提供一定参考,为白酒行业在酿造过程基酒品质快速监控方面提供新的方法。

1 材料与方法

1.1 材料与试剂

522个浓香型白酒基酒样品:由泸州老窖酿酒有限责任公司提供。

乙酸乙酯、乳酸乙酯、乙酸正戊酯、乙酸正丁酯:美国Sigma公司;无水乙醇:国药集团化学试剂有限公司。以上试剂均为色谱纯。

1.2 仪器与设备

Lacto-Scope FT-B傅里叶变换红外光谱仪:珀金埃尔默股份有限公司;仪器光源为黑体空腔光源;检测器类别为DTGS;配有36微米直径透射样品室;利用配套软件Result Plus采集基酒样品的红外光谱信息。GC-7890B气相色谱仪:安捷伦科技有限公司。

1.3 方法

1.3.1 白酒基酒样品的红外光谱的采集

采用透射方式采集白酒基酒样品的红外光谱。中红外光谱的扫描条件:为保证光谱采集的准确及稳定性,待红外光谱仪开机预热30 min后对设备管路进行清洗,同时进行设备调零工作。光谱扫描时仪器分辨率为8 cm-1,光谱范围为波数4000~397cm-1,扫描次数为32次,每个样品设置自动进样重复扫描3次,取3次平均值作为该样品的最终光谱数值。

1.3.2 校正集与验证集的划分

在对样品数据进行筛选后,对3个异常样品进行了剔除,同时随机保留60个样品作为独立预测集,以验证最终模型的预测准确性。在此基础上采用Kennard-Stone(K-S)法[20]通过样品之间的马氏距离对剩余参与建模的459个基酒样品以2∶1的比例进行校正集及验证集划分,以保证校正集样品的代表性。

1.3.3 模型的建立与评价

本研究采用偏最小二乘(PLS)法建立基酒中乙酸乙酯及乳酸乙酯指标的定标模型。定标模型的准确度与稳定性通过决定系数R2、预测均方根误差(root mean square error of prediction,RMSEP)及相对分析误差(relative percent deviation,RPD)来评价。R2越接近1,RMSEP越接近0,RPD越大,表明模型分辨能力越高、效果越好[21]

1.3.4 建模谱区的特征波长选择

本研究采用CARS法对基酒中红外光谱乙酸乙酯及乳酸乙酯指标的特征波长进行选择。CARS算法是以蒙特卡洛取样及偏最小二乘回归系数为基本原则的特征波长提取算法,其通过自适应重加权取样和指数衰减函数对偏最小二乘模型中回归系数绝对值大的波长点进行选择,同时排除权重小的变量点,如此循环对变量逐步剔除,最后选择交叉验证均方根误差(root mean square error of cross validation,RMSECV)值最小的偏最小二乘模型所对应的波长点,即为最优变量组合[22-23]

1.3.5 分析检测

乙酸乙酯及乳酸乙酯含量:根据GB/T 10345—2007《白酒分析方法》,采用气相色谱法进行分析测定。

1.3.6 数据处理与分析

偏最小二乘模型运算及构建采用UnscramblerX10.3光谱分析软件进行实现,CARS算法程序在Matlab(2018a)环境下运行进行模型特征变量优化工作。

2 结果与分析

2.1 白酒基酒的中红外光谱图

白酒基酒的中红外光谱图如图1所示,因白酒中的主要成分为水及乙醇,约占总量的98%左右,因此在白酒样品的红外光谱中,水及乙醇体现出非常强的吸收,本研究在选择波段建立乙酸乙酯及乳酸乙酯预测模型时,要避开水及乙醇的干扰。其中液态水分子以氢键H-O…H缔合存在,在红外谱区内呈现较宽的吸收谱带,如以波数3 400 cm-1处为主峰的宽吸收带中包含的水分子对称及反对称伸缩振动,以及变角振动的一级倍频峰。此外水分子的变角振动也存在于波数1 645 cm-1处的宽吸收谱带位置,摇摆振动吸收谱带则是位于以波数700 cm-1左右为主峰的宽吸收带处。对于乙醇分子而言,在波数3 400~3 330 cm-1范围存在醇羟基O-H伸缩振动的强吸收谱带以及在波数1 050~1 090 cm-1处饱和醇中C-O键的伸缩振动[24]。由图1亦可知,白酒基酒样品在中红外光谱区范围的图谱高度相似,在上述水及乙醇的特征吸收区域附近均有较为明显的强吸收噪声,分别为波数400~918 cm-1、1 041~1 095 cm-1、1 616~1 678 cm-1及3 050~3 600 cm-1,因此在构建模型时,应排除上述区域,避免噪声对于模型的干扰。

图1 白酒基酒样品的中红外光谱图
Fig.1 Mid-infrared spectra of Baijiu base liquor samples

2.2 校正集与验证集的划分结果

校正集、验证集样品数量及乙酸乙酯、乳酸乙酯含量统计结果见表1。由表1可知,经k-s法进行选择后,分别得到校正集、验证集样品306、153个,两项指标校正集样品范围均包含验证集样品范围,充分体现了校正集样品的代表性。

表1 两指标的校正集与验证集统计结果
Table 1 Statistical results of calibration set and validation set of two indexes

2.2 偏最小二乘法模型建立

在剔除上述明显的噪声区域后,采用剩余光谱波段对白酒基酒乙酸乙酯及乳酸乙酯两项指标建立PLS预测模型,采用校正集建立模型,验证集进行模型评价,PLS模型及性能分析结果见表2。

表2 白酒基酒两项指标的偏最小二乘法模型及性能分析结果
Table 2 PLS models and performance evaluation results of two indexes of Baijiu base liquor

由表2可知,剔除了明显噪声后,建立的模型效果较好,乙酸乙酯及乳酸乙酯模型的相关系数R2分别为0.945、0.959,RMSEP分别为37.08、8.32,RPD值分别为3.03、4.69。当RPD值>3时,建立的预测模型已可用于实际生产检验过程中。

2.3 特征波长的选择

为尝试取得更好的模型预测效果,同时进一步排除无用信息对于模型的影响,本实验采用CARS算法分别对乙酸乙酯及乳酸乙酯两个指标的特征波长变量进行筛选,对两项指标进行特征波长变量选择的筛选结果见图2,三张曲线图相互关联,最上方的曲线图展示了建模变量数随着蒙特卡洛运行次数的增加而逐步减少的过程;中间的曲线图展示了随建模变量的逐渐优化减少,所建PLS模型的交互验证均方差(RMSECV)值先减少后增加的变化趋势;下方曲线图展示了每个波长变量回归系数的变化,其中竖条“*”标志代表RMSECV值最低点,对应最上方即为选择的特征建模变量[25]。分别在所得RMSECV值最小为13.12及4.78时,乙酸乙酯及乳酸乙酯指标分别对应选择了15、12个波长变量,占全光谱的1.6%及1.3%。

图2 竞争性自适应重加权算法变量筛选结果
Fig.2 Variable selection results of CARS

a:乙酸乙酯;b:乳酸乙酯。

2.4 基于特征波长的偏最小二乘模型建立与评价

基于CARS算法对于筛选出的乙酸乙酯及乳酸乙酯指标的特征波长,分别对两项指标建立CARS-PLS预测模型,并与上述建立的剔除明显噪声区域的全光谱模型进行比较,不同PLS模型及性能评价结果见表3。

表3 白酒基酒两项指标的不同偏最小二乘法模型及性能评价结果
Table 3 Different PLS models and performance evaluation results of two indexes of Baijiu base liquor

由表3可知,选用CARS算法优选特征变量,并基于此建立的预测模型效果均有明显提升,乙酸乙酯及乳酸乙酯预测模型的相关系数R2分别从0.945、0.959提升为0.995、0.989,预测均方根误差(RMSEP)分别由37.08、8.32降低至12.80及4.54,仅为原模型的34.5%及54.6%,同时RPD值分别由3.03、4.69提升至8.78及8.60,均>8,代表两项指标CARS-PLS模型的预测准确性较高[26]。与此同时,建模变量数有极大程度地减少,也相应减少了模型的最佳主成分数,有效地降低了模型的复杂程度,提高了模型的预测稳定性,充分说明了采用特征变量选择方法进行建模波长优化对于中红外定量模型构建的可操作性及重要性。

乙酸乙酯及乳酸乙酯两项指标经过CARS算法优选的建模变量在白酒基酒中红外谱区的分布位置见图3,图中五角星标注的点位即为优选出的特征建模变量,与酯类物质C-O、C-H、C=O等主要基团的吸收峰位置相对应。

图3 竞争性自适应重加权算法选择的变量分布情况
Fig.3 Distribution of variables selected by CARS

由图3a可知,2 980 cm-1附近饱和C-H的特征吸收,1 242 cm-1附近分别与羰基及烷基相连的C-O伸缩振动吸收,图3a及图3b均出现1 740 cm-1附近饱和脂肪酸酯羰基C=O基团伸缩振动的强吸收等[24],均表现出了基酒乙酸乙酯及乳酸乙酯指标的特征吸收。

2.5 CARS-PLS模型验证

将本研究预留的60个独立预测集白酒基酒样品光谱通过建立的CARS-PLS模型进行预测,并将模型预测值与理化真值绘制模型效果对比,结果见图4。由图4可知,代入乙酸乙酯及乳酸乙酯模型中的独立预测基酒样品数据点紧密贴近标准拟合线,同时经过成对t检验计算,模型预测值与理化检验值间无显著差异(P>0.05)。乙酸乙酯及乳酸乙酯模型验证数据相关系数R2分别为0.994及0.992,RMSEP分别为13.55及4.86,代表采用中红外分析技术结合CARS特征变量提取建立的预测模型分析结果准确。

图4 竞争性自适应重加权算法-偏最小二乘法模型预测效果
Fig.4 Predicted effects of CARS-PLS models

a为乙酸乙酯,b为乳酸乙酯。

3 结论

本研究采用中红外光谱分析技术结合竞争性自适应重加权变量算法(CARS)对浓香型白酒基酒的乙酸乙酯及乳酸乙酯进行了定量分析。结果表明,剔除明显噪声区域建立的PLS模型效果较好,已可初步用于实际生产对于乙酸乙酯及乳酸乙酯的快速监控中,充分说明了中红外光谱分析技术可用于液体白酒关键指标的分析,尤其是一些白酒基酒中含量较低的风味组分。而采用CARS算法建立的CARS-PLS模型效果更佳,乙酸乙酯及乳酸乙酯两项指标模型经测试集独立验证均取得了较高的预测精度,表明了特征波长筛选对中红外建模分析的重要性,在剔除无关信息的同时保留了指标特征吸收波长,说明中红外光谱分析技术结合特征变量筛选在白酒生产过程品质控制中的巨大潜力,所建立的浓香型基酒重要风味组分定量分析模型,具有准确、稳定的特点,为白酒品质的快速分析方法开发提供技术借鉴。

参考文献:

[1]张治刚,张彪,赵书民,等.中国白酒香型演变及发展趋势[J].中国酿造,2018,37(2):15-18.

[2]苏金兰,徐柏田,林培.中国白酒香型发展的进展研究[J].酿酒科技,2017(8):102-111.

[3]卫春会,郑自强,李浩,等.浓香型白酒酒醅发酵过程中风味物质时空差异分析[J].食品与发酵工业,2022,48(5):240-246.

[4]彭厚博,李丽,吴键航,等.基于电子舌技术的浓香型白酒基酒年份分类方法[J].中国酿造,2022,41(3):158-162.

[5]辛新.基于分子光谱技术的浓香型白酒基酒品质检测研究[D].镇江:江苏大学,2017.

[6]翟双,庹先国,张贵宇,等.基于FT-NIR光谱技术结合KPCA-MD-SVM对白酒基酒的快速判别[J].现代食品科技,2022,38(4):248-253.

[7]栗新峰.基于GC-QTOF MS技术的浓香型白酒原酒质量评价技术研究[D].自贡:四川轻化工大学,2019.

[8]周轩.浓香型白酒基酒挥发性成分分析及等级识别研究[D].镇江:江苏大学,2019.

[9]赖登燡,林东,王久明,等.浓香型白酒“增己降乙”与酿酒工艺的关联性研究[J].酿酒,2021,48(1):3-11.

[10]李俊辉,刘英杰,隋丽娜,等.浓香型白酒增加己酸乙酯降低乳酸乙酯的研究进展[J].中国酿造,2019,38(1):1-4.

[11]高兴,马莉,郑峰屹,等.食品安全快速检测技术研究进展[J].食品工程,2020(1):14-19.

[12]陈霏,庹先国,曾祥林,等.近红外检测技术在白酒生产中的应用研究进展[J].食品科技,2021,46(1):280-284.

[13]李良,董孝元,吴昊,等.基于偏最小二乘法建立白酒酒醅近红外分析模型[J].酿酒,2018,45(3):57-60.

[14]刘建学,杨国迪,韩四海,等.白酒基酒中典型醇的近红外预测模型构建[J].食品科学,2018,39(2):281-286.

[15]黄清霞,付国勇,陈黎萍.成品白酒中酸酯总量的近红外检测[J].食品工业科技,2022,43(5):310-314.

[16]高畅,张宇飞,辛颖,等.近红外光谱技术结合波段筛选用于白酒基酒总酯定量分析[J].中国酿造,2021,40(4):155-158.

[17]刘石雪,王秀菊,李静,等.中红外光谱技术在白酒检测中的应用[J].酿酒科技,2020(3):41-46,51.

[18]邹胜琼,段学,田敏,等.中红外模型快速检测白酒基础酒中总酯的含量[J].酿酒,2021,48(3):74-77.

[19]黄新,刘伟平.基于变量重要性和偏最小二乘的近红外特征筛选方法研究[J].湖南城市学院学报(自然科学版),2021,30(6):50-54.

[20]LI Z P,WANG J,XIONG Y T,et al.The determination of the fatty acid content of sea buckthorn seed oil using near infrared spectroscopy and variable selection methods for multivariate calibration[J].Vib Spectrosc,2016,84(2):24-29.

[21]HE K X,CHENG H,DU W L,et al.Online updating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy[J].Chemometr Intell Lab,2014,134:79-88.

[22] XING Z,DU C W,SHEN Y Z,et al.A method combining FTIR-ATR and Raman spectroscopy to determine soil organic matter:Improvement of prediction accuracy using competitive adaptive reweighted sampling(CARS)[J].Comput Electron Agr,2021,191:106549.

[23]乔芦,王松磊,郭建宏,等.结合高光谱图像的光谱和纹理信息预测羊肉可溶性蛋白和GSH含量[J].光谱学与光谱分析,2022,42(1):176-183.

[24]翁诗甫,徐怡庄.傅里叶变换红外光谱分析[M].北京:化学工业出版社,2016:346-348,350.

[25]熊雅婷,李宗朋,王健,等.近红外光谱波段优化在白酒酒醅成分分析中的应用[J].光谱学与光谱分析,2016,36(1):84-90.

[26]褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011:78.

Rapid analysis of flavor component of Baijiu by mid-infrared spectroscopy combined with CARS method

SONG Yan1,YANG Yang1,ZHANG Xueping1,XU Chi1,WANG Yu1,CAI Liang1*,LI Ziwen2
(1.Luzhou Laojiao Co.,Ltd.,Luzhou 646000,China;2.China National Research Institute of Food and Fermentation Industries Co.,Ltd.,Beijing 100015,China)

Abstract:The characteristic wavelength variables of ethyl lactate and ethyl acetate in base liquor of strong-flavor(nongxiangxing)Baijiu were screened by mid-infrared spectroscopy combined with competitive adaptive reweighted sampling(CARS)method,and the partial least squares(PLS)model was established and verified.The results showed that the PLS model established by using mid-infrared spectroscopy to eliminate obvious noise regions had a good effect,while the effect of CARS-PLS model established by the characteristic wavelength selection of CARS method was superior to that of the PLS model.The correlation coefficient R2 of ethyl acetate and ethyl lactate of CARS-PLS model were 0.995 and 0.989,respectively,root mean square errors of prediction(RMSEP)were 12.80 and 4.54,respectively,and the relative percent deviation(RPD)was 8.78 and 8.60,respectively.The models were independently validated to achieve high prediction accuracy,the correlation coefficients R2 of data validation were 0.994 and 0.992,respectively,and RMSEP were 13.55 and 4.86,respectively.The model had high accuracy and stability,which could be used for rapid analysis of ethyl lactate and ethyl acetate in Baijiu base liquor,and provided a technical method for quality control of Baijiu brewing process.

Key words:competitive adaptive reweighted sampling; Baijiu base liquor;mid-infrared spectroscopy;wavelength variable selection;quantitative analysis

中图分类号:TS262.3

文章编号:0254-5071(2022)12-0230-05

doi:10.11882/j.issn.0254-5071.2022.12.037

引文格式:宋艳,杨洋,张学平,等.中红外光谱技术结合竞争性自适应重加权算法快速分析白酒风味组分[J].中国酿造,2022,41(12):230-234.

收稿日期:2022-06-01

修回日期:2022-08-18

基金项目:国家重点研发计划(2018YFE0196600)

作者简介:宋 艳(1975-),女,工程师,大专,研究方向为白酒酒体设计。

*通讯作者:蔡 亮(1987-),女,工程师,本科,研究方向为白酒品评与酒体设计。