Construction of a model for the rapid detection of acids in strong-flavor original Baijiu based on mid-infrared spectroscopy technology
原酒作为粮食到成品酒的一个中间产物,其质量控制是不可或缺的一部分,也是后续白酒分级储存和勾调的主要依据[1-2]。快速检测原酒中的关键风味物质含量是实现在线原酒分级的一种有效方式[3]。目前,原酒中的总酸、己酸、乙酸和丁酸等关键指标采用滴定法以及气相色谱(gas chromatography,GC)法检测,这些常规分析方法均存在样品前处理复杂、操作工序繁琐,无法实现原酒智能分级和指标快速检测[4-6]。红外光谱分析技术因其具有无损、高效、可实时在线分析等特点,与光纤传感技术联用将是未来实现工业自动化控制的发展趋势,已被广泛应用于白酒定性分析(白酒真伪鉴定[7]、贮藏年份确定[8]和等级划分[9])与定量分析(酒精度[10]、总酸[11]、总酯[12]、四大酯[13-16])。
浓香型白酒中酸类化合物具有呈味助香作用,可以降低酒的苦味和杂味,提高白酒的协调性,其中,己酸、乙酸、丁酸是浓香型白酒中含量最高的挥发性酸类物质,对白酒的香气存在重大影响[17-19]。己酸是产生“窖香”的主要成分之一,乙酸可以产生强烈的刺激性酸味,丁酸在浓香型白酒“泥香”和“烤香”中起到关键作用[20-21]。此外,酸类物质也是酯类合成的前体物质,酸、酯的动态平衡对白酒香气起重要作用。因此,建立酸类物质的无损快速检测技术对白酒质量控制、指导实际生产尤为重要[22-25]。
本研究以解决企业实际生产应用为出发点,结合傅里叶变换中红外光谱(Fourier transform mid-infrared spectrometer,FT-MIR)仪的特点与原酒分级、勾调的需求,以浓香型原酒为研究对象,通过理化检测和色谱分析对原酒中总酸、己酸、乙酸和丁酸进行量化,利用傅里叶变换中红外光谱仪获取原酒的中红外光谱数据,运用偏最小二乘法(partial least squares,PLS)建立浓香型原酒中总酸、己酸、乙酸、丁酸定量模型,并用验证样品进行模型准确度检验,以期提高酒样分析效率,为浓香型原酒快速分级和品质监控提供实时数据参考。
1.1.1 材料1 070个浓香型原酒样品、40个模型外部验证酒样(Y-1~Y-40):舍得酒业股份有限公司。
1.1.2 试剂
无水乙醇(色谱纯):德国Sigma公司;乙酸、己酸、丁酸、2-乙基丁酸(均为色谱纯):阿拉丁生化科技股份(上海)有限公司;氢氧化钠、酚酞(均为分析纯):成都市科隆化学品有限公司;Triton试剂、Decon-90试剂:中国食品发酵工业研究院有限公司。
Lacto-Scope FT-B傅里叶变换中红外光谱仪[配备氘化三甘氨酸硫酸酯(deuterated triglycine sulfate,DTGS)检测器,分辨率4 cm-1]:美国Perkin Elmer公司;ME204分析天平:上海Mettler-Toledo有限公司;Milli-Q超纯水机:美国默克化工有限公司;8890气相色谱(gas chromatography,GC)仪、DB-FFAP毛细管色谱柱(60 m×250 μm×0.25 μm):美国Agilent公司。
1.3.1 浓香型原酒酸类物质的测定
总酸含量的测定:参考GB/T 10345—2022《白酒分析方法》采用酸碱滴定法;乙酸、丁酸、己酸含量的测定:采用GC法[26]。
1.3.2 基于傅里叶变换中红外光谱浓香型原酒中酸类物质定量检测模型的建立及优化
(1)中红外光谱数据的采集
Lacto-Scope FT-B傅里叶变换中红外光谱仪预热8~10 h(室温23~26 ℃),以1‰Triton试剂的光谱作为背景,对仪器进行调零,待调零程序通过后,将80~100 mL原酒样品置于烧杯中,采用Lacto-Scope FT-B傅里叶变换中红外光谱仪进行检测,透射样品池直径36 μm,扫描范围为4 000~400 cm-1,扫描次数为32,使用Result Plus软件对光谱数据进行采集,每个样品采集3次,以4‰的Decon-90试剂作为清洗液对管道进行清洗。
(2)光谱数据处理和定量模型的建立
样品集划分:使用Unscrambler 10.3软件对1 070个原酒样品的光谱数据进行分析,通过Kennard-Stone算法将970个原酒样品按照2∶1的原则对校正集和验证集进行划分,剩余100个原酒样品划分为预测集。
特征波段选择:采用后向区间偏最小二乘法(backward interval partial least squares,Bi-PLS)结合文献[27-28]对光谱数据进行特征波段选择,以交叉验证均方根误差(root-meansquare error of cross validation,RMSECV)最小所对应的特征波段作为最佳特征波段。
定量模型建立及内部验证:采用PLS结合筛选出的最佳特征波段建立物质光谱与待测成分含量的线性模型,从而实现中红外光谱信息对待测成分含量的快速定量。内部验证是通过模型的决定系数(R2)、校正集的预测均方根误差(root mean square error of calibration,RMSEC)和预测集的预测均方根误差(root mean square error of prediction,RMSEP),即均方根误差(root mean square error,RMSE)等参数来判断模型的质量。其中,R2越大,RMSEC和RMSEP值越小且相近,说明所建模型的质量就越好。
(3)定量模型最佳主成分数的确定
采用构建的定量模型对预测集(100个)浓香型原酒样品的酸类物质含量进行预测,依据相对误差<10%的样品数占比进行判断,筛选模型最佳主成分数,对最终的模型预测效果进行验证判断。
(4)定量模型外部验证
外部评价是通过选取不同车间、不同等级的40个浓香型原酒样品作为验证酒样,采用国标法对其总酸、乙酸、丁酸、己酸进行测定,与模型预测的数据进行对比,计算绝对误差和相对误差,评估已有模型的精确度及稳定性。
1.3.3 数据处理
采用Origin 2022软件和Excel 2016软件进行数据处理;采用Unscrambler 10.3软件进行定量模型的建立;采用Matlab R2022b软件进行最佳特征波段的确定。
定量模型的建立
2.1.1 样品集划分
根据1 070个原酒样品的光谱数据,将样品划分为校正集(647个)、验证集(323个)及预测集(100个),不同集合浓香型原酒样品中酸类物质的含量见表1。
表1 不同集合浓香型原酒中酸类物质含量测定结果
Table 1 Determination results of acids contents in different collections of strong-flavor original Baijiu
指标 集合 样品数/个平均值/(g·L-1)最大值/(g·L-1)最小值/(g·L-1)标准差/(g·L-1)总酸己酸校正集验证集预测集校正集验证集预测集647 323 100 647 323 100 1.341 1.333 1.332 0.299 0.296 0.312 2.290 2.320 2.100 0.634 0.638 0.637 0.660 0.620 0.770 0.056 0.048 0.052 0.339 0.349 0.360 0.206 0.201 0.246
续表
指标 集合 样品数/个平均值/(g·L-1)最大值/(g·L-1)最小值/(g·L-1)标准差/(g·L-1)乙酸丁酸校正集验证集预测集校正集验证集预测集647 323 100 647 323 100 0.903 0.884 0.864 0.118 0.117 0.109 1.390 1.416 1.286 0.422 0.440 0.434 0.451 0.486 0.525 0.002 0.002 0.002 0.182 0.179 0.182 0.110 0.096 0.116
2.1.2 特征波段筛选
1 070个浓香型原酒样品的傅里叶变换中红外光谱图见图1。波长筛选不仅可以剔除无关的变量,还可以简化模型,提高模型的稳定性和准确度。
图1 浓香型原酒样品的傅里叶变换中红外光谱图
Fig.1 Fourier transform mid-infrared spectroscopy of strong-flavor original Baijiu samples
由图1可知,在波长3 500~3 300 cm-1、900~400 cm-1区间曲线不平滑,影响建模效果,可在建模过程中删除该区域。有研究表明,羧酸类物质的红外特征吸收峰分别在3 400~2 500 cm-1、1 740~1 650 cm-1、1 600~1 300 cm-1、950~900 cm-1[29],因此,可初步将3 300~900 cm-1作为酸类物质中红外建模分析的特征波段。使用Matlab R2022b软件结合Bi-PLS分析筛选出RMSECV最小的光谱区域,并与初步得到的中红外光谱特征吸收峰结合,得到最佳特征波段用于建模,结果见表2。
表2 酸类物质的最佳特征波段
Table 2 Optimal characteristic waveband for acids
指标 最佳特征波段 RMSECV总酸0.268 0己酸0.076 0乙酸0.044 8丁酸2 727~2 518 cm-1,2 302~2 094 cm-1 2 950~2 889 cm-1,2 819~2 692 cm-1,2 622~2 495 cm-1,2 426~2 233 cm-1,1 901~1 840 cm-1,1 770~1 709 cm-1,1 573~1 512 cm-1,1 377~1 315 cm-1,1 246~1 184 cm-1 2 727~2 518 cm-1,1 878~1 670 cm-1,1 454~1 245 cm-1 3 151~3 070 cm-1,3 032~2 900 cm-1,2 854~2 773 cm-1,2 727~2 603 cm-1,2 557~2 519 cm-1,2 472~2 349 cm-1,2 302~1 925 cm-1,1 879~1 755 cm-1,1 708~1 670 cm-1,1 623~1 500 cm-1,1 454~1 246 cm-1,1 200~1 076 cm-1,1 030~991 cm-1,945~906 cm-1 0.049 6
由表2可知,总酸、己酸、乙酸、丁酸分别挑选出105、206、158、416个变量点,占全谱区的11.2%、22.1%、16.9%、44.5%。
2.1.3 酸类物质定量模型的构建及内部验证
以筛选得到的酸类物质的光谱数据为自变量、含量为因变量建立酸类物质定量模型,校正集和验证集浓香型原酒样品酸类物质的预测值和真实值的相关性见图2和表3。
图2 校正集及验证集浓香型原酒总酸(A)、己酸(B)、乙酸(C)和丁酸(D)含量预测值与真实值的相关性分析结果
Fig.2 Analysis results of correlation between predicted and real values of total acid (A), caproic acid (B), acetic acid (C) and butyric acid (D)contents in strong-flavor original Baijiu of calibration and validation sets
图中蓝色点代表校正集,红色点代表验证集。
表3 浓香型原酒中酸类物质定量模型内部验证结果
Table 3 Internal validation results of quantitative model for acids in strong-flavor original Baijiu
?
由图2和表3可知,总酸、己酸、乙酸的决定系数R2均≥0.95,丁酸的决定系数R2均>0.90,表明酸类物质模型拟合度高;酸类物质的RMSE均<0.041,表明预测结果准确性好,可以满足企业实际生产应用的需求。丁酸大部分样品的平均含量只有0.117 g/L,含量较低,导致模型效果较其他3种模型效果略差。综上所述,浓香型原酒中酸类物质的红外光谱吸收与化合物含量之间存在良好的线性关系,模型具有较高的准确性;总酸、己酸、乙酸、丁酸的校正集决定系数逐渐降低,表明化合物含量范围越宽,含量分布越均匀,模型拟合效果越好。
模型的主成分数不能太大或太小,太大会造成模型过拟合,太小会造成模型欠拟合,均会影响模型预测效果。因此,采用预测集筛选酸类物质定量模型的最佳主成分数,结果见表4。由表4可知,总酸、己酸、乙酸和丁酸定量模型的最佳主成分数分别为9个、19个、8个、9个,己酸定量模型的最佳主成分数较总酸、乙酸、丁酸大,可能是由于己酸较乙酸、丁酸摩尔质量大,振动的频率没有乙酸、丁酸快所致[30]。
表4 酸类物质定量模型最佳主成分数的确定
Table 4 Determination of the optimal principal component numbers for acids quantitative model
定量模型 相对误差≤10%样品数的占比/% 最佳主成分数/个总酸己酸乙酸丁酸99 86 95 32 9 19 89
另取40个厂区浓香型原酒样品,利用所建模型对样品中总酸、己酸、乙酸和丁酸含量分别进行预测,并将预测值和国标法测定的真实值进行比较,结果见表5。由表5可知,总酸含量的绝对误差均≤0.081 g/L,相对误差均≤6.155%;己酸的绝对误差均≤0.047 g/L,相对误差均≤9.856%;乙酸的绝对误差均≤0.105 g/L,相对误差均≤9.333%;丁酸的绝对误差均≤0.100 g/L,相对误差均≤50.943%,由于丁酸含量极低,丁酸结果较差。综上,总酸、己酸和乙酸含量预测值与真实值基本一致,说明模型的预测效果很好,能满足白酒企业生产中总酸、己酸和乙酸的检测要求,丁酸可作为日常监测指标。
表5 浓香型原酒中酸类物质定量模型外部验证结果
Table 5 External validation results of quantitative model for acids in strong-flavor original Baijiu
样品编号总酸绝对误差/(g·L-1)相对误差/%己酸绝对误差/(g·L-1)相对误差/%乙酸绝对误差/(g·L-1)相对误差/%丁酸绝对误差/(g·L-1)相对误差/%Y-1 Y-2 Y-3 Y-4 Y-5 Y-6 Y-7 Y-8 Y-9 Y-10 0.012 0.029 0.027 0.029 0.044 0.027 0.009 0.053 0.081 0.055 1.007 2.282 2.121 2.209 3.508 1.949 0.737 4.304 6.155 4.380 0.015 0.008 0.013 0.006 0.011 0.028 0.013 0.020 0.035 0.006 6.338 4.137 4.276 2.587 4.086 6.383 3.531 4.869 9.890 1.734 0.068 0.058 0.066 0.074 0.090 0.079 0.062 0.032 0.002 0.078 7.387 6.143 6.977 7.628 8.537 8.305 6.388 3.272 0.487 7.113 0.050 0.042 0.005 0.056 0.016 0.100 0.033 0.067 0.020 0.084 49.850 35.823 5.960 45.396 11.437 50.091 23.238 40.128 11.437 39.309
续表
样品编号总酸绝对误差/(g·L-1)相对误差/%己酸绝对误差/(g·L-1)相对误差/%乙酸绝对误差/(g·L-1)相对误差/%丁酸绝对误差/(g·L-1)相对误差/%Y-11 Y-12 Y-13 Y-14 Y-15 Y-16 Y-17 Y-18 Y-19 Y-20 Y-21 Y-22 Y-23 Y-24 Y-25 Y-26 Y-27 Y-28 Y-29 Y-30 Y-31 Y-32 Y-33 Y-34 Y-35 Y-36 Y-37 Y-38 Y-39 Y-40 0.032 0.024 0.018 0.059 0.029 0.034 0.042 0.018 0.027 0.023 0.079 0.017 0.000 0.017 0.009 0.005 0.042 0.008 0.007 0.053 0.026 0.014 0.003 0.005 0.018 0.041 0.003 0.061 0.020 0.032 1.875 1.728 1.142 4.536 2.104 2.768 2.869 1.137 1.972 1.558 4.024 1.295 0.033 1.121 0.727 0.389 3.854 0.884 1.264 4.099 1.656 0.513 0.230 0.194 0.817 2.735 0.243 4.152 1.927 1.927 0.009 0.027 0.014 0.024 0.010 0.020 0.011 0.023 0.003 0.004 0.021 0.032 0.023 0.011 0.019 0.009 0.017 0.000 0.001 0.047 0.028 0.006 0.001 0.029 0.025 0.018 0.021 0.006 0.026 0.012 1.266 7.715 3.383 8.278 4.167 6.596 3.275 4.925 1.186 0.987 6.602 9.823 5.888 3.411 8.794 3.710 9.757 0.027 0.376 9.856 7.709 1.840 0.143 8.608 7.173 6.576 5.921 1.971 6.854 3.692 0.029 0.064 0.047 0.060 0.013 0.052 0.043 0.031 0.028 0.029 0.046 0.005 0.061 0.050 0.105 0.046 0.033 0.032 0.012 0.011 0.006 0.047 0.021 0.032 0.038 0.082 0.049 0.050 0.064 0.047 2.874 6.947 5.146 6.522 1.285 5.088 4.619 3.128 2.286 3.233 5.301 0.407 7.121 5.515 9.333 5.266 4.059 3.437 1.385 1.020 0.612 4.913 2.218 3.082 4.457 7.666 6.078 5.732 4.832 5.940 0.048 0.018 0.036 0.042 0.048 0.019 0.010 0.019 0.008 0.019 0.001 0.009 0.076 0.015 0.010 0.066 0.039 0.005 0.028 0.053 0.065 0.063 0.053 0.010 0.035 0.014 0.044 0.085 0.013 0.050 34.735 10.375 15.182 29.329 34.735 10.359 10.357 18.694 4.874 21.145 0.744 8.696 48.869 12.000 8.696 36.017 30.058 5.163 20.058 45.175 42.211 50.943 38.383 5.322 28.102 9.739 34.921 39.600 7.914 33.601
采用傅里叶变换中红外光谱技术结合偏最小二乘法建立了浓香型原酒中总酸、己酸、乙酸和丁酸含量的快速检测模型,模型的决定系数R2均>0.90,校正集和预测集的RMSE均<0.041 g/L,最佳主成分数分别为9个、19个、8个、9个,总酸、己酸、乙酸定量模型的相对误差均<10%,丁酸定量模型的相对误差≤50.943%。综上,基于中红外光谱技术建立的总酸、乙酸、己酸定量模型具有良好的预测能力,能为浓香型原酒快速分级和品质监控提供数据支撑和理论依据。傅里叶变换中红外光谱技术结合PLS对原酒酸类化合物进行定量分析,克服了传统检测技术的复杂、费时等问题,模型预测结果良好,可以用于常规的分析检测,为原酒的智能分级和白酒勾调提供一种快速而准确的分析方法。
[1]唐佳代,赵益梅,冉光耀,等.光谱技术在白酒质量控制中的研究进展[J].食品工业科技,2023,44(4):506-514.
[2]彭厚博.多光谱在白酒分析检测中的应用研究[D].自贡:四川轻化工大学,2022.
[3]WU J H,PENG H B,LI L,et al.FT-IR combined with chemometrics in the quality evaluation of Nongxiangxing Baijiu[J].Spectrochim Acta A,2023,284:121790.
[4]廖丽,文静,邹永芳,等.中红外光谱快检技术在浓香型原酒风味分析中的应用研究[J].酿酒科技,2024(4):36-45.
[5]舒楠,张福艳,张翔,等.光谱技术及其在白酒生产中的应用研究进展[J].中国酿造,2023,42(10):18-24.
[6]JIA W, FAN Z B, DU A, et al.Recent advances in Baijiu analysis by chromatography based technology-A review[J].Food Chem,2020,324:126899.
[7]孙宗保,辛新,邹小波,等.傅里叶变换红外光谱结合化学计量学方法对白酒基酒的快速定性和定量分析[J].光谱学与光谱分析,2017,37(9):2756-2762.
[8]周瑞,陈晓明,张莉丽,等.化学计量学结合中红外光谱的浓香型白酒分类研究[J].食品与发酵工业,2023,49(5):88-93.
[9]LIN L Y,FAN W L,XU Y,et al.Characterization of key odorants in Chinese Texiang aroma and flavor type Baijiu(Chinese liquor)by means of a molecular sensory science approach[J].J Agr Food Chem,2024,72(2):1256-1265.
[10]胡耀强,郭敏,叶秀深,等.近红外光谱法间接测定白酒酒精度[J].光谱学与光谱分析,2022,42(2):410-414.
[11]黄清霞,付国勇,陈黎萍.成品白酒中酸酯总量的近红外检测[J].食品工业科技,2022,43(5):310-314.
[12]段学,赵小波,邹胜琼,等.近红外分析技术快速检测白酒基酒中的总酯含量[J].酿酒科技,2021(3):105-108.
[13]马凤丽,庞臻,曾英,等.红外光谱在白酒检测中的应用研究进展[J].酿酒科技,2022(5):103-107.
[14]苏鹏飞,张武岗,董飘然,等.基于FTB-MIR凤香型原酒三大酯指标快速分析研究[J].酿酒,2022,49(6):34-37.
[15]田育红,王凤仙,吴青.基于近红外光谱分析技术快速检测白酒中的关键指标[J].酿酒,2019,46(5):93-96.
[16]唐云容,庞臻,钟敏,等.中红外光谱分析技术结合化学计量学方法快速分析酱香型白酒酸酯含量[J].中国酿造,2024,43(1):244-249.
[17]张河云,王学娇,张曼,等.酸类物质对浓香型白酒风味的影响研究[J].中国酿造,2023,42(11):82-89.
[18]刘建学,张卫卫,韩四海,等.白酒基酒中己酸、乙酸的近红外快速检测[J].食品科学,2016,37(4):181-185.
[19]邹胜琼,段学,田敏,等.中红外模型快速检测白酒基础酒中总酯的含量[J].酿酒,2021,48(3):74-77.
[20]周军,杨洋,姚瑶,等.中红外光谱技术在浓香型白酒原酒关键指标分析中的应用[J].光谱学与光谱分析,2022,42(3):764-768.
[21]苏鹏飞,朱瑞雪,金成勇,等.凤香型原酒总酸和总酯指标快检技术的开发[J].酿酒,2023,50(3):110-112.
[22]翟双,庹先国,张贵宇,等.基于FT-NIR光谱技术结合KPCA-MD-SVM对白酒基酒的快速判别[J].现代食品科技,2022,38(4):248-253.
[23]郭玉姗,刘建学,李璇,等.基于近红外光谱技术的白酒基酒中乳酸的快速检测[J].食品工业科技,2018,39(20):212-216.
[24]朱定国,杨春生,李鸿舟,等.现代检测技术在白酒生产中的应用现状[J].酿酒,2023,50(3):16-22.
[25]YAN Y M, QU Y, DU R, et al.Colorimetric assay based on argininefunctionalized gold nanoparticles for the detection of dibutyl phthalate in Baijiu samples[J].Anal Methods,2021,13(43):5179-5186.
[26]胡瑾,马一飞,罗佳雪,等.气相色谱法同时测定白酒中57种风味物质[J].中国酿造,2022,41(5):206-211.
[27]WU M X, FAN Y, ZHANG J B, et al.A novel organic acids-targeted colorimetric sensor array for the rapid discrimination of origins of Baijiu with three main aroma types[J].Food Chem,2024,447:138968.
[28]韩云翠,吕志远,刘玉涛,等.基于傅立叶变换中红外光谱技术的浓香型基酒快速检测[J].食品与发酵工业,2024,50(1):272-278,285.
[29]褚小立.近红外光谱分析技术实用手册[M].北京:机械工业出版社,2016:312-316.
[30]褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011:56-60.