白酒是一种中国所特有的蒸馏酒,具有鲜明的习惯、民族及地域特征。其中以高粱、玉米等谷物为酿酒原料,以小麦(有的用麸曲和产脂酵母)制作的偏高温大曲为糖化发酵剂的浓香型白酒,是我国白酒中的一朵奇葩[1]。浓香型白酒具有酒窖香浓郁、香味协调、柔软甘洌、尾净余长[2]。白酒因为不同品牌而具有不同的风味,甚至相同酒厂不同酒龄、不同呈香强弱的酒都具有不同的风味,但是白酒中决定其风味和品质的却是2%左右的酯、酸、醇等物质,甚至还有一些没有被研究发现的呈香、呈味物质,这就造成了深入研究的困难[3]。随着化学计量学和各种检测仪器的不断完善,对信息的深入挖掘和分析,可为浓香型白的快速、准确的分类鉴别提供理论依据和方法[4]。
随着现代快速分析仪器技术的发展,近红外光谱技术、拉曼光谱技术、气相色谱质谱联用(gas chromatography-mass spectrometer,GC-MS)技术、电子舌技术、电子鼻技术也广泛的运用于白酒分析领域[5]。刘建学等[6]研究表明,傅里叶变换近红外光谱对白酒基酒中的乙醛、乙醛酸有特异吸收,预测集和验证集的决定系数(R2)分别达到0.942 9、0.918 6;马凯升[7]利用傅里叶光谱结合移动窗口主成分判别分析(move wavenumber-principal component analysis-discriminantfactor analysis,MW-PCA-LDA)和移动窗口偏最小二乘判别分析(move wavenumber-partial least squares-discriminant factor analysis,MW-PLS-DA)对白酒品牌进行了高精度的判别分析;赵国鹏等[8]研究表明,拉曼光谱仪对白酒真伪和白酒原产地追溯具有很高的现实意义;胡雪等[9]通过GC-MS结合化学计量学对浓香型白酒的品牌进行了区分和鉴别,发现GC-MS能够对不同品牌的浓香型白酒进行鉴别。
由于对快速和无损检测技术的需求,感官仿生技术迅速的发展起来[10]。近年来,迅猛发展的电子舌技术被广泛的运用于各种食品的感官评价研究。电子舌仪器是一种模仿人类和动物舌头的新型仪器,用于分析、识别和检测复杂的香气和风味成分,模仿人的味觉器官,通过味觉传感器阵列获取待测样品的信息,通过多元统计分析方法对得到的数据信号进行降维处理,实现对待测样品快速、准确的分析[11-12]。刘鑫等[13]使用电子舌建立了基于深度学习的化学计量学方法对白酒品牌进行了分类;门洪等[14]采用支持向量机结合MQ、MP型气体传感器的电子鼻和电子舌融合系统区分白酒基酒的类型;孙文佳等[15]研究表明,电子舌对同一产地不同品牌的豉香型白酒具有很好的分类,并且味觉雷达图表明线性判别分析法明显优于主成分分析。
本研究使用电子舌仪器,对每个不同年份的白酒基酒样品重复进行3次检测,采用主成分分析(principal component analysis,PCA)、线性判别分析(linear discriminant analysis,LDA)和簇状独立软模式法(soft independent modeling of class analogy,SMICA)、判别因子分析(discriminant factor analysis,DFA)对样品的年份进行分类和识别,以期为白酒行业提供一种快速、稳定、准确的白酒基酒年份分析技术。
本研究选用81瓶不同年份同一酒厂(舍得酒业股份有限公司)的白酒基酒样品作为检测集,其中2016年的白酒基酒样品21瓶,2017年份的白酒基酒样品17瓶,2018年的白酒基酒样品12瓶,2019年的白酒基酒样品9瓶,2020年的白酒基酒样品22瓶,酒精度在66.4%vol~73.5%vol之间;选取2014年~2021年各2个基酒样品共16个样品作为验证集;氯化钾(分析纯):四川西陇科学有限公司。
SmarTongue电子舌:上海瑞玢国际贸易有限公司,其中包括:SmarTongue电子舌主机、SmarTongue自动进样器、SmarTongue样品瓶清洗器、SmarTongue电子舌专用烧杯、SmarTongue电子舌专用样品瓶架:美国ISENSO公司。
1.3.1 试剂配制
清洗溶液:称取0.745 g氯化钾,用超纯水定容至1 L,混匀,静置1 d后备用。
1.3.2 仪器方法
使用电子舌系统对酒样进行数据采集,每个样品取20 mL分别进行电子舌检测,其中传感器阵列分为铂、银、钨、钛、钯、金6个电极,首先使用0.01 mol/L的氯化钾溶液对传感器进行预热,预热30 min,预热完传感器之后用蒸馏水清洗一遍传感器,然后设置电子舌的检测参数最低电压-1 V、最大电压1 V,脉冲间隔200,灵敏度10-4,设置好后开始测试样品。每个样品重复测试3次,每次测试90 s,不同样品之间用蒸馏水清洗传感器,得到电子舌原始数据。
1.3.3 数据处理
首先使用MATLAB 2019b 对降维的电子舌数据进行处理,对数据进行主成分分析(PCA)、线性判别分析(LDA),使白酒基酒年份得到区分;然后使用电子舌智能感官分析专家(ISENSO)将PCA、LDA建模得到的模型分别导入簇状独立软模式法(SMICA)和判别因子分析(DFA)中进行分析,使白酒年份得到很好的区分。使用MATLAB 2019b和Origin 2018绘制获得的数据。
由于原始数据过多,需要将原始数据进行降维处理(见图1),以方便后续的建模分析。
图1 电子舌分析降维数据结果
Fig.1 Results of dimension reduction data by electronic tongue analyse
PCA是一种常用的无监督化学计量学分析方法,以多个变量通过线性变换的形式选出2个或3个变量去代表全体变量的一种多元统计方法,用于降低数据的维度,可以很好的识别样本之间的差异[16-17]。对样品滋味物质电子舌分析结果进行PCA,列出了前十个主成分的方差贡献率,结果见图2。
由图2可知,横坐标是10个主成分数,纵坐标是其方差贡献率,第一成分和第二成分的方差贡献率分别为59.4%和14.5%,前2个成分的方差贡献率和为73%,大于70%,可以代表样品大多数的信息。
图2 各主成分的方差贡献率
Fig.2 Variance contribution rate of each principal component
散点图中每个点表示一个样品的一次检测,每个点之间的距离表示检测次数之间的差异大小,主要表示样品之间的区分,其颜色线圈表示相对应年份样品95%的置信区间[18]。由主成分PC1、PC2构建二维散点图,结果见图3。由图3可知,5个不同年份的浓香型基酒能得到较好的分类。2016年的基酒把2017年~2020年的基酒囊括在内,表明2016年的基酒能够表示2017年~2020年的信息;2017年将2018年和2019年的基酒囊括在内,却与2020年的基酒聚类距离较远,表明2017年的基酒可以表示2018、2019年的基酒信息,不能代表2020年的基酒信息;2018年、2019年和2020年的基酒聚类距离相对较远,表明之间可以得到很好的区分。综上所述,2016年的基酒与2017年~2020年的基酒之间滋味存在很多相似性,2017年的基酒与2018年和2019年的基酒滋味也存在相似性,但是2017年的基酒却与2020年的基酒滋味存在较大差异,2018年、2019年和2020年份的基酒之间的滋味差异较大。
图3 不同年份酒样滋味物质主成分分析散点图
Fig.3 Scatter diagram of taste compounds in Baijiu samples with different years
SMICA分析是多元统计分析中最常用的一个数据分析与挖掘的方法,该方法利用物以类聚的原则对样品进行区分。首先对某一类样品进行PCA分析,建立PCA回归模型构成标准数据库,之后根据该模型对未知的样品进行识别,即勘探该未知样品与标准数据库进行拟合,确定未知样品属于同一类或者不同一类,常用于真伪样品的识别鉴定[19]。主要是通过PCA分析构建的模型进行识别分析,来提供最佳的数据处理的方法。模外数据SMICA结果见图4,模内数据SMICA结果见图5。
图4 模外数据簇状独立软模式法分析结果
Fig.4 Analysis results of out-of-mode data by soft independent modeling of class analogy method
图5 模内数据簇状独立软模式法分析结果
Fig.5 Analysis results of in-mode data by soft independent modeling of class analogy method
由图4可知,垂直线和水平线显示的都是95%的置信区间。将2014年、2015年、2021年每年2个基酒酒样共计6个酒样导入模型进行分析,发现6个酒样都聚类在一起,并且集中在左上角区域,得到的输出结果都是NO,表明输入的6个酒样都不属于模型以内,即输入的6个酒样的年份都不在2016年~2020年,和预期的完全一致,说明该模型能够很好地区分模型2016~2020年份之外的酒样。
由图5可知,将2016年~2020年2个基酒酒样共计10个酒样导入模型,发现10个酒样都聚类在图的左下角,得到的结果都是YES,判断结果与已知结果100%吻合,表明这10个酒样的年份都是模型以内的,即这10个酒样的年份在2016年~2020年以内,该模型能够很好的识别2016~2020年模型之内的基酒样品。综上所述,可以得出该模型稳定性、可靠性、重复性都很好,可以很好的区分不同年份的基酒酒样,可以用于提高酒厂的工作效率,促进白酒行业的健康快速发展[20]。
线性判别分析是一种有监督的数据降维方法。是将同类型的高维数据投影后,将同类型的高维数据聚类到低维空间,而不同类别之间相距较远的一种分析方法[21]。本试验将降维的电子舌数据进行LDA分析。结果见图6。
图6 不同年份酒样线性判别分析散点图
Fig.6 Scatter diagram of Baijiu samples with different years by linear discriminant analysis
由图6可知,不同年份的基酒酒样之间的聚类距离较远,相同年份的基酒酒样之间可以得到很好的聚类,表明6个不同年份的基酒酒样可以得到很好的区分,电子舌对于不同年份的基酒样品可以进行较好的区分识别,且相同年份的基酒样品都很好的落在了相同的区域,且重叠较好。电子舌LDA分析对于不同年份基酒差异性检测的灵敏度很高,且具有较强的实用性[22]。
判别因子分析是通过已有的样品数据建立的数据库对未知的样品数据进行定性分析判别的一种统计学分析方法。其原理是对原始数据进行线性变换,使同一组样品间距最大的缩小,不同组样品间距最大的扩大,使得样品可以很好的得到区分[23]。DFA算法可以对多个样品种类进行区分和识别,常常用于不同等级的区分和产地的鉴别[24]。模外数据的DFA数据结果见图7。
图7 模外数据判别因子分析结果
Fig.7 Results of out-of-mode data by discriminant factor analysis
由图7可知,将2014年、2015年、2021年各2个基酒酒样共计6个酒样导入模型进行分析,结果表明,明显的发现该6个基酒酒样不属于LDA模型任何一个区间,2014年与2015年的基酒样品集中在右上角,2021年的基酒酒样在图左下角,说明该模型不仅可以很好的区分模型之外的年份基酒,而且为之后将更多的年份基酒导入模型,增加模型的预测范围与稳定性提供了依据[25]。
本实验将基酒样品G1、G2、G3、G4、G5分别作为五个等级,将2016年~2020年这5年分别各2个基酒样品共10个样品作为未知样品,来预测样品分别属于哪一个等级,结果见图8。由图8可知将2016年~2020年各2个基酒酒样导入模型,结果表明,不同的年份的基酒酒样能够准确的落入相应的年份范围里面,而且相同年份的基酒酒样得到了很好的聚类,说明该LDA模型不仅可以准确的区分模型以外不同年份的基酒酒样,还可以准确的识别模型以内的不同年份的基酒酒样,对白酒的年份实现了分级[26]。
图8 模型数据判别因子分析区分图
Fig.8 Differentiation diagram of model data by discriminant factor analysis
G1代表2016年的基酒酒样、G2代表2017年的基酒酒样、G3代表2018年的基酒酒样、G4代表2019年的基酒酒样、G5代表2020年的基酒酒样。
本实验采用多传感阵列的电子舌系统对81个白酒基酒酒样进行了年份的区分,使用主成分分析(PCA)和线性判别分析(LDA)建立了一个准确、稳定、快速的模型,通过多元变量统计分析(SMICA)和判别因子分析(DFA)对模型进行评价。实验研究表明,SMICA分析的结果能够准确的识别导入的样品数据是否是模型以内和模型之外的年份基酒,而DFA分析可以准确的对导入的白酒样品的年份进行识别,确定其白酒样品的年份。本研究采用电子舌技术对白酒基酒年份建立了快速稳定的分析方法,克服了传统检测方法费时费力的缺点,实验结果很好,为白酒行业提供了一种快速、准确、稳定的分析方法,为快速推动白酒产业和白酒分析技术的发展提供助力。
[1]孙宝国,吴继红,黄明泉,等.白酒风味化学研究进展[J].中国食品学报,2015,15(9):1-8.
[2]徐岩,范文来,王海燕,等.风味分析定向中国白酒技术研究的进展[J].酿酒科技,2010(11):73-78.
[3]孙宝国,李贺贺,胡萧梅,等.健康白酒的发展趋势[J].中国食品学报,2016,16(8):1-6.
[4]沈怡方.白酒风味质量形成的主要因素[J].酿酒科技,2005(11):19-23.
[5]陈霏,庹先国,曾祥林,等.近红外检测技术在白酒生产中的应用研究进展[J].食品科技,2021,46(1):280-284.
[6]刘建学,张卫卫,韩四海,等.白酒基酒中己酸、乙酸的近红外快速检测[J].食品科学,2016,37(4):181-185.
[7]马凯升.FTNIR光谱结合化学计量学用于白酒品牌鉴别的快速判别分析[D].广州:暨南大学,2016.
[8]赵国鹏,刘洋旋.拉曼光谱技术在白酒质量监测中的应用研究[J].酿酒科技,2021(8):109-113.
[9]胡雪,李锦松,唐永清,等.基于GC-MS结合化学计量学的浓香型白酒分类方法[J].食品与发酵工业,2021,47(8)212-217.
[10]程铁辕,夏于林,张莹.基于机器学习和电子舌技术的白酒掺假鉴别[J].食品工业,2021,42(5):288-291.
[11]邓莉.电子舌对不同类型酒味觉的辨识研究[J].中国酿造,2018,37(7):97-100.
[12]蒲璐璐,戴怡凤,李豆南,等.电子鼻和气质联用技术分析不同酒龄酱香型白酒挥发性成分[J].中国酿造,2021,40(7):171-175.
[13]刘鑫,韩强,周永帅,等.基于深度学习的白酒分类识别方法[J].食品与机械,2021,37(4):68-71.
[14]门洪,张晓婷,丁力超,等.基于电子鼻/舌融合技术的白酒类别辨识[J].现代食品科技,2016,32(5):283-288.
[15]孙文佳,方毅斐,汪廷彩,等.基于电子舌技术的豉香型白酒分类识别研究[J].中国酿造,2020,39(9):182-185.
[16] YOU L X,CHEN J H.A variable relevant multi-local PCA modelingscheme to monitor a nonlinear chemical process[J].Chem Eng Sci,2021,246:116851.
[17]CAO J C,WANG R,JIA Y H,et al.No-reference image quality assessment for contrast-changed images via a semi-supervised robust PCA model[J].Inform Sci,2021,574:640-654.
[18]CHOUBEY D K,KUMAR M,SHUKLA V,et al.Comparative analysis of classification methods with PCA and LDA for diabetes[J].Curr Diabet Rev,2020,16(8):833-850.
[19]郭世鑫,张小娜,姚孟琦,等.不同工艺酱香型白酒成分分析[J].食品与发酵工业,2022,48(1):241-246.
[20]唐维川,孔祥凯,王婷,等.基于主成分分析法评价酱香型白酒的不同轮次基酒[J].现代食品科技,2021,37(7):269-277.
[21]LI X L,ZHANG Y X,ZHANG R.Self-weighted unsupervised LDA[J].IEEE Transactions On Neural Networks and Learning Systems,2021,DOI:10.1109/TNNLS.2021.3105196.
[22]杨尚威,刘传菊,汤尚文,等.基于气相离子迁移谱和电子鼻技术核桃挥发性风味物质的分析研究[J].中国油脂,2021,46(12):127-135.
[23] ZHAO C,ZHAO S N,ZHANG B,et al.Oblivious DFA evaluation on joint input and its applications[J].Inform Sci,2020,528:168-180.
[24]BARRETO I,DORE L H,STOSIC T,et al.Extending DFA-based multiple linear regression inference:Application to acoustic impedance models[J].Physica A,2021,582:126259.
[25]沈乐丞,曾秀英,温志刚,等.基于近红外光谱技术的赣南茶油掺假快速鉴别研究[J/OL].中国油脂,doi:10.19902/j.cnki.zgyz.1003-7969.210357.
[26]ZHANG X,WU H W,LI L N,et al.The qualitative and quantitative assessment of xiaochaihu granules based on e-eye,e-nose,e-tongue and chemometrics[J].J Pharmaceut Biomed Anal,2021,205:114298.
Classification method of Strong-flavor Baijiu base liquor based on electronic tongue technique