白酒主要是以粮食谷物为主要酿造原材料,其酿造工艺及成分纷繁复杂,在相同的原材料、发酵剂和发酵环境,白酒的香型、口感和质量也可能会存在差异。目前,白酒的特性主要是通过品酒师的感官器官对白酒进行色、香、味进行的评价[1]。由于感官分辨的精度有限、评价指标不一致等因素,使得白酒品质难以界定、等级难以分辨。建立一个科学、有效的白酒质量评价方法与客观标准是当前研究的热点问题[2]。
一些学者将图谱技术应用到白酒的特性的识别研究中,建立一些基于图谱技术的白酒分类与识别方法,如气相色谱法[3]、液相色谱法[4]、气质联用(gas chromatographymass spectrometer,GC-MS)[5]、红外光谱法[6]、电子鼻[7]、核磁共振法[8]等方法。在众多的白酒图谱识别技术中,气相色谱-质谱联用仪综合了色谱法的分离能力和质谱的定性能力,可在较短的时间内对多组分混合物进行定性分析,从而有效地体现微量组成成分[9]。GC-MS图谱技术在白酒分类识别中获得较好的性能,栗新峰等[10]将GC-MS色谱技术应用于浓香型白酒基酒质量等级评价,建立一个白酒基酒等级分类模型;张丹丹等[11]利用GC-MS分析不同白酒中的微量组分,实现对白酒特性的更深层次分析与识别。钱宇等[12]对市售畅销的7个品牌、不同等级的浓香型白酒为研究对象,利用主成分(principal component analysis,PCA)降维GC-MS图谱数据,实现不同品牌、不同产地白酒的分类。
当前,基于GC-MS的白酒图谱数据主要采用PCA降维处理,实现图谱数据的主要特征的提取[14]。PCA通过几个正交主成分来表示白酒图谱数据的完整信息,在数据信息最大限度保留的基础上,达到数据降维的目的[16-17]。近年来,随着稀疏表示理论的完善,稀疏表示技术逐步应用于白酒图谱的识别中[18]。为了更好地实现数据的稀疏分解,并体现各组分的权重,将稀疏性与PCA相结合使用,建立稀疏主成分分析(sparse principal component analysis,SPCA)。SPCA运用聚集数据稀疏性的方法来区别主成分,实现每个主成分所对应的单位特征向量能够让尽可能多的零来填充代替,实现用更少的变量线性组合来表示原始数据,从而更好地实现数据降维分析[19]。SPCA已应用于机械故障的诊断[20]、人脸图像[21-22]以及股票分析[23]等行业中。
鉴于此,本研究将SPCA应用于白酒GC-MS图谱分析中,建立基于SPCA与GC-MS的浓香型白酒评判模型,并通过实验验证该方法的有效性[24]。首先采用气相色谱-质谱联用仪对浓香型白酒中的46种微量成分进行定量测试[25],采用SPCA对白酒进行降维分析,获得白酒GC-MS图谱数据的稀疏主成分,最后结合感官评价结果,通过回归分析建立浓香型白酒等级评价模型,从而实现对浓香型白酒的客观评判[26]。
1.1.1 白酒样品
浓香型白酒样品:选取川南地区浓香型白酒样品,白酒经过感官评定后,选取特级(编号为T1、T2、T3、T4、T5)、优级(编号为S1、S2、S3、S4、S5)、一级(编号为Y1、Y2、Y3、Y4、Y5)、二级(编号为R1、R2、R3、R4、R5)四个等级的白酒各5个,共20个酒样。
1.1.2 化学试剂
C7~C40正构烷烃标准品(均为色谱纯):北京曼哈格生物科技有限公司;无水乙醇(纯度99.5%):上海阿拉丁生化科技股份有限公司;甲醇(纯度99.9%):上海阿达玛斯试剂有限公司。
TIC-6800型气相色谱-质谱联用仪:江苏天瑞仪器股份有限公司;DB-WAXMS 色谱柱(30 m×0.25 mm×0.25 μm):安捷伦科技(中国)有限公司。
1.3.1 白酒中挥发性风味成分的GC-MS分析
白酒中挥发性风味成分的检测采用GC-MS法[10]。GC条件:采用DB-WAXMS 色谱柱(30 m×0.25 mm×0.25 μm)。进样量为1 μL,分流比为20∶1,进样口温度为250 ℃;载气为高纯氦气(He),流速1mL/min;初始温度40℃,然后以10℃/min升温到120 ℃,120 ℃时的保留时间为2 min;再以10 ℃/min升温到200 ℃,保留时间为2 min[12];最后以10 ℃/min升温到250 ℃,250 ℃时的保留时间为2 min。MS条件:接口温度:280 ℃;电离方式为电子电离(electronic ionization,EI)源,电子能量70 eV;离子源温度230 ℃;扫描质量范围29~500 m/z。
风味物质定性分析:对酒样进行GC-MS分析,利用美国国家标准与技术研究院(national institute of standards and technology,NIST)12数据库及相对保留时间指数对白酒中的风味成分进行定性分析。相对保留时间指数:将C7~C40的正构烷烃标准品与酒样相同实验条件下进行分析,根据各正构烷烃的保留时间计算相应的保留时间指数(retention index,RI),其计算公式如下:
式中:RIx表示待测组分的保留指数;T(i)表示待测组分的保留时间,min;n和n+1分别表示正构烷烃的碳原子个数,个。
样品测定及定量分析:准确量取5 mL白酒样品,加入体积分数为60%的乙醇溶液配制的3种混合内标溶液100 μL(乙酸正戊酯15.10 g/L、叔戊醇15.19 g/L、2-乙基丁酸15.09 g/L),混匀后自动上机进行GC-MS检测。实验中分别利用乙酸正戊酯、叔戊醇和2-乙基丁酸计算酒样中酯类、醇类和酸类及其他风味物质的校正因子含量。参考国标GB/T 10345—2007《白酒分析方法》中的内标法,根据内标峰面积计算各风味成分的含量。
1.3.2 白酒样品的感官评价及分级
浓香型白酒感官评价参考国家标准GB/T 10345—2007《白酒分析方法》[29]进行。感官评价人员组成是由川南区域品酒员组成。采用编号顺位暗评品评法对白酒进行评价,按照色、香、味、格分别为5分、25分、60分、10分的评分配比进行综合评定,总分为100分,对各品酒师所打分求平均值,即为该白酒品评得分。其中得分93.0~100.0分为特级,88.0~92.9分为优级,80.0~87.9分为一级,70.0~79.9分为二级,70.0分以下为其他。
1.3.3 基于SPCA白酒质量评价模型的建立
SPCA运用聚集数据稀疏性降维实现图谱数据的主成分提取,与PCA相比,SPCA每个主成分所对应更少原始图谱数据,更好地体现白酒微量与白酒品质的相关性[30-31]。采用稀疏主成分分析方法来搭建一个基于不同等级的浓香型白酒的质量评判模型,将更能体现白酒微量成分与白酒特性的关系。本研究将通过对白酒中微量成分进行SPCA降维处理,建立综合指标因子,并与感官评价相结合,寻求更科学、客观与准确的浓香型白酒的评价模型。整个评价模型建立方法如下:
(1)图谱数据的初始化与标定
对于第i个样本的GC-MS图谱的积分峰面积向量记为Xi,构建n(n=46)个白酒样品的积分峰面积矩阵X={X1,X3,X3,……Xn},其对应白酒品质等级主观评分的数据集为U={u1,u2,u3,……un}(ui范围0~100)。
(2)SPCA分解与综合指标的确定
分别计算积分峰面积矩阵的前m个主成分(这里m=10),以及前m个主成分所对应的特征向量,从而分别得到特征向量矩阵A=(α1,α2,…αm)。
对于给定的积分峰面积矩阵X的特征向量矩阵A=(α1,α2,…αm),计算基于弹性网惩罚结构的稀疏主成分问题:
得到积分峰面积的稀疏主成分向量D=(d1,d2,…dm)=与稀疏主成分方差贡献率向量R=(R1,R2,…,Rm)。
积分峰面积的稀疏主成分可以通过稀疏主成分向量与图谱积分峰面积线性组合得到:
通过最大峰值数据构建的白酒特性的综合指标G,G为稀疏主成分Fj与贡献率Rj的乘积之和。
(3)感官分值的数学模型的建立
以综合指标G作为自变量,把感官评分产生的分值U作为因变量进行回归分析处理,建立的白酒的感官分值的数学模型U=f(G)。
采用上述气相色谱测试条件对浓香型白酒样品中的挥发性风味成分进行测定,代表白酒样品的挥发性风味成分GC-MS分析的总离子流色谱图见图1,各化合物含量见表1。
图1 浓香型白酒代表样品挥发性风味成分GC-MS分析总离子流色谱图
Fig.1 Total ion chromatogram of volatile flavour compounds in representative strong-flavor Baijiu sample analysis by GC-MS
表1 浓香型白酒代表样品挥发性风味成分GC-MS分析结果
Table 1 GC-MS analysis results of volatile flavour compounds in representative strong-flavor Baijiu sample
由表1可知,共筛选得到46种共有化合物,酯类18种,醇类10种,醛酮类7种,酸类9种,苯类2种。酒样中含量较高的风味物质主要为酯类,其中乙酸乙酯、乙酸丙酯、丁酸乙酯、亚油酸乙酯、正己酸乙酯、乳酸乙酯、己酸乙酯、己酸、十八酸乙酯和异丁酸乙酯明显高于其它风味物质。
20个浓香型白酒样品感官品评分见表2。由表2可知,选取的特级、优级、一级与二级四个等级的样品酒各5个,其评分值在70~100分之间均匀分布,这有利于提取代表白酒等级特性的主成分信息,以便建立准确的客观评价模型。
表2 20个白酒样品的感官品评结果
Table 2 Results of sensory evaluation of 20 Baijiu samples
对20个白酒中的46种挥发性风味成分物质构成20×46矩阵采用稀疏主成分的方法进行因子分析[32],剔除成分矩阵中特征值小于1的成分中特征向量对应的变量,然后重新进行因子分析,结果保留了30个能够代表白酒区分等级的成分。通过凯撒正态化最大方差法进行旋转[33],再利用SPCA处理,得到前10个稀疏主成分特征值、方差贡献率和累计方差贡献率见表3。
表3 10个稀疏主成分的特征值、方差贡献率和累计方差贡献率
Table 3 Eigenvalues,variance contribution rates and cumulative variance contribution rates of 10 sparse principal components
由表3可知,前7个稀疏主成分的累计方差贡献率达到93.579%,即前7个主成分能够代表白酒数据中93.579%的白酒信息特性。前7个稀疏主成分向量矩阵如表4所示。通过表4可得到前7个主成分F1,F2,F3,F4,F5,F6,F7的标准线性组合关系如公式(5)所示,其中X1,X2,X3,……X30为30个共有峰的峰面积,构建的白酒成分特性的综合指标G为稀疏主成分与贡献率的乘积之和(公式6)。
表4 前7个稀疏主成分向量矩阵
Table 4 Vector matrix of first seven sparse principal components
其中,F的系数为对应的累计方差贡献率,X的系数为系数主成分微量成分值。
将综合指标G与各个白酒的感官评分U结合分析,如表5所示。从表5对特级、优级、一级、二级四级表述可以看出,综合指标G在数值上与感官评分结果基本一致,由此可见,综合指标G越大,感官评分的综合得分就会越高,质量等级就会越好。
表5 20个样本的综合指标值
Table 5 Comprehensive index values of 20 samples
以综合指标G作为自变量,感官评分U作为因变量进行回归分析处理,依次对白酒数据作对数回归、线性回归、二次方回归、三次方回归四种回归分析方法,所产生数据的回归分析结果如图2所示,感官评分分数与综合指标的回归分析关键见表6所示。
图2 回归分析结果
Fig.2 Results of regression analysis
表6 感官评分分数与综合指标间的回归分析
Table 6 Regression analysis between sensory score and comprehensive index
比较表6中四种不同的回归分析方法得到的相关系数R2可知,三次回归分析拟合度高达99.3%,能准确反应酒样中综合指标G与感官评分分值U之间的关系。因此,本研究建立的基于SPCA与GC-MS的浓香型白酒评价模型为:
另选用的20个白酒样本,采用本文建立的白酒评价模型(公式5)进行模型验证,得到20个白酒样本客观评分结果与感官评分对比结果见表7所示,模型验证结果见表8。
由表7可知,客观评判模型评价的结果与感官评分虽然存在差异,但差值的绝对误差小于3,两者的鉴定结果基本一致。由表8可知,采用本文模型等级评价结果与感官评分结果相符率达到94%。因此,本文建立的基于SPCA与GC-MS白酒质量评价模型能够准确性实现白酒等级的评判,具有较强的实际应用价值。
表7 等级评价模型评分结果
Table 7 Score results of grade evaluation model
表8 模型验证结果
Table 8 Validation results of model
本研究以浓香型白酒为研究对象,利用GC-MS图谱分析技术对白酒的微量成分进行有效的检测,采用SPCA数据处理与回归分析方法建立白酒质量评价模型。利用建立的白酒质量评价模型对白酒质量进行客观评分,在实现特级、一级、二级、优级四级白酒的等级评判中,准确率达到94%。可见本研究建立的基于GC-MS与SPCA技术的白酒质量评价模型具有较好的学术参考与实际应用价值。另外,由于样品酒有限,加之样品标注的信息不全,本研究仅对白酒的质量等级进行研究,未对白酒年代、产地、品牌以及价格等特性进行研究,下一步工作将GC-MS与SPCA技术应用于白酒年代、产地、品牌等其它特性研究中,并建立相应的判别模型。
[1]李建,姜雪.浓香型纯粮白酒鉴别方法的研究[J].中国酿造,2015,34(1):118-121.
[2]陈飞,张良,霍丹群,等.浓香型白酒基酒的现状和发展趋势[J].中国酿造,2017,36(10):5-8.
[3]何亚芬.气相色谱法同时检测食品中9 种常见食品添加剂方法的建立与应用[D].南昌:江西农业大学,2020.
[4] HUANG X H,ZHENG X,CHEN Z H,et al.Fresh and grilled eel volatile fingerprinting by e-nose,GC-O,GC-MS and GC×GC-QTOF combined with purge and trap and solvent-assisted flavor evaporation[J].Food Res Int,2019,115:32-43.
[5]曹梦思.色谱-质谱联用技术在食品药品分析检测中的应用[D].石家庄:河北医科大学,2019.
[6]邓波,沈才洪,丁海龙,等.红外光谱分析技术在白酒行业中的应用进展[J].中国酿造,2020,39(9):13-17.
[7]周容,袁琦,夏瑛,等.电子鼻技术在兼香型白酒年份区分中的应用研究[J].中国酿造,2020,39(8):65-69.
[8]李欣.核磁共振技术在食品检测中的应用[J].食品安全导刊,2017(10):76-77.
[9]RAAFAT K.Phytochemical analysis of Juglans regia oil and kernel exploring their antinociceptive and anti-inflammatory potentials utilizing combined bio-guided GC-FID,GC-MS and HPLC analyses[J].Rev Bras de Farmacognosia,2018,28(3):358-368.
[10]栗新峰,张良,李芳芳,等.基于GC-QTOFMS 技术的浓香型白酒原酒质量等级评价[J].食品工业科技,2019,40(15):235-241
[11]张丹丹,李晓路,周宇,等.利用GC-MS 分析不同白酒中的微量组分[J].安徽农业科学,2018,46(10):167-169,214.
[12]钱宇,胡雪,孙跃,等.基于指纹图谱和化学计量学的浓香型白酒分类研究[J].中国酿造,2021,40(6):152-156.
[13]尹金娣.稀疏主成分分析算法研究[D].西安:西安电子科技大学,2015.
[14] ALTINEL B,GANIZ M C.A new hybrid semi-supervised algorithm for text classification with class based semantics[J].Knowl-Based Syst,2016,108(C):50-64.
[15]吴文睿,董琪,刘露,等.基于GC-MS 和嗅闻仪联用浓香型白酒中窖泥臭味成分分析[J].中国酿造,2021,40(3):162-165.
[16]胡雪,李锦松,唐永清,等.基于GC-MS 结合化学计量学的浓香型白酒分类方法[J].食品与发酵工业,2021,47(8):212-217.
[17]刘芳,杨康卓,张建敏,等.基于电子鼻和气质联用技术的浓香型白酒分类[J].食品与发酵工业,2020,46(2):73-78.
[18]王海燕,王虎,王国祥,等.基于压缩感知的白酒香型分类[J].计算机工程,2015,41(3):172-176,181.
[19]胡正平,陈俊岭.多层融合深度局部PCA 子空间稀疏优化特征提取模型[J].电子学报,2017,45(10):2383-2389.
[20]栗茂林,梁霖,王孙安.基于稀疏表示的故障敏感特征提取方法[J].机械工程学报,2013,49(1):73-80.
[21]王亚星,齐林,郭新,等.基于稀疏PCA 的多阶次分数阶傅里叶变换域特征人脸识别[J].计算机应用研究,2016,33(4):1253-1257.
[22]叶学义,罗宵晗,王鹏,等.基于非凸低秩分解判别的叠加线性稀疏人脸识别[J].中国图象图形学报,2019,24(8):1327-1337.
[23]周爱民,刘晓孟.基于稀疏模型的人民币汇率波动预测[J].上海金融,2019(3):10-19,33.
[24]李俊刚,郭文宇,罗英,等.利用GC-MS 法对不同窖龄的浓香型白酒风味物质的研究[J].中国酿造,2015,34(9):141-144.
[25]张晓磊,饶静,李春扬.气相色谱与气质联用技术在白酒质量控制中的应用[J].酿酒科技,2016(2):16-23.
[26]李建,姜雪.浓香型纯粮白酒鉴别方法的研究[J].中国酿造,2015,34(1):118-121
[27]吴卫宇,苏占元,杨晓军,等.测定白酒中挥发性风味成分方法的研究[J].酿酒科技,2018(6):34-46.
[28]李晓颍,张红医,常巧英,等.气相色谱-四极杆飞行时间质谱准确鉴定常见水果蔬菜中的农药残留[J].色谱,2014,32(3):268-277.
[29]胡韶武,张国杰.白酒分析方法(2007 版)解读[J].酿酒,2007,34(5):91-92.
[30] HAN X,PENG J,CUI A,et al.Sparse principal component analysis via fractional function regularity[J].Math Probl Eng,2020:1-10.
[31]成可.稳健稀疏主成分回归的研究及应用[D].济南:山东大学,2019.
[32]刘亚清,马艺翔.基于数据挖掘的白酒分类问题研究[J].中国酿造,2018,37(4):155-158.
[33]童谣.求解稀疏主成分分析问题的快速算法研究[D].福州:福州大学,2016.
Quality evaluation model of strong-flavor Baijiu based on GC-MS