基于风味组学和机器学习模型的中匈特色蒸馏酒挥发性风味物质差异研究

熊浩宇1,2,索化夷1,3,易志强1,4,5,杜木英1,4,5,夏杨毅1,5*

(1.西南大学 食品科学学院,重庆 400715;2.西南大学 西塔学院,重庆 400715;3.西南大学 食品科学与工程国家实验教学示范中心,重庆 400715;4.中匈食品科学合作研究中心,重庆 400715;5.川渝共建特色食品重庆市重点实验室,重庆 400715)

摘 要该研究采用顶空固相微萃取-气相色谱-质谱联用技术(HS-SPME-GC-MS)分析不同香型白酒和不同风味匈牙利帕林卡酒的挥发性风味成分,结合多变量统计方法和机器学习模型,系统解析两种蒸馏酒的特征风味成分。采用正交偏最小二乘判别分析(OPLS-DA)构建模型,利用方差分析与变量投影重要性(VIP)值筛选差异风味物质。结果表明,两种蒸馏酒共鉴定出80种挥发性风味物质,包括醇类2种、醚类7种、酸类3种、萜烯类11种、酮类10种、酯类17种和其他类30种。通过方差分析结合VIP值,筛选出25种差异风味物质(VIP值>1,P<0.05),其中帕林卡酒以萜烯类和醚类为主要差异成分,而白酒则以酯类和醇类为主要差异成分。基于随机森林算法分类模型显示,原甲酸三乙酯和(+)-柠檬烯等物质是区分两类蒸馏酒的关键成分。该研究结果为揭示不同发酵原料和工艺对蒸馏酒风味形成的影响规律提供科学依据。

关键词白酒;帕林卡酒;挥发性风味成分;差异分析;风味组学;机器学习模型

中国白酒和帕林卡酒(Palinka)是中匈两国著名的传统烈性蒸馏酒的代表,因其酒香浓郁、滋味醇厚且历史文化悠久等特色深受消费者青睐[1]。中国白酒以高粱或小麦为原料,通过固态发酵和蒸馏工艺制成,有酱香、浓香、清香等12种香型[2]。帕林卡酒(Palinka)以匈牙利李子和樱桃等水果经液态发酵蒸馏制成,果香浓郁,深受中欧地区喜爱,2002年获欧盟地理标志保护认证(protected geographical indication,PGI)[3]。尽管白酒和帕林卡酒同属烈性蒸馏酒范畴,然而因其发酵原料、酿造工艺及地域文化等差异,形成了迥异的风味体系[4]

研究表明[5],蒸馏酒香气源于原料发酵代谢产物与蒸馏热反应。中国白酒中高级醇、酯类和吡嗪类呈现醇厚发酵香型,帕林卡酒中萜烯和酮类化合物则散发清新果香。目前,顶空固相微萃取-气相色谱-质谱联用技术(headspace solid-phase microextraction-gas chromatography-mass spectrometry,HS-SPME-GC-MS)因其高灵敏度和环保等优势,已成为酒类挥发性风味成分分析的标准方法之一[6]。MIAO Y J等[7]采用HS-SPME-GC-MS对发酵杨梅酒和混合杨梅酒的挥发性风味成分进行解析,并采用主成分分析(principal component analysis,PCA)和正交偏最小二乘判别分析(orthogonal partial least squares discriminant analysis,OPLSDA)等多维统计方法明确杨梅酒中β-石竹烯和辛酸乙酯为其标志性杨梅果香的关键赋香组分。然而,传统化学计量学PCA和OPLS-DA在解析GC-MS高维非线性风味数据时,易出现过拟合、泛化弱及抗波动性差等劣势[8-9]。相比之下,随机森林和支持向量机等机器学习方法依托集成学习高维映射机制,深度解析百余种挥发性组分的非线性交互网络,智能捕获香气关键协变因子,突破传统风味解析的劣势[9-10]。机器学习模型虽在葡萄酒、啤酒风味指纹解码中成熟应用,但在白酒与帕林卡酒的风味比对仍待突破[11-12]

基于此,本研究以白酒和帕林卡酒为研究对象,检测其基本理化指标(pH、总酸和酒精度),并采用HS-SPME-GCMS技术分析两种不同原料体系传统蒸馏酒的挥发性风味成分,并结合随机森林(random forest,RF)等机器学习算法建立其挥发性风味物质的指纹图谱,为传统酿造工艺优化和现代化发展提供新思路。研究结果将为揭示不同发酵原料和工艺对蒸馏酒风味形成的影响规律提供科学依据,同时为传统酿造工艺的优化与创新提供理论支持。

1 材料与方法

1.1 材料与试剂

1.1.1 酒样

本研究所用白酒样品均购自中国不同产区具有代表性的各大型白酒生产企业;帕林卡酒样品则由中匈果酒白兰地(帕林卡)实验室提供,采用本地水果和匈牙利工艺进行酿造。酒样的香型及生产厂商信息见表1。

表1 白酒和帕林卡酒的香型和生产厂商信息
Table 1 Information of aroma types and manufacturer of Baijiu and Palinka

样品编号 香型 类别 来源BHE BZH BJI BFU BST董香型芝麻香型酱香型馥郁香型浓香型白酒白酒白酒白酒白酒贵州董酒股份有限公司山东景盛酒业有限公司贵州茅台股份有限公司酒鬼酒股份有限公司泸州老窖股份有限公司

续表

样品编号 香型 类别 来源BLA PUM PKI PPA PNA PYE PEE老白干香型桑葚香型猕猴桃香型百香果香型脐橙香型黄桃香型梨香型白酒帕林卡帕林卡帕林卡帕林卡帕林卡帕林卡衡水江源酒业有限公司中匈果酒白兰地(帕林卡)实验室中匈果酒白兰地(帕林卡)实验室中匈果酒白兰地(帕林卡)实验室中匈果酒白兰地(帕林卡)实验室中匈果酒白兰地(帕林卡)实验室中匈果酒白兰地(帕林卡)实验室

1.1.2 试剂

氯化钠、氢氧化钠(均为分析纯):成都市科隆化学品有限公司;C7~C40 正烷烃标准品、叔戊醇(均为色谱纯):坛墨质检标准物质中心;无水乙醇(分析纯):上海阿拉丁生化股份有限公司。

1.2 仪器与设备

PH-100笔式酸度计:上海力辰邦西仪器科技有限公司;固相微萃取装置(100 μmDVB/CAR/PDMS):美国Supleco公司;8890-5977B气相色谱-质谱联用(GC-MS)仪、DB-WAX毛细管色谱柱(30 m×0.25 mm×0.25 μm):美国安捷伦科技有限公司;MS5S恒温磁力搅拌器:群安科学仪器(浙江)限公司。

1.3 方法

1.3.1 基本理化指标测定

pH值:采用pH计测定;酒精度、总酸:参照国标GB/T 42100—2022《白酒分析方法》测定。

1.3.2 挥发性风味物质测定

采用HS-SPME-GC-MS法[6]测定白酒和帕林卡酒挥发性风味物质。

样品前处理:取1mL样品,加水稀释至酒精度为10%vol,加入0.161 g/mL的内标叔戊醇6 μL,氯化钠1.5 g于20 mL顶空进样瓶中,振荡均质摇匀后上机,在50 ℃水浴中平衡5 min,用250 ℃下老化30 min装有固相微萃取纤维的手动进样器插入瓶中萃取40 min,同时将样品保持在50 ℃、220 r/min的转速连续搅拌,萃取完后,迅速拔出手动进样器,插入GC-MS进样口,解吸5 min。

GC-MS条件为:DB-WAX毛细管色谱柱(30m×0.25mm×0.25 μm),进样口温度230 ℃;色谱柱升温程序:初始温度50℃,保持2min,以3 ℃/min 速率升至145 ℃,再以10 ℃/min速率升至230 ℃,保持6 min;载气为高纯氦气(He),流速4 mL/min;分流比10∶1;分流流量10 mL/min。采用电子电离(electronic ionization,EI)源,电子能量70 eV;离子源温度230 ℃;接口温度220 ℃;质量扫描范围33~350 m/z。

定性分析[13]:测定结果通过Agilent自动质谱解卷积定性系统进行化合物挖掘,扣除因色谱柱流失和萃取针涂层掉落的硅氧烷类化合物的杂质峰后,以C7~C40 正构烷烃作为碳标,根据保留时间(retention time,RT)计算目标化合物的保留指数,结合美国国家标准技术研究所(National Institute of Standards and Technology,NIST)17 Library谱库检索结果,根据匹配度>80%对样品中化合物进行定性分析。

定量分析[14]:以叔戊醇作为内标物,计算各化合物峰面积与内标物峰面积的比值,对目标化合物进行半定量分析。

1.3.4 机器学习模型构建

机器学习模型构建方法参照ALIY A等[15]的方法调整和修改。采用多层次数据预处理策略,通过系统性识别并处理异常值和缺失值,采用零值填充策略处理缺失数据。将所有特征转换为数值类型,使用0值填充缺失数据,确保模型能够有效处理所有输入。为消除特征间的量纲差异使用StandardScaler进行特征标准化处理,并将数据集划分为训练集(80%)和测试集(20%)。随后在Matlab选择RF模型,具体设置包括100棵决策树、随机种子设为42,并使用默认参数配置。通过对模型进行训练和预测,构建一个高效且准确的分类模型,从而提高分类性能并增强模型的泛化能力,最终得到白酒和帕林卡酒分类模型。

1.3.5 数据分析

每组样品进行3次重复实验,数据使用SPSS 22.0进行分析,结果以“平均值±标准差”表示。采用方差分析来评估数据之间是否存在显著差异(P<0.05),邓肯多重范围检验用于多重比较。使用SIMCA14.1进行主成分分析(PCA)和正交偏最小二乘判别分析(OPLS-DA),并使用Origin2024进行绘图。使用Matlab R 2023a进行数据清洗、特征选择和随机森林分类器的训练与验证。

2 结果与分析

2.1 白酒和帕林卡酒基本理化指标分析

由表2可知,帕林卡酒与白酒在酒精度、pH值和总酸含量等指标上表现出显著差异(P<0.05)。帕林卡酒的酒精度(39.61%vol~58.31%vol)范围明显宽于中国白酒(41.46%vol~54.44%vol),这种差异可能源于两类酒品在蒸馏工艺的区别。研究表明[16],帕林卡酒多采用单次蒸馏工艺,酒精度取决于果实发酵程度和蒸馏时间的差异。相比之下,白酒采用多次蒸馏或固态发酵工艺,能够获得更稳定的酒精范围[17]帕林卡酒的pH在2.57~5.14,而白酒的pH在3.74~3.88,整体呈现弱酸性且稳定性更好。帕林卡酒的总酸含量为0.10~1.04 g/L,白酒的总酸含量为1.07~2.30 g/L,白酒总酸整体比帕林卡酒总酸高。这种差异主要归因于原料属性,帕林卡酒使用不同种类的水果为原料,其天然酸度存在较大差异。例如,INDRALOKA A B等[18]研究发现,水果中的有机酸组成显著影响最终产品的pH值,而白酒以谷物为原料,发酵过程中产生的酸类物质组成相对稳定。

表2 白酒和帕林卡酒的基本理化指标比较
Table 2 Comparison of basic physicochemical indexes of Baijiu and Palinka

注:同一列不同小写字母表示差异显著(P<0.05)。

样品编号 酒精度/%vol pH值 总酸/(g·L-1)PKI PUM PNA PPA PEE PYE BFU BHE BJI BLA BST BZH 44.50±0.06f 48.20±0.27d 42.64±0.27g 44.16±0.27f 39.61±0.53h 58.31±0.97a 46.18±0.27e 54.44±0.21b 53.59±0.44b 41.46±0.45g 52.25±0.26c 44.83±0.33f 2.57±0.04d 5.06±0.13a 4.95±0.05a 2.58±0.05d 4.31±0.01b 5.14±0.01a 3.78±0.04c 3.88±0.06c 3.80±0.06c 3.76±0.04c 3.79±0.07c 3.74±0.07c 1.03±0.10d 0.23±0.02e 0.10±0.04e 1.04±0.09d 0.24±0.02e 0.14±0.04e 1.37±0.10c 1.80±0.04b 2.30±0.08a 1.11±0.17d 1.75±0.08b 1.07±0.02d

2.2 白酒和帕林卡酒挥发性风味成分分析

白酒和帕林卡酒挥发性风味成分HS-SPME/GC-MS分析结果见表3,白酒和帕林卡酒各类别挥发性风味成分数量、含量及UpSet共性分析结果见图1。由表3可知,在白酒和帕林卡酒共12个样品中共鉴定出80种挥发性风味物质,包括醇类2种,醚类7种,酸类3种,萜烯类11种,酮类10种,酯类17种,其他类30种。

图1 白酒和帕林卡酒各类别挥发性风味物质数量(a)、含量(b)及UpSet分析(c)
Fig.1 Quantity (a), contents (b) and UpSet analysis (c) of various categories volatile flavor substances of Baijiu and Palinka

表3 白酒与帕林卡酒中的挥发性风味物质含量测定结果及香气描述
Table 3 Contents determination results and aroma description of volatile flavor substances of Baijiu and Palinka

-1)·L(mg量/含物合化CAS号序BZH BST BLA BJI BHE BFU PYE PEE PPA PNA PUM PKI- - - - - - - - - - - - -25.29±2.45b-9.29±1.97b 2.33±0.5b 4.23±0.38a- - - -3.56±0.82abc- - - - - - - - - -4.83±0.25a- - - --10.02±2.49b- - - -5.25±1.54bc- - - - - - - -4.09±0.23bc- - - - - -3.91±0.74abc- - - - - - - - - -1.06±0.30c- - - -- - -1.05±0.61b- - -37.50±7.04a 19.38±3.78- - - - - -9.82±3.17b- - -30.79±17.63- -8.12±4.71ab- - - - - - - - - - - - - - -- - - - - -20.09±14.73ab 38.63±17.07a- -17.35±7.09- - - -19.30±7.40a 5.08±4.09a- - - - - - - - - - - - -1.04±0.69- - - - - - -1.09±0.43 13.30±0.59b 8.32±2.25-21.61±0.35-30.56±15.68a- - - -191.99±30.00-241.07±15.36a-19.79±4.85a- -9.30 40.11±- - -8.14±2.75a- - - - - - - - - -1.59±0.47b- - - -- - - - - - - - - - - -19.18±12.19- -6.14±0.61bc-2.60±0.74b- - - -5.21±1.18ab- - - - - - - - - - - - - - -- - - - - - - - - - - - - -1.53±0.22- - - - - - -3.92±1.22abc- -16.51±0.79b- - - - - -3.90±1.68- - - - -- - - - - - -3.72±0.50b- - - - - - -0.98±0.48c- - - - - -2.98±0.78bc- - - - - -4.07±1.26- - - - - - - --38.37±9.43a- - -6.59±2.54a- - - - - - - - -0.95±0.57c- - - -36.36±8.19a- -15.51±1.37-172.68±48.50a-1.27±0.19 167.16±29.65a- - - - - -17.26±5.50- -- - - - - - - - - - - - - - - - - - - - - -4.98±1.48abc-0.63±0.26-0.48±0.24- - - - - - - - - - -- - -1.40±0.29a- - - - - - - - - - - - - - - - - -5.99±0.33ab- -11.49±0.07b- - - - -0.62±0.13- -2.62±0.31-0.83±0.31 5.60±1.45-30.32±1.87a-1.69±1.16a-9.65±4.23a- - -0.71±0.19- - - - -1.01±0.10c- - - -31.89±14.43a 800.77±79.51- - -145.48±23.68a- -87.11±43.97b- - - - - - - - -醇酮酮丙烯基-1-酯)乙基酯酯基酮己-2-酮)酮甲酯乙烷基]-2-苯酯酯酯酸酸酯)环酸酯醚醚酮丁基酯丙酯酸醚乙唑-4-)乙辛-8-甲基甲(9ci酯油炔-3-酯醚乙环醚酸酯酮罗甲酮戊酯丁苯甲乙基酯甲吡乙基己丁丁乙乙硝乙苯酸基酮基戊醛酯戊甘二紫杂二酮丁三叔胺己单酸苯丁酸乙酸-3-)氨酸基酸甲戊二已二基异兰辛酸水基酰啶酸氧二酚庚叔酸缩烯-3-二脂戊酸基基酸-1-丁叶酸基醇氨基酸甲乙蝶基基-1H-环罗己基缩环[4.2.0]戊基基-β-异环二基-2,4-丁甲羟庚二二甲醇基戊己烷-5,6-2-二2-硬)-(3-紫丁甲原丁己异香DL-乳基-1-丙甲2,3-甲特乙双辛-4-羟叔基-4,6-戊2,4-癸1,3-苯喃4-二异3-基-3-杂3-基-3-(1H甲7呋(2-羟5-羟1-氮乙7-甲2-1-(1-甲2-[(1-1-三2,4,4-889949-94-4 556-52-5 1000325-69-9 166273-38-7 23361-74-2 10032-15-2 7452-79-1 6938-26-7 6423-45-6 1127-01-1 628-68-2 626-82-4 624-09-9 540-18-1 136-36-7 122-51-0 111-61-5 105-79-3 97-62-1 1000452-56-7 1000285-27-5 10317-17-6 994-05-8 919-94-8 615-05-4 105-57-7 1010302-80-6 1000144-04-3 116296-75-4 88725-82-0 29743-33-7 14129-48-7 5579-73-7 2432-27-1 2890-62-2 127-41-3 212762-88-4 7498-54-6类 A 1 A 2醇类 B 1 B 2 B 3 B 4 B 5 B 6 B 7 B 8 B 9 B 10酯B11 B12 B13 B14 B15 B16 B17类 C 1 C 2 C 3 C 4 C 5 C 6 C 7醚类 D 1 D 2 D 3 D 4 D 5 D 6 D 7 D 8 D 9 D 10酮类 E 1 E 2酸

续表

-1)/(mg·L量含物合化BZH BST BLA BJI BHE BFU PYE PEE PPA PNA PUM PKI 0.69±0.04- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -20.01±1.38a- - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -5.50±3.50bc- - - - - -- - - - - - - - - - - - - - - - - -4.15±2.29b- - - - - - - - - - - - - - - - - - - - - - -- - -18.23±13.22- - - - -4.05±3.22- - - - - - - - - - - - - - - - - - - - - - - - -10.43±2.49b- - - - - -- - - - -4.06±0.79- - - - - - - -1.67±0.60- - -19.71±0.79a- - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - -0.44±0.04b- - - - - - - -13.70±4.79b- - - - - - - - - - - -5.18±2.49c- - - - - -- - - - - - -90.69±77.27b- - - - - - - - - - - - - - -23.40±11.43a- - - - - - -2.75±1.74- - - - - - - -673.78±115.24a-- - - - - - - - - - - - - - -3.56±1.37-12.20±6.09a- - - - - - -21.73±9.80b- - - - - - - - - - - - - -2.36±3.23a--12.33±0.86 2.94±0.51- - - -6.06±2.73b- - - -3.44±0.96- - - - - - -0.47±0.05- - - -604.69±155.57a 1.72±1.27ab- - -9.19±2.88- -14.17±8.04- - - - - -9.92±5.31a-- - - -4.60±3.70-101.98±74.39 434.63±307.51a 20.30±14.23-2.90±2.44 39.74±23.55- - - -2.41±1.51- -108.76±107.13-1.15±0.71- - -2.54±0.74b-0.22±0.06 81.39±51.39 0.91±0.59- - - - - -1.38±0.70-3.22±1.58a- - -- - - - - - -17.31±12.86b- - - - -1.86±0.27a- - - - - - - -45.05±7.24a 20.94±2.13a 8.73±2.37- - - - - - -0.31±0.05- -4.76±3.01c-0.26±0.04 3.09±0.61a- -0.45±0.08- - - - - - -6.73±1.76b- - - - - - - - -12.68±4.43a- - - - - - -562.01±277.19a 2.33±1.72a- - - - - - -0.93±0.56- - - -0.92±0.28 5.55±6.36a-烯辛-2-烷环[4.2.0]萘酯氢辛环[3.2.1]萘萘基胺氢唑氢己)乙八吡八喃双异基啉啶苯吩基烯基-烯萘胺双咔烷喃酸基]-1H-酰)嘧丁噻烯脑酰呋基甲-2H-吡羰唑(2-基基羧酮-6-乙萘胺三甲烷氧磺三环-2-)戊喃氢-γ-喃氢基基酰)-2-甲苯异咪)-3,7,7-烯龙二-1,2,3,4,4a,5-六烯四烯基烯基苯)甲烯烯戊壬甲吡基四呋甲甲四甲吩肼并三杉苯烯烯喃-2-林基烷竹烯木烯甲丙基-1-氧烷)-1,2,3,4,4a,5,6,7-基-N'-基萘氧并檬-4,7-二三氢基-1,2,8,8-二桂氧烷羟基二噻菖氧酰螺苯)-1,2,3,4,4a,5,6,7-邻(苯基紫柠葵氢瑟基-3-二乙基香甲-2-乙基)-辛荷-1,5,8-四柏白丁对B-基甲β-基表)-αα-基乙基石苯茶四β-榄基基基基-8a-甲月)-1,3-甲苯基甲氢-1,1,6-氧氧-+烯丙(1-基-5-二1,1-2H-1-苯基-1,2,3,4-烯基-2',3',4'-甲基-2,5--2,6,6-三乙氧3-二四乙丙甲基羟(1-酰(1-6-甲3-2-4-甲5,6-烯(2-二羟1-乙3-基基-2-丙4-(2-5'-4,4-烯基-3-1,2,3,4-2-乙甲甲二二4a,8-4-[2-5-103827-22-1 98816-47-8 97630-77-8 74630-07-2 54815-13-3 41678-32-4 36431-72-8 30316-36-0 22315-87-3 24741-64-8 13667-28-2 13442-89-2 13423-15-9 10599-70-9 7392-19-0 3900-45-6 3842/3/3 1758-88-9 616-44-4 613-94-5 582-60-5 475-03-6 102-51-2 G8 G9 G10 G11 G12 G13 G14 G15 G16 G17 G18 G19 G20 G21 G22 G23 G24 G25 G26 G27 G28 G29 G30)。0.05(P<著显异差示表母字写小同不行,同出检未示”表),“-://www.flavornet.org/index.html(http库据数味风线在考参词述描气:香注

由图1a可知,在两种烈性蒸馏酒中,白酒样品中酯类种类突出,董香型白酒最为显著有7种酯类,帕林卡样品中萜烯类和醚类种类突出,脐橙帕林卡最为显著有6种萜烯类。同时,在猕猴桃帕林卡、桑葚帕林卡、脐橙帕林卡、百香果帕林卡、梨帕林卡、黄桃帕林卡、董香型白酒、酱香型白酒、浓香型白酒和芝麻香型白酒等10个样品中均检测到酮类组分,仅在桑葚帕林卡和芝麻香型白酒两个样品中检测到酸类组分。GUO Y等[19-20]在研究不同香型白酒时发现酯类物质在数量上具有明显优势,这可能是因为酯类物质是酒类发酵过程中微生物代谢的主要产物,而萜烯类化合物的丰富度则可能源于原料和发酵工艺的差异。

由图1b可知,桑葚帕林卡中醚类和萜烯类含量较高,百香果帕林卡以醚类和酮类为主,梨帕林卡中酮类和酯类含量为主,而黄桃帕林卡则以萜烯类为主,猕猴桃和脐橙帕林卡则均表现出醚类和萜烯类占比较高的特点。白酒样品则展现出显著不同的各类别分布特征。除浓香型白酒外,其他香型白酒均以酯类化合物为主,尤以董香型白酒最为突出,其酯类含量高达553.45 mg/L。田露琴[21]研究表明,白酒中酯类化合物主要来源于发酵过程中微生物的代谢活动,其中酵母的酯化作用起着关键作用。

由图1c可知,不同香型的白酒样品中组分甲基叔戊醚在所有6个样品中均检测到,组分(+)-柠檬烯在馥郁香型(BFU)、董香型(BHE)、老白干香型(BLA)、浓香型(BST)和芝麻香型(BZH)这5个样品中检测到,组分1,1-二乙氧基-3-甲基丁烷在馥郁香型(BFU)、酱香型(BJI)、浓香型(BST)和芝麻香型(BZH)这4个样品中检测到。不同风味帕林卡酒中组分(+)-柠檬烯在猕猴桃(PKI)、桑葚(PUM)、脐橙(PNA)、百香果(PPA)和黄桃(PYE)这5个样品中检测到,组分甲基叔戊醚在桑葚(PUM)、脐橙(PNA)、梨(PEE)和黄桃(PYE)这4个样品中检测到,组分1,2,3,4-四氢-1,1,6-三甲基萘在猕猴桃(PKI)、百香果(PPA)、梨(PEE)和黄桃(PYE)这4个样品中检测到,组分茶螺烷在猕猴桃(PKI)、脐橙(PNA)、百香果(PPA)和梨(PEE)这4个样品中检测到。在帕林卡酒中,猕猴桃和桑葚帕林卡分别独有17种挥发性风味成分,脐橙帕林卡独有20种,百香果帕林卡独有19种,梨帕林卡独有8种,黄桃帕林卡独有9种。白酒样品中,董香型白酒独有15种挥发性风味成分,酱香型和芝麻香型白酒分别独有9种,馥郁香型、老白干香型和浓香型白酒均分别独有7种。从各白酒和帕林卡酒共有的组分来看,帕林卡酒中检测到的(+)-柠檬烯主要来源于水果原料中的萜烯类化合物。研究表明,柠檬烯是水果中重要的风味前体物,在发酵过程中经过生物转化可产生多种具有特征香气的衍生物[22]。1,2,3,4-四氢-1,1,6-三甲基萘和茶螺烷与水果发酵过程中的降解产物有关,这种现象在其他水果研究中也有报道[23]。在白酒样品中,甲基叔戊醚的存在体现了中国传统酿造工艺中特有的醚化反应特征。1,1-二乙氧基-3-甲基丁烷的分布特征则反映了不同香型白酒在缩醛类物质形成途径上的差异。结果表明,脐橙帕林卡独有组分最多,其次是桑葚帕林卡和百香果帕林卡,而白酒中以董香型独有成分最多,其次是酱香型。这种差异性挥发性成分的分布特征直观地反映了不同样品的特征风味,其中帕林卡酒以水果为原料,萜烯类和醚类成分含量较高,呈现出浓郁的果香特征;白酒则以粮食为原料,通过发酵和陈化过程生成大量酯类和醇类物质,形成层次丰富的复合香气。

酯类是中国白酒(14种)和帕林卡酒(6种)两类烈性蒸馏酒中常见的挥发性成分。在白酒中,己酸丁酯、庚酸庚酯、丁酸戊酯和戊酸-1-甲基丙酯酯类主要通过假丝酵母和毕赤酵母等酵母菌或曲霉菌等在发酵过程中产生酯化酶,并促使酸与醇发生酯化反应生成[14]。在帕林卡中,异戊酸己酯和2-羟基戊酸乙酯等物质主要来源于发酵、蒸馏时的挥发与富集及陈酿过程中的醇酸反应,赋予其独特的果香和柔和口感。这些酯类物质不仅影响风味特点,也是评估品质的重要指标。此外,醚类也影响蒸馏酒的感官特征[24]。白酒中的醚类以DL-乳酰胺甲醚和甲基叔戊醚为主,而帕林卡酒中的醚类以香叶基乙醚和甲基叔戊醚等为主,其差异可能与其水果发酵所含果胶物质和多酚类物质的生化代谢有关[24]。酮类在帕林卡酒检出的含量明显多于白酒,主要由微生物代谢、陈酿过程中醇类氧化以及美拉德反应等非酶促褐变反应生成[25]。其中紫罗兰酮源于类胡萝卜素的氧化降解,反映其以水果为原料的特点[25]。萜烯类化合物作为天然风味物质,在帕林卡酒中(9种)多于白酒(3种),具有草本、花香或柑橘香气,主要由微生物代谢产生。研究表明,α-葵烯烯、白菖烯等化合物可能来源于酵母菌株合成特定萜烯类化合物[26]

2.3 白酒和帕林卡酒差异风味物质分析

2.3.1 聚类分析和主成分分析

基于挥发性风味物质对两种蒸馏酒进行聚类分析(cluster analysis,CA)及主成分分析(PCA),结果见图2。由图2a可知,可将样品聚为三类,第一类是猕猴桃帕林卡(PKI),第二类为黄桃帕林卡(PYE),其余样品归为第三类。其中酱香型白酒(BJI)和老白干香型白酒(BLA)的聚类关系紧密,这与两者在发酵过程中都采用高温大曲发酵工艺相关[27]。梨帕林卡(PEE)与馥郁香型白酒(BFU)、浓香型白酒(BST)和芝麻香型白酒(BZH)挥发性风味物质的组成上具有相似性、桑葚帕林卡(PUM)的独立聚类现象,则可能源于其原料中特有的酚类和萜烯类物质[22]。由图2b可知,前两个主成分(PC1和PC2)的累计方差贡献率达57.8%,表明该模型足够捕捉样品间差异的主要信息。在得分散点图中,12种样品的数据点主要分布在95%置信椭圆内,表明数据质量可靠且稳健。结果表明,CA及PCA可初步揭示酒样间的相似性和差异性,但样本间存在一定重叠不能够有效区分不同酒样。

图2 基于挥发性风味物质白酒和帕林卡酒聚类分析(a)和主成分分析(b)
Fig.2 Cluster analysis (a) and principal component analysis (b) of Baijiu and Palinka based on volatile flavor substances

2.3.2 正交偏最小二乘判别分析

与PCA相比,OPLS-DA通过引入正交信号校正,可有效滤除与分类无关的系统变异,提高模型的预测能力和可解释性[28]。为进一步揭示不同蒸馏酒样品间的差异,采用OPLS-DA模型对12种蒸馏酒的挥发性风味物质进行判别分析,结果见图3。由图3a可知,百香果帕林卡和猕猴桃帕林卡两组呈正向分布,其余组别均呈负向分布,8种样品在得分图中呈现出一定程度的重叠,这与ZHENG X T等[29]的结果相似,表示某些白酒间存在共同的特征香气物质,这可能是导致样品区分度降低的重要原因。同一个样品数据重复性较好,模型的自变量拟合指数(R2Y)为0.992,因变量拟合指数(R2X)为0.932,预测指数(Q2)为0.837,R2和Q2超过0.5,表明模型具有较好的解释度和拟合度。

图3 白酒和帕林卡酒挥发性风味物质正交偏最小二乘判别分析得分图(a),荷载图(b)及置换检验结果(c)
Fig.3 Score diagram (a), loading diagram (b) and permutation test results (c) of orthogonal partial least squares discriminant analysis of volatile flavor substances of Baijiu and Palinka

由图3b可知,每个成分对于不同样本的重要程度,茶螺烷、4-羟基-β-紫罗酮、香叶基乙醚、乙缩醛与百香果帕林卡相关性高,缩水甘油、3-异丙基氧杂环丁烷、茶螺烷、乙缩醛与猕猴桃帕林卡相关性高,B-瑟林烯、(+)-柠檬烯与脐橙帕林卡相关性高,己酸丁酯、丁酸戊酯、异丁酸乙酯与董香型白酒相关性高。猕猴桃帕林卡、百香果帕林卡、董香型白酒和脐橙帕林卡的香气分布表现出显著的样品区分度。这种区分可能源于不同原料和工艺对挥发性成分的显著影响。由图3c可知,经过200 次置换检验,结果表明,R2=0.0319、Q2=-1.15,Q2回归线与纵轴的相交点小于0,说明模型对数据不存在过拟合,模型验证有效。

2.3.3 差异挥发性风味物质筛选

变量重要性投影(variable importance in the projection,VIP)值可衡量变量对于分类的影响强度,VIP值越大意味着变量对于分类的贡献越大,通常以VIP值>1作为重要变量的筛选标准[30]。采用单因素方差分析的Duncan检验与VIP值结合,筛选出VIP值>1且P<0.05 的差异挥发性风味物质,结果见图4。由图4可知,在12种蒸馏酒样品中共筛选出包括庚酸庚酯、己酸异丁酯、丁烷、硬脂酸乙酯、3-甲基四氢呋喃、2-羟基戊酸乙酯、α-葵烯烯和甲基叔戊醚在内的25种差异挥发性风味物质(VIP值>1且P<0.05)。其中,乙缩醛、壬醛二乙缩醛、1,1-二乙氧基-3-甲基丁烷等挥发性成分主要通过醛类与醇类的缩合反应形成,其含量往往反映了酒体的陈化程度[31]。而3-异丙基氧杂环丁烷、茶螺烷等环状化合物可能是在发酵和蒸馏过程中通过复杂的生化代谢途径转化形成的次生代谢产物[32]。值得注意的是,这些特征性化合物的组成模式不仅反映了原料和工艺的差异,也与微生物代谢过程密切相关,不同发酵条件下微生物群落结构的变化会显著影响酯类化合物的合成途径和积累水平,这为解释不同类型蒸馏酒的特征风味差异提供了重要的分子基础。

图4 基于正交偏最小二乘判别分析白酒和帕林卡酒挥发性风味物质变量重要性投影值
Fig.4 Variable importance in the projection values of volatile flavor substances of Baijiu and Palinka based on orthogonal partial least squares discriminant analysis

2.3.4 聚类分析热图

为进一步了解区分不同白酒和帕林卡酒挥发性风味成分,将依据VIP值>1且P<0.05筛选出的25种差异风味物质进行聚类分析热图,结果见图5。由图5可知,脐橙帕林卡中(+)-柠檬烯和B-瑟林烯含量明显高于其他样品;董香型白酒中的2-甲基丁酸乙酯、丁酸戊酯和己酸丁酯含量高于其他样品,其中2-甲基丁酸乙酯、丁酸戊酯和己酸丁酸酯等酯类化合物主要源于发酵过程中酵母脂肪酸代谢和酯化作用,是形成白酒典型果香的重要贡献者[33]。此外,酱香型白酒中的1,1-二乙氧基-3-甲基丁烷和α-葵烯烯含量高于其他样品。而百香果帕林卡和猕猴桃帕林卡中,4-羟基-β-紫罗酮、乙缩醛和茶螺烷含量高于其他样品。老白干香型白酒中,2-羟基戊酸乙酯、DL-乳酰胺甲醚和2,3-丁二醇二硝酸酯含量高于其他样品。

图5 白酒和帕林卡酒差异挥发性风味物质聚类分析热图
Fig.5 Heat map of cluster analysis of differential volatile flavor components of Baijiu and Palinka

2.4 机器学习模型

随机森林算法在食品特征分类中表现出优异的性能和稳定性[34]。与传统的线性分类方法相比,随机森林能够更好地处理高维数据集中的非线性关系,并具有较强的抗过拟合能力[35]。本研究旨在构建基于随机森林算法的白酒与帕林卡酒分类模型,通过系统的数据挖掘策略揭示两类传统蒸馏酒的差异特征,经处理后将数据集总共分为两个类别(帕林卡酒为0类,白酒为1类)。数据集包含12个样本和91个特征,其中90个特征为float64类型,1个特征为object类型。然后进行缺失值分析,大部分特征存在缺失值,缺失值比例从10到11个不等。然而某些特征如“原甲酸三乙酯”的缺失值较少,这可能对后续的数据清洗和特征提取产生影响。因此为识别高度相关的特征,绘制特征相关性热图见图6。由图6可知所有特征的分布情况,并识别了潜在的异常值和分类高度相关的特征原甲酸三乙酯等,这些分析为后续的数据预处理和特征提取提供了重要依据。

图6 白酒和帕林卡酒分类特征相关性热图
Fig.6 Heat maps of classification characteristics correlation of Baijiu and Palinka

为了评估模型的分类性能,计算精确率、召回率和F1分数等指标,结果见表4。由表4可知模型的分类准确率达到100%,各类别的精确率和召回率均为1.00。这表明模型对数据集有很好的分类效果,且分类非常准确。

表4 白酒和帕林卡酒分类性能评估
Table 4 Classification performance evaluation of Baijiu and Palinka

精确率 召回率 F1值 样本数0 1 1.00 1.00 1.00 1.00准确率宏平均加权平均1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1 2 3 3 3

由图7可知,“原甲酸三乙酯”被识别为分类白酒和帕林卡酒的最重要特征,其余特征按分类重要性顺序分别为(+)-柠檬烯、1.2.3.4-四氢-1.1.6-三甲基萘、甲基叔戊醚、1.1-二乙氧基-3-甲基丁烷、2-甲基丁酸乙酯、己酸异丁酯、苯甲酰肼、7.8-脱氢-8a-羟基异龙脑烯、戊酸-1-甲基丙酯,其对模型的分类性能产生了显著影响。这表明这些特征在区分不同类别时起到了关键作用,可能与数据的内在结构和特征间的关系密切。随机森林模型识别出原甲酸三乙酯是区分白酒和帕林卡酒最具判别力的标志性化合物。这与KOBAJIEBA M A等[36]的研究结果相吻合。而帕林卡酒由于采用水果发酵,其代谢途径显著不同,因此检出该化合物较少。

图7 白酒和帕林卡酒分类特征重要性
Fig.7 Importance of classification characteristics of Baijiu and Palinka

本实验通过RF对数据集进行分类,并取得理想的分类效果。分类准确率达到100%,且各类别的精确率和召回率均为1.00。这表明模型对数据集有很好的适应性,能够准确识别不同类别的样本。此外,特征重要性分析揭示了关键特征对模型分类性能的影响,为后续的模型优化和特征选择提供了重要依据。

3 结论

本研究采用HS-SPME-GC-MS技术结合多变量统计分析和机器学习方法,系统解析了中国白酒和匈牙利帕林卡酒的风味特征差异。基于HS-SPME-GC-MS共鉴定出80种挥发性风味化合物。其中帕林卡酒以萜烯类和醚类为主,呈现出典型果香特征,白酒则以酯类和醇类为主,赋予其层次丰富的复合香气。采用OPLS-DA分析进一步筛选出25种差异显著的特征性挥发性风味物质。构建的随机森林分类模型表现出优异性能(准确率、精确率和召回率均为1.00),成功识别出原甲酸三乙酯、(+)-柠檬烯等关键特征变量,对帕林卡酒与白酒的分类具有显著判别力。

本研究系统揭示中国白酒和匈牙利帕林卡酒在风味物质组成上的差异特征,为传统蒸馏酒的品质提升和工艺创新提供了新思路。

参考文献

[1]QIAO L,WANG J,WANG R,et al.A review on flavor of Baijiu and other world-renowned distilled liquors[J].Food Chem X,2023,20:100870.

[2]LIU H L, SUN B G.Effect of fermentation processing on the flavor of Baijiu[J].J Agr Food Chem,2018,66(22):5425-5432.

[3]PHAM T M,VARJU R,BUJNA E,et al.Chemical and volatile composition of Palinka produced using different commercial yeast strains of Saccharomyces cerevisiae[J].Int J Food Microbiol,2022,381:109891.

[4]PHAM T M,SUN W,BUJNA E,et al.Optimization of fermentation conditions for production of Hungarian sour cherry spirit using response surface methodology[J].Fermentation Basel,2021,7(4):209.

[5]HARCSA I M,NÁBRÁDI A,TAR I.Hungarian spirits pálinka as a"Hungaricum"I.literature review and practical approaches[J].Appl Stud Agribus Com,2014,8(2-3):133-141.

[6]WU J H,CHEN R Y,LI X B,et al.Comprehensive identification of key compounds in different quality grades of soy sauce-aroma type Baijiu by HS-SPME-GC-MS coupled with electronic nose[J].Front Nutr, 2023,10:1132527.

[7]MIAO Y J,HU G W,SUN X L,et al.Comparing the volatile and soluble profiles of fermented and integrated Chinese bayberry wine with HS-SPME GC-MS and UHPLC Q-TOF[J].Foods,2023,12(7):1546.

[8]苏礼君,李健,孔建磊,等.机器学习技术在食品风味分析中的研究进展[J].食品工业科技,2024,45(18):19-30,274.

[9]陈靓,阳佳红,田星.机器学习在食品风味领域的研究进展与未来趋势[J].食品科学,2024,45(10):28-37.

[10]蔡尉彤,冯涛,宋诗清,等.机器学习在预测食品风味中的研究进展[J].食品科学,2024,45(12):11-21.

[11]SHAGUN D.Wine quality prediction using machine learning[J].Int J Res Appl Sci Eng Technol,2024,12(1):572-576.

[12]WANG Y T,YANG Z X,PIAO Z H,et al.Prediction of flavor and retention index for compounds in beer depending on molecular structure using a machine learning method[J].RSC Adv, 2021, 11(58): 36942-36950.

[13]杨雪,史早,周姝芯,等.重庆市不同产地五倍子蜂蜜挥发性成分差异分析[J].食品与发酵工业,2025,51(8):249-258.

[14]于立娟,田红云,单群,等.基于不同前处理方法结合全二维气相色谱飞行时间质谱解析红星二锅头白酒的风味成分[J].食品与发酵工业,2025,51(8):332-340.

[15]ALIY A,LIU S,ZHANG D,et al.Research on the evaluation of Baijiu flavor quality based on intelligent sensory technology combined with machine learning[J].Chemosensors,2024,12(7):125.

[16]MARÍA G C,MANUEL J V M,DOMINICO A G S,et al.A study on the influence of the use of sulphur dioxide, the distillation system and the aging conditions on the final sensory characteristics of brandy[J].Foods,2022,11(21):3540.

[17]WU J F,TANG Q Y,JIN S W,et al.Baijiu-making equipment[M].Singapore:Springer Nature Singapore,2023:67-119.

[18]INDRALOKA A B,ISTANTI A,UTAMI S W.The physical and chemical characteristics of eco-enzyme fermentation liquids from several compositions of local fruits and vegetables in banyuwangi[J].IOP Conference Series: Earth and Environmental Science,2023,1168(1):012018.

[19]GUO Y,ULLAH N,BAI J,et al.Rapid detection of acids and esters in Chinese liquor by fourier transform infrared spectroscopy with difference spectroscopy[J].Food Anal Meth,2024,17(9):1373-1382.

[20]赵晴,王明月,唐平,等.酱香型白酒酿造过程中的萜烯类化合物及溯源分析[J].食品与发酵工业,2025,51(8):249-258.

[21]田露琴.四大基础香型白酒中酯类和萜烯类手性化合物的研究[D].贵阳:贵州大学,2023.

[22]LIU Y,WEN H,KONG J,et al.Flavor characterization of Citri reticulatae Pericarpium (Citrus reticulata 'Chachiensis') with different aging years via sensory and metabolomic approaches[J].Food Chem, 2024,443:138616.

[23]TRABERT A,BUNZEL M.Influence of thermo mechanical treatment on cell wall composition and low molecular weight ingredients of fruit and vegetable-based side streams[J].Lebensmittelchemie, 2023, 77(S2):80-82.

[24]MILELLA R A, PISANI R, MASTROFRANCESCO L, et al.Phenolic characterization and antioxidant capacity of ten autochthonous vines grown in southern Italy/Caratterizzazione fenolica e potere antiossidante di dieci vitigni autoctoni allevati nel Sud Italia[C].BIO Web of Conferences,2016,7:01019.

[25]JIANG S, WU W L, ZHANG Y C, et al.Comprehensive analysis of carotenoids constituents in purple-coloured leaves and carotenoid-derived aroma differences after processing into green,black,and white tea[J].LWT-Food Sci Technol,2023,173:114286.

[26]SCHULTES F P J,HAARMANN M,TISCHLER D,et al.Primary alcohols as substrates or products in whole-cell biocatalysis:toxicity for Escherichia coli expression strains[J].Mol Catal,2023,538:112979.

[27]王生艳,孙亮霞,赵新民,等.中高温大曲发酵过程中曲皮、曲心微生物群落的差异性和变化规律[J].中国酿造,2024,43(11):92-98.

[28]马雪莲,王鹏,耿敬章,等.感官评价联合GC-MS与OPLS-DA解析加热温度对椒麻鸡赋味汤料呈香品质影响规律[J].食品科学,2024,45(17):127-134.

[29]ZHENG X T,ZENG X Y,LIN X L,et al.Exploring aromatic components differences and composition regularity of 5 kinds of these 4 aroma types Phoenix Dancong tea based on GC-MS[J].Sci Rep,2024,14(1):2727.

[30]胡春红,胡铂沅,林良才,等.酿造区域气候对酱香型白酒风味的影响[J].食品与发酵工业,2025,51(11):98-106.

[31]乔华.白酒陈化机理的研究及应用[D].太原:山西大学,2013.

[32]辛姝涵,靳光远,徐岩.大曲清香型白酒固态发酵scale-down体系的构建[J/OL].食品与发酵工业,1-11[2025-07-08].https://doi.org/10.13995/j.cnki.11-1802/ts.041629.

[33]甘广东,朱超,杨勇,等.复合微生物菌群在白酒酿造副产物中的应用[J].酿酒科技,2013(1):77-81.

[34]马赫迪,薛康,胡江涛,等.3个年份浓香型白酒挥发性成分分析及指纹图谱的建立[J].中国食品学报,2024,24(9):420-433.

[35]黄叶群,周晗林,童秀平,等.机器学习算法在预测茉莉花茶风味品质中的应用[J].粮油食品科技,2024,32(5):142-150.

[36]KOVALEVA M A, KOVALEV A I, KHOTINA I A.Alternative pathways of the reaction between acetophenone and triethyl orthoformate[J].Russ Chem Bull,2023,72(5):1186-1191.

Difference of volatile flavor components of typical distilled spirits from China and Hungaria based on flavor omics and machine learning model

XIONG Haoyu1,2,SUO Huayi1,3,YI Zhiqiang1,4,5,DU Muying1,4,5,XIA Yangyi1,5*
(1.College of Food Sciences,Southwest University,Chongqing 400715,China;2.Westa College,Southwest University,Chongqing 400715,China;3.National Experimental Teaching Demonstration Center for Food Science and Engineering,Southwest University,Chongqing 400715,China;4.Chinese-Hungarian Cooperative Research Centre for Food Science,Chongqing 400715,China;5.Southwest University Chongqing Key Laboratory of Speciality Food Co-Built by Sichuan and Chongqing,Chongqing 400715,China)

Abstract:In this study,the volatile flavor components of different types of Baijiu and Palinka(from Hungaria)with different flavors were analyzed using headspace solid-phase microextraction-gas chromatography-mass spectrometry(HS-SPME-GC-MS).Combining multivariate statistical methods and machine learning models,the characteristic flavor components of two distilled spirits were systematically analyzed.The model was constructed using orthogonal partial least squares discriminant analysis(OPLS-DA),and differential flavor substances were screened using variance analysis and variable important in projection(VIP)values.The results showed that a total of 80 volatile flavor substances were identified in the 2 types of distilled spirits,including 2 alcohols,7 ethers,3 acids,11 terpenes,10 ketones,17 esters,and 30 others.Combining variance analysis and VIP values,a total of 25 differential flavor substances(VIP>1,P<0.05)were screened out.Among them,terpenes and ethers were the main differential characteristic components of Palinka,while esters and alcohols were the main differential substances of Baijiu.The classification model based on the random forest algorithm indicated that triethyl orthoformate and(+)-limonene and other substances were the key components for distinguishing the 2 types of distilled spirits.The research results provided a scientific basis for revealing the influence of different fermentation raw materials and processes on the flavor formation of distilled spirits.

Key words:Baijiu;Palinka;volatile flavor component;difference analysis;flavor omics;machine learning model

中图分类号TS262

文章编号:0254-5071(2025)08-0135-10

doi: 10.11882/j.issn.0254-5071.2025.08.021

引文格式熊浩宇,索化夷,易志强,等.基于风味组学和机器学习模型的中匈特色蒸馏酒挥发性风味物质差异研究[J].中国酿造,2025,44(8):135-144.

收稿日期2025-04-11

修回日期:2025-05-29

基金项目西南大学大学生创新训练计划项目(X202410635530);重庆市技术创新与应用发展专项重点项目(CSTB2023TIAD-KPX0032)

作者简介熊浩宇(2005-),女,本科生,研究方向为食品风味化学、食品质量与安全。

*通讯作者夏杨毅(1970-),男,副教授,博士,研究方向为食品风味化学、现代食品加工技术。