基于聚类分析实现高温大曲发酵过程品温的精准预测

姚翠萍1,2,李玉萍3,伍中玉1,朱楚天4,朱治宇1,程艳波1,2,焦 富1,2,龚佳欣4,贾文生3,牟明月1,2*,黄永光4

(1.贵州茅台酒股份有限公司,贵州 遵义564500;2.贵州省白酒制造创新研究院,贵州 遵义5645003;3.贵州大学 数学与统计学院,贵州 贵阳550025;4.贵州大学 酿酒与食品工程学院,贵州 贵阳550025)

摘 要:为了科学地评价和预测发酵曲仓整仓大曲的发酵温度变化趋势,该研究选择了春、夏、秋、冬四个季节中具有代表性的制曲轮次(对应第一、三、四、五轮次),对两个代表性制曲车间发酵曲仓的1 300余块大曲的发酵温度变化进行全面跟踪采集、数据分析研究。采用聚类分析(CA)和主成分分析(PCA),建立了发酵曲仓整仓大曲制曲品温的发酵温度预测模型。为了进一步验证预测模型的可靠性,选择了另一个制曲发酵车间8个监测区域的曲块温度数据,随机配对并输入模型开展再次验证。结果表明,第一次翻曲阶段模型预测温度与实际温度的总误差<1.2 ℃,第二次翻曲阶段温度的总误差<1.1 ℃。预测模型在四个季节制曲温度变化数据的测试中平均准确率>95%,与曲堆整体的实际温度并无显著性差异。该预测模型为有效评价大曲发酵整仓曲块温度变化提供了科学方法,对高温大曲的发酵质量评价具有重要意义。

关键词:白酒;高温大曲;主成分分析;聚类分析;预测建模;温度监测

中图分类号:TS262.3

文章编号:0254-5071(2025)03-0121-08

doi: 10.11882/j.issn.0254-5071.2025.03.019

引文格式:姚翠萍,李玉萍,伍中玉,等.基于聚类分析实现高温大曲发酵过程品温的精准预测[J].中国酿造,2025,44(3):121-128.

收稿日期:2024-11-20 修回日期:2025-02-11

基金项目:贵州省科技支撑计划(一般项目)(黔科合支撑[2022]一般022);国家自然科学基金项目(32360571,32472319);贵州省科技项目(ZK[2022]047);贵州省信息产业厅项目(黔资发[2020]198号)

作者简介:姚翠萍(1983-)女,高级工程师,本科,研究方向为酿酒微生物。

*通讯作者:牟明月(1981-),男,高级工程师,硕士,研究方向为白酒酿造。

Accurately predict product temperature during high-temperature Daqu fermentation process based on mathematical modelling

YAO Cuiping1,2,LI Yuping3,WU Zhongyu1,ZHU Chutian4,ZHU Zhiyu1,CHENG Yanbo1,2,JIAO Fu1,2,GONG Jiaxin4,JIA Wensheng3,MOU Mingyue1,2*,HUANG Yongguang4
(1.Kweichow Moutai Co.,Ltd.,Zunyi 564500,China;2.Baijiu Manufacturing Innovation Institute of Guizhou Province,Zunyi 564500,China;3.School of Mathematics and Statistics,Guiyang 550025,China;4.School of Brewing and Food Engineering,Guiyang 550025,China)

Abstract:In order to scientifically evaluate and predict the fermentation temperature change trend of Daqu, using the representative Daqu-making rounds(the first,third,fourth and fifth rounds)in spring,summer,autumn and winter as research materials,comprehensively tracked and collected the fermentation temperature changes of 1 300 pieces of Daqu in two representative fermentation workshops.The fermentation temperature prediction model for the temperature of Daqu products in the whole workshop was established by principal component analysis(PCA)and cluster analysis(CA).To further verify the reliability of the prediction model,the temperature data of eight monitoring areas in another Daqu fermentation workshop were randomly paired and fed into the model for further verification.The results showed that the total temperature error of the predicted temperature and actual temperature of the first turning stage was less than 1.2 ℃,and the total temperature error of the second turning stage was less than 1.1 ℃.The average accuracy of the prediction model of Daqu-making temperature change data in four seasons was more than 95%, and there was no significant difference with the actual model in the test.The prediction model provided a scientific method for effective temperature evaluation of the whole pile,and also provided a scientific basis for temperature control of Daqu fermentation and its intelligent development.

Key words:Baijiu;high-temperature Daqu;principal component analysis;cluster analysis;predictive modeling;temperature monitoring

白酒是世界著名的蒸馏酒,其风味来源于独特的酿造工艺和微生物群落[1]。优质白酒酿造过程均采用大曲作为糖化发酵剂[2],大曲在40 d仓内发酵过程富集了丰富的酿造功能微生物,进而促进制曲、制酒原料的分解以及风味物质的生物合成[3]。在此过程,曲块发酵温度对大曲微生物菌群的富集、演替影响非常大[4]。高温发酵工艺(曲块温度>60 ℃)能够促使大曲筛选并富集大量耐高温细菌[5];而低温发酵工艺(曲块温度<50 ℃)会促进产酸菌和酿酒酵母的富集[6]。富集于曲块中的特征性微生物菌群将在后续的酿造过程中影响白酒的风味类型[7],因此,大曲发酵温度监测及其调控是保证大曲、白酒质量的关键和前提。

大曲在进入曲仓开始发酵后,其温度会快速升高[8]。为了调控曲块的温度和水分,防止原料中的淀粉被过度消耗,在曲块发酵至一定温度后(曲块温度>60 ℃),需将大曲进行翻曲(这样的翻曲要经过2次),重新堆积发酵。在此过程中大曲的温度会降低,而微生物菌群的演替也随之受到调节[9]。ZHU C等[10]研究表明,两次翻曲均能很好促进风味代谢功能微生物在大曲中的富集,如芽孢杆菌(Bacillus)和高温放线菌属(Thermoactinomyce)等菌群,同时大曲的酯化力通过翻曲也有所提升。两次翻曲被普遍视为酱香型白酒高温大曲制曲发酵过程中的关键工艺环节[11],在合适的温度节点实施翻曲操作对大曲的质量有重要影响,也是提高大曲质量的重要调控工艺。因此,对发酵仓中大曲的整体温度进行科学监测、评估,对制曲生产显得尤为重要。在实际生产过程,每间发酵仓内堆放有1 300多块大曲,不同的空间分布导致每块曲的发酵温度都存在一定差异[12],曲堆表面和中心位置曲块的发酵温度甚至会存在10 ℃以上的差异。目前,行业内普遍采取的整仓温度评价方式,在曲堆的门边、中间、窗边位置随机取8~32块大曲并在测量发酵温度后取平均值[13]。由于该方法未考虑不同温度大曲的实际分布规律,且没有固定的采样点位,导致每次检测的温度数据随机性大并存在较大误差,不能满足精准评估曲堆整体发酵温度的需求,该方法仍然是经验式传统方法。此外,选择单纯增加采样量以提高精准度将导致采样和检测的成本大大增加。据此,行业内迫切需要创新温度监测及其评价方式,进而实现整仓大曲发酵温度的有效监测。

本研究提出了一种基于聚类分析(clustering analysis,CA)的数学模型,用于对大曲制曲过程关键工艺控制点的整仓发酵温度进行采集及其精准评价。首先,对不同制曲轮次关键工艺控制点的整仓曲块温度进行跟踪检测,在对温度数据进行标准化预处理后,选择K-Means聚类算法并使用轮廓分析(silhouette analysis,SA)确定合适的聚类数目,构建算法数据构建预测模型;随后,选择不同制曲车间曲仓监测位点温度变化开展模型验证,最后确定模型及其推进示范应用。本研究提出了发酵仓中大曲整仓曲块温度的科学评价方法,对高温大曲的发酵质量评价具有重要意义。

1 材料与方法

1.1 材料与试剂

1.1.1 材料

酱香型大曲:贵州省遵义市仁怀市茅台镇。

1.2 仪器与设备

拓尔为数字温度计:深圳市拓尔为电子科技有限公司。

1.3 方法

1.3.1 取样及数据采集

大曲发酵温度数据采集时间持续2023年全年,采集过程随机选取两间发酵曲仓,在能够代表春、夏、秋、冬四个季节的制曲轮次(对应第一、三、四、五轮次)的两个关键工艺控制点(第一次翻曲、第二次翻曲)采集曲块温度数据。具体采样过程如下:在每个轮次的第一次翻曲和第二次翻曲时间测量发酵仓中每一块大曲的发酵温度。在测量大曲温度的同时对该曲块的初始位置进行记录(例如,一块大曲位于第一条梗子第二层的第三块位置,即被记为1-2:3,以此类推实施其他曲块温度采集及其位置标定)。随机挑选不同季节代表轮次的一个曲仓数据用于建模,另一个曲仓的数据进行验证。

1.3.2 大曲温度测定

按照文献[10]中的方法测定大曲的温度,将温度计插入曲样正中心位置,待读数稳定后采集大曲发酵温度数据并记录。

1.3.3 数据标准化

数据的标准化(normalization)是将数据按比例缩放,去除数据的单位限制并将其转化为无量纲的纯数值,以便于对不同单位或量级的指标进行比较和加权的方法[14]。本研究采用的标准化函数为其中sj分别为X的第j列的均值和标准差。

1.3.4 主成分分析和聚类分析

主成分分析(principal component analysis,PCA)能够考察多个变量间的相关性[15],可帮助找出导致温度变化的主要因素,并识别出关键的大曲取样位点及其温度主要分布。对大曲温度进行标准化处理后,根据标准化数据矩阵建立协方差矩阵。应用PCA确定导致大曲发酵温度变化的“主成分”,求出特征值、主成分方差贡献率和累计方差贡献率。随后分析每个主成分,并了解它们在温度变化中的具体作用。通过分析主成分的权重矩阵[16],确定哪些变量(即温度取位点)对主成分的贡献率。

聚类分析(CA)是一种无监督的机器学习方法,能够将相似度较高的数据点进行分类成组分析[14]。在发酵仓整仓的背景下,聚类分析可用来描述不同区域大曲温度分布模式,从而对发酵仓在关键工艺控制点的温度状况进行精确的分析与评估[17]。选择K-Means聚类算法处理整仓大曲的曲块位置、发酵温度数据,并使用轮廓分析(SA)来确定合适的聚类组数目[18]。随后,将不同数据分配到待定的群组中,评估数据群组内部的数据点的差异性,在每个簇中识别出中心点或平均点。最后,选择群组中心或距离其他点的平均距离最小的曲块位置,确保其能代表曲堆中主要的温度分布区域及其数据范围,以此作为关键监测位点。

1.3.5 数据处理与统计分析

使用SPSS 23.0软件对温度数据进行标准化处理,将其转化为无量纲的纯数值。R 4.0.3软件被用于进行相关性系数计算和主成分分析(PCA),其中,“Hmisc”包被用于分析温度数据之间的皮尔逊(Pearson)相关性,“FactoMineR”和“factoextra”包被用于标准化数据的主成分分析。Matlab R2023a被用于聚类分析。

2 结果与分析

2.1 翻曲数据主成分分析及其矩阵结果

设估计样本数为n,选取p种不同曲块温度,则由估计样本的原始数据可得矩阵X=(xijn×p,其中xij表示第i层的第j个曲块温度指标数据,使用KMO(Kaiser-Meyer-Olkin)和巴特利特检验(Bartlett)[19],并根据Kaiser给出的度量标准判断该数据是否适合做主成分分析[20]。采集一翻大曲温度数据进行KMO及巴特利特检验,结果见表1。

表1 基于一翻大曲温度数据的KMO和巴特利特检验结果
Table 1 KMO and Bartlett's test results based on Daqu temperature data at the first turning stage

KMO和巴特利特检验KMO值巴特利特球形度检验近似卡方自由度显著性0.778 1 406.958 276 0.000

由表1可知,巴特利特球形检验的统计量值为1 406.958,相应的概率P<0.05,故可认为相关系数矩阵与单位矩阵存在显著差异[21]。由于KMO 检验衡量的是变量间的简单相关系数与偏相关系数的相对大小,而KMO值越接近1表示变量间的相关性越强,数据越适合进行主成分分析。该研究中KMO值为0.778(>0.6)。根据Kaiser给出的度量标准可知本研究采集的大曲温度数据项适合做主成分分析[22]

为了消除各项温度指标数据之间在量纲和数量级上的差别,对指标数据进行标准化处理,得到标准化矩阵,根据标准化数据矩阵建立协方差矩阵R。根据协方差矩阵R求出特征值、主成分方差贡献率和累计方差贡献率,确定主成分个数。特征值是各主成分的方差,它的大小反映了各个主成分的影响力[23]。在数据处理中进行了特征提取,将具体位置的数据汇总到更高层级的堆积层中(如6-1 表示某层的整体特征),这样可以更有效地捕捉曲房大曲温度的主要变化趋势。因此,按照层级进行数据归纳并提取公因子方差及其提取值,结果见表2。

表2 不同堆积位置大曲的公因子方差及其提取值分析
Table 2 Common factor variance of Daqu at different locations and its extracted values

注:提取值表示每个变量被公因子表达的多少,>0.7说明变量被公因子很好地表达。

样品6-4(顶层)6-3 6-2 6-1(底层)5-4(顶层)5-3 5-2 5-1(底层)4-4(顶层)4-3 4-2 4-1(底层)3-4(顶层)3-3 3-2 3-1(底层)2-4(顶层)2-3 2-2 2-1(底层)1-4(顶层)1-3 1-2 1-1(底层)公因子方差初始值 提取值1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.787 0.867 0.890 0.892 0.752 0.936 0.925 0.823 0.774 0.931 0.940 0.838 0.757 0.908 0.954 0.718 0.629 0.843 0.846 0.932 0.782 0.821 0.672 0.737

表2中的公因子方差提取值反映了公因子对原始变量的解释能力,即公因子能够在多大程度上代表原始变量的信息。提取值越高,说明公因子对原始变量的代表性越好,累计贡献率越高,整体分析效果越好。提取值>0.7通常被认为公因子对原始变量的代表性较好。由表2可知,除1-2位置的大曲外,曲堆内部其他梗、层数据的公因子提取值均大于0.7,这表明这些公因子对原始变量的代表性较好。通过分析这些提取值,可以确定哪些公因子对原始变量的解释能力较强,从而更好地理解数据的内在结构。

通过建立初始因子载荷矩阵,解释主成分。因子载荷是主成分Zi与原始指标Xi的相关系数RZiXi),揭示了各个成分与各温度指标间的相关程度。第一次、第二次翻曲不同位置大曲的主要因子载荷矩阵分别见表3和表4。

表3 第一次翻曲不同位置大曲的因子载荷矩阵
Table 3 Factor loading matrix of Daqu at different locations of the first turning stage

?

表4 第二次翻曲不同位置大曲的因子载荷矩阵
Table 4 Factor loading matrix of Daqu at different locations of the second turning stage

成分初始特征值总计 方差贡献率/%提取载荷平方和总计 方差贡献率/%累积方差贡献率/% 累积方差贡献率/%旋转载荷平方和总计 方差贡献率/% 累计方差贡献率/%1234 3 905.311 185.257 75.340 46.129 87.048 4.129 1.679 1.028 87.048 91.178 92.857 93.885 3 905.311 185.257 75.340 46.129 87.048 4.129 1.679 1.028 87.048 91.178 92.857 93.885 180.457 93.207 83.606 3 854.766 4.022 2.078 1.864 85.922 4.022 6.100 7.963 93.885

由表3可知,基于特征值>1,提取4个因子后,4个因子共同解释了变量总方差的83.147%。由此得其分析的效果比较理想,具有研究意义。由表4可知,第二次翻曲节点的大曲温度数据分析过程与一翻大曲的分析过程相同。基于特征值大于1,提取4个因子后,4个因子共同解释了变量总方差的93.885%。由此认为分析的效果比较理想,同样具有研究意义。

2.2 温度皮尔逊相关性分析结果

皮尔逊相关系数被用于度量不同位置大曲温度之间的相关性,其值介于[-1,1]之间,P<0.05,说明有线性相关关系[24];而Pearson相关性系数>0.8,表示高度相关,Pearson相关性系数0.5~0.8,表示中度相关,Pearson相关性系数0.3~0.5,低度相关,Pearson相关性系数<0.3,表示不相关。具体的Pearson相关性系数计算结果见图1。

图1 不同位置大曲温度之间的Pearson相关性热图
Fig.1 Pearson correlation heatmap of temperature between different positions of Daqu

“*”表明相关性显著(P<0.05)。“**”表明相关性极显著(P<0.01)。

由图1可知,多个不同区域大曲的温度之间存在显著相关(P<0.05)甚至极显著相关(P<0.01)。该现象表明不同大曲块并非各自独立发酵,大曲堆内部是一个存在有机联系的整体,不同曲块间通过直接或者间接接触过程中交换热量并实现发酵温度的互相影响。处于曲堆内部区域的大曲(如4-2和5-2)之间通常存在极显著强相关(P<0.01),这表明曲堆内部的大曲的发酵温度相互影响较强;还有部分区域的大曲发酵温度之间呈极显著负相关(如1-3和6-1)(P<0.01)。曲堆内部的空间异质性增加了整体温度评估的复杂性,因此需要对相似发酵温度的区域进行聚类,以此确保温度评估模型的准确性。

2.3 温度数据聚类分析

根据前文计算的皮尔逊相关系数,得到相似矩阵。随后进行聚类迭代,预先指定初始聚类数以及初始聚类中心,按照样本之间的Pearson相关系数大小,把样本集划分为8个簇,根据数据对象与聚类中心之间的相似度,不断更新聚类中心的位置,不断降低聚类簇的误差平方和(sum of squared error,SSE),当SSE不再变化或目标函数收敛时,聚类结束,得到最终聚类结果[25]。根据对大曲一翻、二翻温度数据的聚类分析与迭代过程得到8个初始聚类中心。为保证聚类中心准确性,本研究对初始聚类中心进行继续迭代。通过计算第一次迭代后类中心的偏移量,当偏移量等于输入的“收敛性标准”中的0时,即停止聚类分析[26]。大曲温度分析迭代历史记录见表5。

表5 大曲温度分析迭代历史记录
Table 5 Iteration history records of Daqu temperature

注:由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛;任何中心的最大绝对坐标变动为0.000;当前迭代为5;初始中心之间的最小距离为21.345。

迭代聚类中心的变动1 2 3 4 5 6 7 8 12345 0.000 0.000 0.000 0.000 0.000 8.819 0.000 0.000 0.000 0.000 8.383 0.000 3.608 0.000 0.000 15.800 0.000 0.000 0.000 0.000 10.024 1.671 2.538 1.404 0.000 11.453 0.000 0.000 0.000 0.000 8.370 0.587 0.691 1.017 0.000 10.248 0.000 0.000 0.000 0.000

由表5可知,8个聚类点是预先指定的聚类数(8个簇)在迭代优化后的最终中心位置,由单因素方差分析可知,最终得到的8个群组间存在显著差异,表明这8个群组在曲堆内所对应区域的大曲温度也存在差异。选择这8个区域的大曲进行采样并测量温度,可以更加科学地评估整个大曲堆的温度。

在对8个聚类中心进行5次迭代后,最终的大曲堆内部温度数据聚类结果见图2。相较于初始聚类中心,迭代后的聚类中心发生了不同程度的改变。如聚类中心B在2-1位置所聚类大曲的温度略有增加。但总的来说,迭代后的8个聚类中心与初始聚类中心差异较小,这表明通过分析所得的8个聚类中心的准确性和可信度较高。

图2 不同堆积层大曲的最终聚类中心
Fig.2 Final clustering centers for different layers of Daqu

热图纵坐标中类似1-2的编码表示第一梗子的第二层。A~H 代表8 个不同的聚类中心。a-f代表6个堆积层。下同。

图3展示了不同聚类中心所聚类大曲的温度范围,A聚类中心在曲堆中所聚类的大曲温度在38.3~55.4 ℃之间,该聚类大曲温度中位数为50.3 ℃;B聚类中心的大曲温度在40.4~58.5 ℃之间,温度中位数为51.8 ℃;C聚类中心的大曲温度在41.1~58.0 ℃,温度中位数为46.8℃;D聚类中心的大曲温度在42.4~58.5 ℃,温度中位数为44.7 ℃;E聚类中心的大曲温度在38.8~61.6 ℃,温度中位数为58.4 ℃;F聚类中心的大曲温度在43.9~61.2 ℃,温度中位数为53.3 ℃;G聚类中心的大曲温度在40.1~63.2 ℃,温度中位数为61.2 ℃;H聚类中心的大曲温度在41.6~61.6 ℃,温度中位数为59.0 ℃。8个聚类中心总体上包含了曲堆在两次翻曲阶段中不同温度范围的大曲。

图3 大曲在同一层次不同水平位置的聚类分析箱型图
Fig.3 Cluster analysis boxplots of Daqu at different locations at the same level

2.4 预测模型温度监测取样点确定

使用聚类分析计算不同层和不同块中的聚类中心值,确定了大曲发酵过程中具有代表性的温度取位点,不同聚类中心均对应不同温度取位点。基于8个监测取样点数据计算的二次翻曲曲房曲温分布见图4。由图4可知,经与曲堆曲块实际温度分度情况对比分析,8个温度监测点基本涵盖了大曲在整仓发酵过程中不同的温度区间,能科学代表整个曲房中的大曲温度的变化,由此确定该温度取样点的选择是科学且合理的。

图4 基于8个监测取样点数据计算的曲房曲温分布
Fig.4 Temperature distribution of the fermentation room calculated based on data from 8 monitoring sampling sites

a.第一次翻曲阶段曲房曲温分布图;b.第二次翻曲阶段曲房曲温分布图。

经过前述数据及其方程模型分析,获得第一次翻曲期间工艺控制点采集大曲的温度监测取样位点分别为:①6-4:1,1-1:1;②2-4:1,2,3;③1-4:16,24,25;④1-2:4,5,6,7,6-1:4,5,6,7;⑤5-4:32,33,34,35,36;⑥1-3:10,11,12,13,14,15;⑦2-3:17,18,19,20,32,4-2:17,18,19,20,32;⑧3-1:8,9,26,27,28,6-3:8,9,26,27,28。

经过前述数据及其方程模型分析,获得第二次翻曲期间工艺控制点采集大曲温度监测取样位点分别为:①1-1:1,2-1:1;②6-1:2,6-2:2;③3-1:29,30;④1-4:4,14,2-3:4,14;⑤1-5:22,26,27,28;⑥3-5:10,11,16,21;⑦6-3:6,7,8,9,17,20,23,24,25;⑧2-4:3,12,4-2:13,18,19,5-4:12,13。

结果表明,当需要通过采集大曲温度数据评价整仓温度时,按照相应坐标(梗、层、块)在8个区域任取一块大曲即可。

2.5 整仓温度模型构建及检验

根据不同季节代表性轮次制曲大曲在关键工艺控制点的曲块温度数据求加权平均值,可求得大曲在该阶段的整仓温度见图5。由图5可知,在一翻阶段,各轮次的温度范围集中在50~60 ℃。其中,三轮次的平均温度为53 ℃;四轮次的平均温度为58 ℃;五轮次的平均温度为58 ℃。整体呈现随轮次增加,温度逐渐升高的趋势。在二翻阶段,温度分布与一翻阶段相似,但范围更为集中。三轮次的平均温度为45 ℃;四轮次的平均温度为50 ℃;五轮次的平均温度为51 ℃,而二翻阶段的整体温度较一翻阶段降低了约3~5 ℃。轮次间的差异显著。

图5 不同季节轮次制曲大曲的整仓曲块温度
Fig.5 Temperature of the whole warehouse of different round Daqu in different seasons

基于整仓曲块温度以及8个监测取样位点曲块的温度,使用多元回归分析得出一翻和二翻阶段的整仓大曲发酵温度预测模型,具体如下:

一翻阶段整仓大曲发酵温度预测模型为:

其中,x1x8分别代表8个取样点大曲的核心温度,Y则代表由预测模型计算所得的整仓大曲温度。为验证该模型的准确性,研究过程使用未参与建模的另一制曲车间曲仓春夏秋冬四个制曲轮次整仓大曲的一翻数据引入模型,随机配对8个取样点的温度并代入模型进行验证,结果见图6。由图6可知,基于预测模型计算所得的一翻整仓大曲温度的平均温度为56.15 ℃,基于原始数据得出的整仓大曲温度的平均温度为56.18 ℃,平均误差为0.03 ℃。采样点大曲温度数据随机配对计算所得的单仓温度与实际单仓温度整体预测误差可控制在1.2 ℃(准确度>95%),证明所建预测模型具有较强的准确性。

图6 一翻阶段全仓曲块温度预测模型验证结果
Fig.6 Validation results of temperature prediction model of the Qu in the whole warehouse of the first turning stage

二翻阶段整仓大曲发酵温度预测模型为:

与一翻阶段类似,研究过程同样使用未参与建模的另一间制曲车间曲仓春夏秋冬四个轮次的整仓大曲二翻温度数据引入模型,随机配对8个取样点的温度并代入模型进行验证,结果见图7。由图7可知,基于预测模型计算所得的二翻整仓大曲温度的平均温度为48.18 ℃,基于原始数据得出的整仓大曲温度的平均温度为48.19 ℃,平均误差为0.01 ℃。采样点大曲数据随机配对计算所得的单仓大曲温度与实际单仓大曲温度整体预测误差可控制在1.1 ℃(准确度>95%),证明所建预测模型具有很好的准确性。

图7 二翻阶段全仓大曲温度预测模型验证结果
Fig.7 Validation results of temperature prediction model of the Qu in the whole warehouse of the second turning stage

3 结论

基于采集不同制曲曲房的四个轮次、两个关键工艺控制点的1 300余块大曲的发酵温度数据,本研究对整仓大曲的曲块温度进行分析和预测建模。研究过程使用主成分分析识别出导致大曲发酵温度变化的主要因素,并通过聚类分析确定了发酵仓曲堆中8个具有代表性的曲块温度取样位点。基于8个监测取样位点的曲块温度数据,通过回归分析分别得出一翻和二翻工艺控制点的大曲整仓发酵温度预测模型。随后,本研究随机配对另一个曲仓中8个采样点的大曲温度数据并将其带入预测模型以验证模型准确度。结果表明预测模型在两次翻曲时的误差均<1.2 ℃,能够满足实际生产的需要。本研究提出了发酵过程整仓中大曲整体温度的科学监测及其评价方法,对高温大曲的发酵质量评估、翻曲节点的选择及其智能化制曲具有重要意义。

参考文献:

[1]TU W,CAO X,CHENG J,et al.Chinese Baijiu:the perfect works of microorganisms[J].Front Microbiol,2022,13:919044.

[2]DENG J.Metaproteomic characterization of Daqu,a fermentation starter culture of Chinese liquor[J].J Proteom Bioinform,2016,9:115613.

[3]YANG L,FAN W,XU Y.GC*GC-TOF/MS and UPLC-Q-TOF/MS based untargeted metabolomics coupled with physicochemical properties to reveal the characteristics of different type daqus for making soy sauce aroma and flavor type baijiu[J].LWT-Food Sci Technol,2021,146:111416.

[4]DU H,WANG X,ZHANG Y,et al.Exploring the impacts of raw materials and environments on the microbiota in Chinese Daqu starter[J].Int J Food Microbiol,2019,297:32-40.

[5]DENG L,MAO X,LIU D,et al.Comparative analysis of physicochemical properties and microbial composition in high-temperature Daqu with different colors[J].Front Microbiol,2020,11:588117.

[6]HOU Q, WANG Y, CAI W, et al.Metagenomic and physicochemical analyses reveal microbial community and functional differences between three types of low-temperature Daqu[J].Food Res Int,2022,156:111167.

[7]KANG J,CHEN X,HAN B Z,et al.Insights into the bacterial,fungal,and phage communities and volatile profiles in different types of Daqu[J].Food Res Int,2022,158.

[8]MA S,LUO H,ZHAO D,et al.Environmental factors and interactions among microorganisms drive microbial community succession during fermentation of Nongxiangxing Daqu[J].Bioresource Technol,2022,345:111488.

[9]JIANG Q,WU X,XU Y,et al.Microbial composition and dynamic succession during the Daqu production process of Northern Jiang-flavored liquor in China[J].3 Biotech,2021,11(5):11186.

[10]ZHU C,CHENG Y,ZUO Q,et al.Exploring the impacts of traditional crafts on microbial community succession in Jiang-flavored Daqu[J].Food Res Int,2022,158:111568.

[11]DU H, WANG X S, ZHANG Y H, et al.Exploring the impacts of raw materials and environments on the microbiota in Chinese Daqu starter[J].Int J Food Microbiol,2019,297:32-40.

[12]SHI W,CHAI L J,FANG G Y,et al.Spatial heterogeneity of the microbiome and metabolome profiles of high-temperature Daqu in the same workshop[J].Food Res Int,2022,156:111298.

[13]DU Y K,XIN W,XIA Y,et al.Analysis of fermentation control factors on volatile compounds of primary microorganisms in Jiang-flavor Daqu[J].J Food Biochem,2022,46(10):http://doi.org/10.1111/jfbc.14277.

[14]RAYAGURU K,ROUTRAY W,MOHANTY S N.Mathematical modeling and quality parameters of air-dried betel leaf(Piper betle L.)[J].J Food Process Preserv,2011,35(4):394-401.

[15]XU C,ZHAO S,LIU F.Distributed plant-wide process monitoring based on PCA with minimal redundancy maximal relevance[J].Chemomet Intell Lab Syst,2017,169:53-63.

[16]KRZYSKO M, NIJKAMP P, RATAJCZAK W, et al.Spatio-temporal principal component analysis[J].Spatial Economic Analysis,2024,19(1):8-29.

[17]冯军,田新惠,刘静,等.不同窖池和高粱品种对浓香型白酒品质调控效应的聚类分析[J].酿酒科技,2024(9):59-64,70.

[18]何帆,何选森,刘润宗,等.数据降维与K-均值聚类的质量评估[J].重庆理工大学学报(自然科学版),2024,38(1):131-141.

[19]TYAGI K K,PATEL M D,SORATHIYA L M,et al.Component structure of women role in goat rearing[J].Ind J Animal Sci,2013,83(8):844-847.

[20]KHAN N N, GANAI N A, AHMAD T, et al.Morphometric indices of native sheep breeds of the Himalayan region of India using multivariate principal component analysis[J].Zygote,2023,31(2):157-162.

[21]AHMAD R,ALQATHAMA A,ALDHOLMI M, et al.Gas chromatography-mass spectrometry(GC-MS)metabolites profiling and biological activities of various Capsicum annum cultivars[J].Plants-Basel,2022,11(8).

[22]QIAN W, JIANG Q, WANG H, et al.Food Literacy Evaluation Questionnaire (Chinese version, FLEQ-Ch): a validity and cross-cultural adaptation[J].Public Health Nursing,2022,39(6):1386-1394.

[23]胡纯严,胡良平.合理进行多元分析——主成分分析[J].四川精神卫生,2023,36(S1):48-54.

[24]STREPPEL MT,DE VRIES JHM,MEIJBOOM S,et al.Relative validity of the food frequency questionnaire used to assess dietary intake in the leiden longevity study[J].Nutrition Journal,2013,12:75.

[25]JENSSEN R,ELTOFT T.A new information theoretic analysis of sumof-squared-error kernel clustering[J].Neurocomputing,2008,72(1-3):23-31.

[26]SU W H, BAKALIS S, SUN D W.Potato hierarchical clustering and doneness degree determination by near-infrared(NIR)and attenuated total reflectance mid-infrared(ATR-MIR)spectroscopy[J].J Food Measure Charact,2019,13(2):1218-1231.