基于脂肪酸成分结合稀疏偏最小二乘判别分析鉴别橄榄油的新陈度

论文推荐 | 基于脂肪酸成分结合稀疏偏最小二乘判别分析鉴别橄榄油的新陈度


基于脂肪酸成分结合稀疏偏最小二乘判别分析鉴别橄榄油的新陈度



雷春妮1,李建科2*马灵飞3,赵 敏2

顾 强4,王 波1,仲 斌2,漆珍珍1



图片




作者单位


1.兰州海关技术中心

2. 陇南市祥宇油橄榄开发有限责任公司

3. 延安大学 石油工程与环境工程学院

4. 张家港海关综合技术中心


引用格式


雷春妮,李建科,马灵飞,.基于脂肪酸成分结合稀疏偏最小二乘判别分析鉴别橄榄油的新陈度[J].农产品加工,2026,(09):77-81.


基金项目


海关总署科研项目(2024HK016);陇南市武都区科技计划项目(WKQ2023-01)



图片


摘要:通过测定脂肪酸含量并结合化学计量学方法,对橄榄油新陈度进行鉴别。同时,采用气相色谱法GC)分别分析了新鲜橄榄油和过期橄榄油中的脂肪酸含量。研究发现,单一的脂肪酸含量指标并不足以作为判断橄榄油品质的唯一依据,需结合其他具有区分性的特征指标来鉴别新鲜与过期的橄榄油。通过主成分分析(PCA)和稀疏偏最小二乘判别分析(sPLS-DA)对脂肪酸成分数据进行多变量统计分析,构建了基于脂肪酸成分的正交偏最小二乘法判别分析模型。该模型能有效区分2024年的新鲜橄榄油与2016—2023年过期橄榄油。此方法可较为准确地鉴别过期橄榄油,从而为橄榄油的品质控制和消费者的安全保障提供支持。

关键词:橄榄油;化学计量学;脂肪酸;新陈度;主成分分析

图片


图片

一、引言


橄榄油在全球范围内拥有庞大的消费群体,被公认为是最有益于人体健康的油脂之一,被誉为“液体黄金”和“植物油皇后”。随着人们健康饮食意识的提升,橄榄油的市场需求持续上升。然而,食用油市场的巨大消费量和价格差异,促使一些不法分子销售劣质油和掺假油,假冒高价值油品以牟取暴利。部分商家甚至对过期油处理后,重新上市,外观上与高品质油品无异,通过添加氢氧化物和抗氧化物使其检测指标也合格。但其品质和营养价值远低于真正的高品质油。因此,开发一种有效的方法来鉴定和评估橄榄油是否过期,对保障公众消费安全、规避健康风险尤为重要。

在橄榄油的质量控制流程中,脂肪酸成分的检测是一项关键的常规检测项目。这项检测不仅能反映橄榄油中各种脂肪酸的比例,还能进一步评估其营养价值和健康效益。通过精确测定橄榄油中单不饱和脂肪酸、多不饱和脂肪酸及饱和脂肪酸的具体含量,为消费者选择橄榄油提供科学依据。因此,橄榄油生产企业和监管机构均高度重视脂肪酸的检测工作,以确保产品符合健康标准和消费者需求。

存放时间过长的橄榄油,脂肪酸可能会发生分解,导致酸败并产生有害物质,这不仅影响了橄榄油的品质和口感,且过期的橄榄油可能含有对人体有害的化学成分,增加了消费者的健康风险。目前,有多种方法可检测食用油中的掺假情况,如紫外分光光度法、红外光谱法和核磁共振光谱法,但色谱法仍是最可靠的方法之一。近年来,基于脂肪酸的橄榄油掺假鉴别受到广泛关注。例如,YANG Y等人通过测定食用油中的脂肪酸含量,成功鉴别出掺有4种植物油的特级初榨橄榄油;王李平等人采用气相色谱法测定食用油中的脂肪酸含量,成功对6种食用油进行了分类。然而,现有研究主要集中在橄榄油中掺杂其他植物油的情况,尚未对过期橄榄油的鉴别进行相关研究。因此,基于脂肪酸含量的过期橄榄油鉴别方法研究,对于确保橄榄油的质量和安全具有重要意义。

试验采用测定脂肪酸含量结合化学计量学方法对橄榄油新鲜度进行鉴别。通过气相色谱法(GC)分别测定新鲜橄榄油和过期橄榄油中的脂肪酸含量,并结合主成分分析(PCA)和稀疏偏最小二乘判别分析(sPLS-DA)等多元统计分析方法,为构建基于脂肪酸成分的新鲜橄榄油鉴别模型提供了理论基础。

图片


图片

二、材料与方法


(一)仪器、试剂与材料

Clarus 600型气相色谱仪,配备FID(火焰离子化检测器),珀金埃尔默股份有限公司产品;37种脂肪酸甲酯混合标准品,质量浓度为10 mg/mL;甲醇,色谱纯级别;氢氧化钾、异辛烷、硫酸氢钠等试剂,均为分析纯。

53个橄榄油样品(包括20个新鲜橄榄油样品和33个过期橄榄油样品),均购自市场。具体来看,过期橄榄油样品包括生产日期为2016年的3个样品,以及2017年、2018年、2019年、2021年、2022年、2023年各5个样品。

(二)试验方法

1. 试验前处理

根据国家标准GB 5009.168—2016进行处理:首先,准确称取60.0 mg样品置于一个带有塞子的试管中,确保称量的精确度达到0.1 mg。接着,向试管中加入4 mg的异辛烷溶解样品。待样品完全溶解后,再加入200 μL质量分数为2%的氢氧化钾-甲醇溶液。之后,迅速盖上玻璃塞,并用力摇晃试管30 s,然后静置,直到溶液变得清澈透明。此时,向试管中加入大约1 g的硫酸氢钠,再次用力摇晃试管,目的是中和之前加入的氢氧化钾。等待盐类沉淀完全后,小心地将上层澄清溶液转移到进样小瓶中,最后将此溶液置于气相色谱仪进行分析。

2. 气相色谱条件

色谱柱:HP-88型毛细管柱(100 m×0.250 mm×0.20 μm);程序升温:120 ℃保持1 min,以10 ℃/min升至175 ℃,保持10 min,以5 ℃/min升至210 ℃,保持5 min,再以5 ℃/min升至230 ℃,保持25 min;进样口温度250 ℃,载气为高纯氮气(纯度≥99.999%),分流比100∶1,流速 1.0 mL/min;FID 检测器温度300 ℃,进样量1.0 μL。

3. 数据处理

在进行样品分析时,首先需要根据保留时间进行定性分析。这一过程涉及将样品色谱图中的色谱峰与已知的37种脂肪酸甲酯标准品的色谱图进行仔细对比。通过这种对比,可确认样品中所含有的脂肪酸甲酯种类,同时确保保留时间的差异小于0.5%。为了更精确地量化这些脂肪酸甲酯的含量,采用了面积归一化法。此方法基于色谱峰的面积来计算各种脂肪酸甲酯的相对含量,从而得到每种成分在样品中的比例。为确保数据的可靠性,每个样品重复测定3次。

(三)统计分析

在数据分析领域,引入一种稀疏版本的偏最小二乘法(sPLS),专门用于判别分析(sPLS-DA)。虽然,偏最小二乘法(PLS)最初是为了解决回归问题而设计的,但研究人员发现其在处理分类问题时同样能够展现出卓越的性能[12]。在监督学习的框架下,sPLS-DA作为一种探索性的方法,不仅可用来检验模型的泛化能力,且在实际应用中,可确保所选择的特征具有稳定性。sPLS-DA的独特之处在于,其能够在单一的步骤中同时完成变量选择和分类任务,大大简化了分析流程。除此之外,sPLS-DA还具备通过图形化的方式辅助解释分析结果的特点,这使得研究者能更直观地分析数据。

图片



图片

三、结果与分析


(一)橄榄油的脂肪酸组分

在对橄榄油样品进行气相色谱分析的过程中,每一个样品都进行2次平行测定,确保结果的重复性和可靠性。在分析过程中,依据保留时间进行定性分析,并采用面积归一化法进行定量分析。

橄榄油脂肪酸成分的色谱图见图1。

image.png

通过对新鲜橄榄油和过期橄榄油的详细数据分析,发现新鲜橄榄油和过期橄榄油中脂肪酸的组成种类是完全一致的。在试验中,橄榄油中鉴定出了13种不同的脂肪酸。尽管在脂肪酸含量上,新鲜橄榄油和过期橄榄油之间存在一些微小差异,但这些差异并不显著,所以无法通过常规的分析方法明确区分哪些是新鲜橄榄油,哪些是过期橄榄油。

此外,新鲜橄榄油和过期橄榄油中的脂肪酸组成含量都符合橄榄油质量标准《橄榄油、油橄榄果渣油》(GB/T 23347—2021)所规定的要求。这进一步说明仅凭脂肪酸的组成种类和含量,无法有效地鉴别出橄榄油的新鲜度。

鉴于上述情况,需采用更为深入的统计分析方法,对收集到的数据进行进一步处理和分析。

(二)新鲜橄榄油和过期橄榄油中脂肪酸组成差异

新鲜橄榄油和过期橄榄油中各脂肪酸甲酯的含量见表1。

image.png

由表1可知,主要脂肪酸的比例随着橄榄油的收获年份而发生轻微的变化。总体而言,存储年份对橄榄油脂肪酸的组成具有显著影响。然而,尽管存储年份的影响不容忽视,新鲜油品与过期油品之间的差异仍然是最为显著的。在对过期油品与新鲜油品进行比较时,特别关注了单一的脂肪酸指标,如棕榈酸(C16∶0)和亚油酸(C18∶2)。研究发现,这2种脂肪酸的含量确实存在差异,但差异并不显著。此外,其他大部分脂肪酸的含量在过期油品与新鲜油品之间也没有表现出显著的差别。因此,如果仅依赖单一脂肪酸指标来鉴别橄榄油的品质,可能会遇到困难,因为这些指标容易通过调整真假油的配比来伪造。鉴于此,为准确鉴别新鲜橄榄油和过期橄榄油,不能仅仅依赖单一的脂肪酸指标,而应结合其他具有显著差异性的特征指标进行综合判断。

(三)依据脂肪酸组成区分过期橄榄油和新鲜橄榄油

在数据预处理阶段,对样本数据进行归一化和标准化处理,以确保数据的一致性和可比性。随后,采用了主成分分析(PCA)技术,用于减少数据集的维度,同时尽可能保留原始数据中的重要信息。通过PCA分析可将大量复杂的原始数据简化为少数几个主成分,这不仅有助于降低计算复杂度,还能够揭示数据中的主要结构和模式。

橄榄油的主成分分析得分图见图2。

image.png

由图2可知,前2个主成分的累积贡献率已经达到了0.94,意味着2个主成分已经能够解释原始数据中94%的变异。

为了进一步评估不同群组之间模式的统计显著性,运用PERMANOVA(Permutational multivariate analysis of variance)分析方法得到一个F值为5.205 4,R2值为0.184 55,一个p值为0.006。F值和R2值的大小表明了群组间差异的显著性和解释力,而p值则提供了统计显著性的证据。然而,当深入探究这些统计结果时,发现了该方法的一些明显局限性。特别是R2值仅为0.184 55,这表明当前方法所考虑的因素对于解释数据总变异的能力比较有限,大部分数据变异并没有被当前方法及其相关因素所解释。这暗示了可能有多个关键的影响因素被忽略,或者未能被准确地识别和处理。尽管p<0.05,但在实际应用中,这种差异可能并不具有足够的实质性意义。鉴于R2值过低,即便存在显著差异,这些差异可能仅限于局部或微小层面,对于全面理解整体数据、进行有效分类和精准预测等关键目标,该方法所能提供的信息和可靠支持显得不足。因此,需要考虑其他方法或技术,以更全面地捕捉数据中的关键特征和模式,从而提高对数据的理解和预测的准确性。

在比较无监督模式识别与有监督模式识别方法时发现,有监督模式识别方法在提取用于样本分类的变量信息方面表现得更为高效。这种方法能够显著减少噪声干扰,且在提升分类准确性方面具有显著优势。偏最小二乘判别分析(PLS-DA)是统计学研究中经常使用的一种有监督模式识别技术。通过PLS-DA的分析结果,可看到有监督方法在改善分形效应方面取得了显著的成效。然而,当面对变量冗余的情况时,由于变量选择功能的局限性,PLS-DA在进行组分类时的表现并不理想,因此其并不适合用于建模工作。sPLS-DA是PLS-DA算法的一个改进版本,其通过标准化处理的数据增强了模型的稳定性和泛化能力。首先,进行样本总和归一化处理,这一过程是将每个样本中所有变量的总和调整至一个固定值,通常这个值被设定为1。接下来进行数据平方根转换,这对于原始数据呈现右偏态分布的情况尤为重要,因为其有助于将数据分布调整至更接近正态分布,且能降低数据的变异性。特别是对于较大的数据值,这种转换能有效减少其变化范围,从而增强数据的稳定性。最后,执行数据自动缩放操作,这类似于Z-score标准化处理。这种方法通过将数据转换成均值为0、标准差为1的分布,消除不同变量间的尺度差异。

脂肪酸数据在处理前后的对比见图3。

image.png

sPLS-DA在处理高维数据集时,通过运用交叉验证技术,能够得到一个平均分类错误率,这个错误率以一种直观的方式反映出模型的分类效果。具体来说,错误率越低,意味着模型在分类任务中的准确性越高,其泛化能力也越强。在实际应用稀疏偏最小二乘判别分析技术时发现,选取4个成分可达到最低的分类错误率。sPLS-DA的这一特性使得其能够有效识别出对于区分过期橄榄油与新鲜橄榄油贡献最大的脂肪酸变量。

橄榄油的sPLS-DA得分图见图4。

image.png

在分析中,第一主成分解释了数据变异的42.5%,而第二主成分则解释了14.4%。这说明第一主成分在区分新鲜与过期的橄榄油时起到了主导作用,而第二主成分虽然解释的数据变异量较少,但也在一定程度上有助于进一步区分这2种橄榄油。通过这种方式,sPLS-DA不仅保留了PLS-DA在有监督模式识别中的传统优势,还通过减少不必要的变量冗余,显著提升了模型的解释力和分类准确性。试验结果证明,sPLS-DA在区分过期橄榄油与新鲜橄榄油方面表现得非常出色,能够清晰地展示不同过期年份的橄榄油品种,且这些品种能够轻松地从新鲜橄榄油中被识别和区分出来。

图片



图片

四、结论


通过采用气相色谱法对一系列样本进行分析,重点在于分析和量化这些橄榄油样本中的脂肪酸成分及含量。研究结果表明,尽管在脂肪酸的种类和比例上,新鲜橄榄油与过期橄榄油之间确实存在一定的差异,但在统计学并不显著。鉴于此,为了能够更准确地区分出新鲜橄榄油和已过期橄榄油,采用了稀疏偏最小二乘判别分析方法,构建了基于脂肪酸成分的正交偏最小二乘法判别分析模型。该模型展现出较高的鉴别能力,能有效地将2024年的新鲜橄榄油与2016—2023年已过期的橄榄油区分开来。因此,利用橄榄油中脂肪酸的指标进行新鲜与过期的分类和判别是完全可行的,且这种方法也为橄榄油的品质控制提供了参考依据,有助于消费者购买到高品质的橄榄油产品。

图片


编辑:刘   嘉

审核:关   颖

本篇文章刊登于《农产品加工》2026年5期上