傅立叶变换近红外光谱法检测白酒总酸和总酯
216
第22卷第12期2006年12月农业工程学报
T ransactio ns o f the CSAE V o l. 22 No. 12Dec. 2006
傅立叶变换近红外光谱法检测白酒总酸和总酯
彭帮柱1, 龙明华2, 岳田利1※, 袁亚宏1
(1. 西北农林科技大学食品科学与工程学院, 杨凌712100; 2. 杨凌职业技术学院农学系, 杨凌712100)
摘 要:该文研究白酒总酸和总酯的快速检测技术, 通过解析不同白酒样品的近红外光谱图, 对光谱数据进行不同的处理, 结果表明:用一阶导数预处理光谱, 谱区选择6102~5446cm -1, 利用人工神经网络与傅立叶变换近红外光谱相结合, 采用内部交叉验证法建立模型, 效果较好。其中, 总酸模型的决定系数为96. 73%, 内部交叉验证均方根差为0. 048g /L ; 总酯模型的决定系数为99. 58%, 内部交叉验证均方根差为0. 085g /L ; 进一步对总酸和总酯的模型进行验证和评价, 结果表明总酸模型验证集的相关系数为99. 2%, 预测标准偏差为0. 074g /L ; 总酯模型验证集的相关为99. 7%, 预测标准偏差为0. 134g /L , 表明建立的模型可靠, 预测效果好, 能满足白酒生产中总酸和总酯的快速检测要求。关键词:傅立叶变换; 近红外光谱; 白酒; 总酸; 总酯; 人工神经网络
中图分类号:T S261. 7 文献标识码:A 文章编号:1002-6819(2006) 12-0216-04彭帮柱, 龙明华, 岳田利, 等. 傅立叶变换近红外光谱法检测白酒总酸和总酯[J ].农业工程学报, 2006, 22(12) :216-219. Peng Bang zhu, Lo ng M inghua, Yue T ianli, et al. Det erminat ion o f T A and T E concent ration in liquor based on F our ier tr ansfo rm near -infrar ed spectr o sco py [J ].T ransactio ns of the CSA E , 2006, 22(12) :216-219. (in Chinese w ith Eng lish abst ract )
0 引 言
近红外光谱(NIRS ) 技术是20世纪80年代迅速发展起来的一项物理测试技术, 具有快速、无损耗、多成分同时分析、分析过程无污染、分析结果重演性高等优[1]
点, 已成为现代分析测试技术中的重要工具。近红外光(NIR) 主要指波长范围是780~2526nm 的电磁波, 分子在近红外区的吸收主要由C-H, O-H, N-H 和C=O 等基团的合频吸收与倍频吸收组成, 可以反映出有机物的大量信息。近红外光谱包含了键强度、化学组分、电负性和氢键等信息, 在如此丰富的信息中如何提出所需要的特征信息, 是制约近红外光谱技术发展和应用的难题之一。随着化学计量学方法的发展, 近红外光谱技术进入了一个快速发展的新时期。目前, 在食品、药品、化工产品等领域, 国内外学者已构建了许多能够较好预测目
[2-7]
标组分的近红外光谱模型。
白酒工业是中国重要的一个产业, 年产量大。白酒生产过程中, 总酸(TA ) 和总酯(T E ) 是两个要求连续监测的指标, 也是影响白酒成品质量的两个重要理化指标, 在白酒的国家标准中, 总酸和总酯的测定方法相当繁琐且费时、费力。如何对其进行快速、准确的测定对降低生产成本、提高产品在线监测效率等具有重要意义。
近红外光谱分析技术恰恰具有这些特点, 适合在线检
测, 是一种能满足生产过程检测和监测的现代分析技术。现代傅里叶变换近红外光谱技术是以傅里叶级数拟合原光谱曲线, 用较少项的级数就可获得与原光谱良好的近似, 是一种信号处理和波谱解析的有力手段, 是20世纪90年代后快速发展并正真得到推广应用的一种光谱滤噪技术[8]。因此傅里叶变换近红外光谱技术能有效地进行大量样品的高精度快速分析。鉴于此, 本研究通过解析白酒样品的近红外光谱图, 选取了建模的特征谱区, 比较不同光谱数据预处理方法对建模效果的影响, 旨在建立基于傅立叶变换近红外光谱法(FT-NIRS ) 的白酒总酸和总酯的快速预测模型, 期望为白酒工业测定提供一套高效、准确、快速的分析总酸和总酯的方法。
1 材料与方法
1. 1 试验材料
通过含量梯度法选择不同系列白酒样本共计78个, 由陕西西凤酒厂质检处提供, 然后随机选取总酸和总酯含量适中具有不同梯度的12份样品作为验证集, 其余的66个样品用于采集近红外光谱建立总酸和总酯的校正模型。
1. 2 总酸和总酯含量的化学值测定
白酒中总酸含量的测定按照GB10345. 4-1989方法测定(以乙酸计) , 总酯含量的测定按照GB10345. 5-1989方法测定(以乙酸乙酯计) 。1. 3 近红外光谱采集
利用德国布鲁克光学仪器公司(Br uker 公司) M PAT M 傅立叶变换(FT ) 近红外光谱仪采集光谱。InGaAs 检测器。选用光程为2mm 液体光纤探头, 以空气为参比, 扫描波数为12000~4000cm -1, 分辨率
-1
, 收稿日期:2006-03-01 修订日期:2006-07-07
基金项目:国家“十五”科技攻关项目(2001BA 501A 5-2. 3)
作者简介:彭帮柱(1978-) , 男, 河南信阳人, 博士, 主要从事食品生物技术与发酵工程研究。杨凌 西北农林科技大学食品科学与工程学院, 712100
※通讯作者:岳田利(1965-) , 男, 陕西宝鸡人, 教授, 博士生导师, 主要从事食品工程高新技术研究。杨凌 西北农林科技大学食品科学与工程学院, 712100
第12期彭帮柱等:傅立叶变换近红外光谱法检测白酒总酸和总酯217
1. 4 光谱数据处理
光谱经过OPUS —QUANT 2定量分析软件(德国布鲁克公司) 进行均值中心化后, 利用一阶导数法进行预处理, 光谱数据以文本格式导出后利用多元线性回归法(MLR) 、主成分分析法(PCA) 、偏最小二乘法(PLS) 和人工神经网络法(ANN) 进行计量学分析。其中, 人工神经网络方法应用目前使用最广的误差反向传播神经网络(back propag ation, BP ) 算法进行计算[9], 采用Lev enberg -Marquardt 法优化, 计算时网络结构为三层, 首先输入建模谱段的近红外光谱数据, 然后将光谱数据进行主成分变换, 取前5个主成分作为神经网络的输入, 建立模型。其中多元线性回归法(M LR) 和主成分分析法(PCA) 用数据处理软件SAS8. 0(美国SAS 软件研究所) 处理, 偏最小二乘法(PLS ) 用数据处理软件OPU S —QUANT 2处理, 人工神经网络法(ANN ) 用M ATLAB 7. 0(美国M athWor ks 公司) 软件工具箱编程处理。
1. 5 模型建立质量判断
光谱数据根据本文1. 4中不同方法处理后, 采用内部交叉验证法(Cross Validation ) 检验模型稳健性, 然
2
后通过比较模型的决定系数(R ) 和内部交叉验证均方根差(RM SE CV ) 来衡量模型的质量, 决定系数越大, 均方根差越小, 模型质量越好。模型预测性能用预测标准偏差(R MSE P ) 和相关系数(R 2) 来表示, 预测模型相关系数越大, 预测标准偏差越小, 模型预测能力越好。其中:
n
2
吸收, 4347cm -1附近是乙醇的特征吸收区域[10], 为了避免这些强吸收噪声的干扰, 在选择定标谱区时应尽量避开这一谱区。另外光谱的首尾谱段为强噪音区, 因此选择建模波长范围为6102~5446cm -1(图1) 。
表1 酒样总酸和总酯化学实测值分析T able 1 A naly sis for tr ue v alues of t otal acid
and tot al ester in liquo r samples
总 酸校正集
样品数含量范围/g・L -1平均值/g・L -1级差/g・L -1
660. 70~2. 080. 981. 38
验证集120. 90~1. 681. 120. 78
总 酯校正集661. 25~6. 253. 255. 00
验证集121. 50~4. 803. 113. 30
∑(y
i =1Ti
-y Pi )
2
R =(1-×100%;
Ti
∑(y
i =1
n
-y a ) 2
图1 白酒样品的近红外光谱图
F ig. 1 Near infr ared spectr a o f differ ent liquo r samples
RM SE CV =
2
∑(y Ti -y Pi ) i =1
n -
1
n
;
n
式中 n ——样本个数; y Ti ——样本的实测值; y Pi ——样本的预测值; y a ——样本实测值的平均值。
RM SE P =
∑(y
i =1
T i
-y Pi )
2
2 结果与分析
2. 1 总酸和总酯化学实测值的分析
酒样总酸和总酯化学实测值见表1, 由校正集和验证集中总酸和总酯的含量范围、平均值和级差可知, 选取样品中的各组分含量范围较宽, 代表性强。2. 2 近红外光谱图分析与波长选择
白酒中主要成分除了总酸和总酯外, 主要为水、乙
-1
醇等物质, 水分子在6896cm 左右有明显的一级倍频吸收, 二级倍频约在10416cm -1, 合频位于5128cm -1
附近, 因此6896cm -1和5128cm -1附近是水的特征吸
; 2. 3 模型的建立与优化
在建模分析中, 决定系数(R 2) 偏高为好, 内部交叉验证均方根差(RM SECV ) 偏小为好, 建模条件的选取一定要适当, 避免出现过拟合现象, 又要保证预测具有较高的精度, 即预测标准偏差(RM SEP ) 要小。不同方法建立模型的效果见表2。由表2可知, 偏最小二乘法与人工神经网络法相比, 建模质量没有显著性差异, 二者均比多元线形回归法和主成分分析法建模效果好, 说明偏最小二乘法与人工神经网络法在本试验中具有良好的提取有用特征信息的能力, 可以用于白酒中总酸和总酯近红外光谱模型的构建中。由于人工神经网络法得到的总酸和总酯模型的决定系数最大, 均方根差最小, 综合考虑采用人工神经网络法处理光谱数据, 谱区范围选择6102~5446cm -1, 然后建立定标模型。进一步通过“剔一”(Leave One Out ) 交叉验证法(Cro ss Valida-tion) 手工优化模型, 剔掉2个异常值样品后, 建模共利用酒样64个。总酸和总酯定标模型的预测值和实测值的关系如图2、图3所示, 其中, 总酸模型的R 2为96. 73%, R MS ECV 为0. 048g /L; 总酯模型的R 2为g /
218
表2 不同方法建模质量的比较
T a ble 2 Co mpar iso n o f models established by differ ent
data t reat ment methods
光谱数据处理方法多元线性回归法主成分分析法偏最小二乘法人工神经网络法
总 酸R 2/%89. 5792. 1394. 6595. 79
R M S E CV /g õL -10. 1470. 1080. 0630. 054
R 2/%94. 7895. 3598. 7398. 85
总 酯
农业工程学报2006年
R M S ECV /gõL -10. 2160. 1960. 1570.
113
中白酒工业中总酸和总酯的检测精度要求。将预测值和实测值进一步通过配对t 检验确认, 在0. 05显著性水平下, 两种方法不存在显著性差异, 表明近红外光谱法与化学方法不存在系统误差, 进一步说明, 所建的校正模型具有良好的预测能力, 可以达到常规分析方法的精度要求。
图2 校正集总酸预测值和实测值相关图
F ig. 2 Cor relatio n diagr am betw een pr edicted values and measured values of to tal acid in calibr atio n
set
图5 验证集总酯预测值与实测值相关图
Fig . 5 Cor relation diagr am betw een pr edict ed v alues
and measur ed v alues of to tal ester in t est set
3 结论与讨论
利用傅里叶变换近红外光谱技术(FT -NIRS) 结合
人工神经网络建立了白酒总酸和总酯的定量分析模型。其中, 总酸模型的R 2为96. 73%, RM SECV 为0. 048
2
g /L; 总酯模型的R 为99. 58%, R MS ECV 为0. 085g /L; 进一步对模型进行验证和评价, 得出总酸模型验
2
证集的R 为99. 2%, RM SE P 为0. 074g/L; 总酯模型验证集的R 2为99. 7%, R MS EP 为0. 134g /L , 表明模型的预测效果很好, 能满足生产中白酒总酸和总酯的检测精度要求。
在白酒工业中, 总酸和总酯的常规分析检测工作格外繁重, 测定方法繁琐费时, 难以及时准确提供分析数据, 在发酵过程中更无法实现在线分析。本试验以傅里叶变换近红外光谱技术(FT -NIRS) 为基础, 利用人工神经网络建立了白酒总酸和总酯的定量分析模型, 很好地克服了常规方法的缺点。试验结果表明建立的模型具有很高的预测能力, 预测结果完全可以接受, 可以替代的常规分析方法。近红外光谱技术在酒类工业中的应用研究已进入了快速发展期, 常见的应用研究多为构建酒精度的定量分析模型[7, 11]。近红外光谱技术可以用于酒类工业中原材料相关成分的检测和发酵过程的在线监控上, 也可以为生产管理与酒质评价体系的建立等方面提供了重要的技术支持。随着近红外光谱仪硬件技术的提高和设备成本的不断降低, 以及数理统计方法的进一步完善, 从复杂、重叠和变化的近红外光谱中提取有效信息的效率也会大大提高, 近红外光谱法的应用前景必将更加广阔。
[参 考 文 献]
[1] 王海莲, 万向元, 胡培松, 等. 稻米脂肪含量近红外光谱分
1546.
图3 校正集总酯预测值和实测值相关图
F ig . 3 Cor relatio n diagr am betw een pr edicted values and measured va lues of to tal est er in calibr atio n set
2. 4 模型的验证与评价
利用建立的定量模型预测验证集的12个样品, 由图4和图5可以看出, 近红外光谱预测值与实测值基本一致, 总酸模型验证集的R 2为99. 2%, R MS EP 为0. 074g /L ; 总酯模型验证集的R 2为99. 7%, RM SE P 为0. 134g /L , 说明模型的预测效果很好,
能满足生产
图4 验证集总酸预测值与实测值相关图
F n een pr values
t
第12期彭帮柱等:傅立叶变换近红外光谱法检测白酒总酸和总酯219
[2] 赵 琛, 瞿海斌, 程翼宇. 虫草氨基酸的人工神经网络近红
外光谱快速测定方法[J ].光谱学与光谱分析, 2004, 24(1) :50-53.
[3] Sinnaev e P D, A g neessens R. Q uant itative analysis of
r aw apple juices using near infr ared , F ourier -transfo rm near infr ared and Fo urier -t ransfor m infra red inst ruments:
a com par ison o f their analytica l per for mances [J ].N ear I nfr ar ed Spectro sc, 1997, 5:1-17.
[4] 丁小霞, 李培武, 李光明, 等. 傅里叶变换近红外光谱技术
测定完整油菜籽中芥酸和硫甙含量[J]. 中国油料作物学报, 2004, 26(3) :76-79.
[5] Sivakesava S , Ir uday araj J. R apid deter minatio n o f T etr a-cy cline in milk by FT -M IR and F T -N IR spectro scopy [J ].
D air y Sci, 2002, 85:487-493. [6] 王家俊, 梁逸曾, 汪 帆. 偏最小二乘法结合傅里叶变换近
红外光谱同时测定卷烟焦油、烟碱和一氧化碳的释放量[J ]. 分析化学, 2005, 33(6) :793-797.
[7] 李代禧, 吴智勇, 徐端钧, 等. 啤酒主要成分的近红外光谱
法测定[J ]. 分析化学, 2004, 32(8) :1070-1073.
[8] 吴瑾光. 近代傅里叶变换近红外光谱技术及应用[M ].北
京:科学技术出版社, 1995.
[9] 罗一帆, 郭振飞, 朱振宇, 等. 近红外光谱测定茶叶中茶多
酚和茶多糖的人工神经网络模型研究[J ].光谱学与光谱分析, 2005, 25(8) :1230-1233.
[10]陆婉珍, 袁洪福, 徐广通. 现代近红外光谱分析技术[M ].
北京:中国石化出版社, 2000.
[11]逯家富, 全美兰, 郭伟良, 等. 短波近红外光谱-偏最小二
乘法在白酒分析中的应用[J]. 酿酒, 2005, 32(5) :75-77.
Determination of total acid and total ester in liquor based on
Fourier transform near -infrared spectroscopy
Peng Bangzhu 1, Long Minghua 2, Yue Tianli 1※, Yuan Yahong 1
(1. College of F ood Science and Eng ineer ing , N or thw est A gr icultur e and For estry U niver sity , Y angling , Shaanx i 712100, China ;
2. D ep artment of A gr icultur e , Y angling V ocational and T echnical College , Y angling , Shaanx i 712100, China )
Abstract :In order to measure to tal acid (TA ) and total ester (T E ) accurately and quickly in liquo r, calibration models w ere established based on Fourier-tr ansfor m near-infrared spectr oscopy w ith artifical neural netw o rk by Cross-Validation after the spectra w ere analy zed and discussed. Results show that according to the selected spectral r anges of 6102~5446cm -1, coefficients of the models (R 2) for T A and T E are 96. 73%and 99. 58%respectiv ely , and the root mean squar e error s of cross v alidation (RM SE CV ) for T A and T E ar e 0. 048g /L and 0. 085g/L respectiv ely. Then the mo dels w ere tested. Results show that R 2fo r TA and T E are 99. 2%and 99. 7%respectiv ely , and the r oot mean square err ors of predictio n (RM SE P ) are 0. 074g/L, 0. 134g/L respectively. These sug gest the mo dels of T A and T E are reliable w ith go od predictability and can meet the r equirement of quick determination of T A and TE in liquor pr oduction.
Key words :Four ier transform ; near infrared spectr oscopy ; liquor; to tal acid; total ester ; artifical neural netw o rk