摘要:光谱共线性和有限的光谱数据集是影响化学需氧量反演的两个主要问题,针对第一个问题,为选取最优建模波段,首先采用标准正态变换、SG方法等6种预处理方法处理原始光谱并返回处理结果,其次使用IPLS建模,具体为将190nm~350nm光谱区域划分为10个等宽的子区间,并在每个区间上对预处理后的数据和原始数据进行偏最小二乘回归,以建立多个局部回归模型。结果表明:模型在第7个波段(238~253nm)建模效果最好,使用原始数据建模得到的MSE,MAE和R2score的值分别为0.2172,0.0278,0.9942,SG方法的预处理效果好于其他5种预处理方法,相比于直接对原始数据建模,MSE,MAE下降至 1.4727,1.0318,R2score提升至0.9944。针对数据集较小的问题,基于原始的数据特征,训练3种GAN网络以进行数据扩充并使用SVM建模。实验结果表明:相比于原始数据,模型的MSE和MAE有明显下降,模型的ACC和R2score有明显的上升,其中3个模型的ACC依次提升了2.88%,11.53%和11.53%,R2score依次提升了18.07%,17.40%和18.74%。基于GAN网络的数据增强方法在光谱分析技术领域具有重要的研究意义和应用价值。