点击上方蓝字,关注我们~



基于SSA-LSTM模型的流域水质分析及预测

褚林峰1 何延新1 党艳1 王林1 孙杰娟1 常坤2* 王振强2 田高峰2
1 西安市生态环境局
2 力合科技(湖南)股份有限公司
本文引用格式:
代芯. 2025. 湿地保护预防性环境行政公益诉讼的适用逻辑与制度展开[J]. 湿地科学与管理, 21(5): 12-17.
doi:10.3969/j.issn.1673-3290.2025.05.03
水质动态预测是流域综合治理与生态修复的关键科学支撑。本研究以渭河干流关中段为研究区,基于2021―2023年7个国控监测断面的多源实时监测数据,综合运用水质指数法(WQI)、Pearson相关性分析及神经网络模型,开展水质时空特征解析与溶解氧(DO)高精度预测研究。结果表明:研究期内流域WQI值为60~90,水质优良率达97.4%,整体稳定;上游水质优于中下游,春秋季水质较优、夏季较差,氨氮(NH3-N)和总磷(TP)为主要波动污染因子。通过Pearson相关性分析筛选出水温、电导率、pH值、浊度、总磷、总氮(TN)与DO强相关的指标作为模型输入因子,有效降低数据冗余。对比LSTM、GRU及SSA-LSTM模型,传统LSTM存在过拟合,GRU精度有待优化,SSA-LSTM模型表现最优,其训练集与测试集的均方根误差(RMSE)分别低至0.34mg·L-1和0.39mg·L-1,决定系数(R2)均接近0.95,可精准捕捉DO波动特征,波峰波谷区域拟合效果显著优于其他模型。本研究明确了渭河关中段水质时空演变规律及驱动机制,验证了SSA-LSTM模型在水质高精度预测中的优越性,可为渭河及黄河流域的水质管理决策、污染精准管控及水生态保护提供科学依据。
研究区概况
渭河流域跨甘肃、宁夏、陕西3省,总流域面积13.48万km2,其中陕西境内干流长502km,流域面积7.25万km2(图1)。地势西高东低,南倚秦岭,北靠渭北北山,中部为冲积-洪积平原,地貌涵盖山地、黄土台塬、丘陵及平原,以黄绵土、褐土为主,侵蚀敏感性与渗透性差异显著。该流域属暖温带大陆性季风气候,年均气温7.8~13.5℃,年均降水约550mm,时空分布不均且呈“南多北少”特征。受降水集中、蒸发强烈、泥沙输移剧烈及土地利用交错影响,流域形成“水量季节悬殊、污染过程脉冲式、水质空间差异显著”的水环境特征。

选取陕西境内魏家堡、卧龙寺桥等7 个国控水质监测断面为研究对象,覆盖渭河(关中段)干流(图1),数据来源于西安市生态环境局,采集时间2021—2023年,每4h 监测1 次,包含水温、pH值、电导率、溶解氧、总磷(TP)、总氮(TN)、氨氮、高锰酸盐指数(CODMn)和浊度9 项水质指标。对数据进行异常值剔除、缺失值插值补全及归一化处理,消除量纲差异;按8:2 比例划分为训练集(构建网络优化模型)和测试集(检验拟合效果),该比例参考相关研究经验并结合实际数据情况确定(Nallakaruppan et al., 2024; Pang et al., 2024)。
所采用的方法包括:水质指数评价法、构建水质预测模型、Pearson 相关系数法,并选择均方根误差RMSE)、平均绝对误差(MAE)和决定系数(R2)作为判断模型预测效果的基础。
水质特征及时空评价
2.1 水质特征
如表3所示,DO平均值为9.35±1.77mg·L-1,高于地表水Ⅰ类标准(7.50mg·L-1),最低值为5.49mg·L-1,所有监测值均不低于Ⅲ类标准;标准差和变异系数分别为1.77和0.19,表明DO浓度波动较小,整体稳定。CODMn平均值3.56±1.31mg·L-1(达标),最大值达10.56mg·L-1(超标75%),最小值1.31mg·L-1(优),表明个别站点存在严重的有机污染,需开展污染源排查。NH3-N及TP波动性较大,高值站点污染主要受生活污水排放及农业面源污染影响。

2.2 水质时间特征评价
基于WQI评价结果,各监测断面WQI值为60~90,整体处于良好和优秀等级(图2)。其中,优秀占52.7%,良好占44.7%,中等和差合计仅占2.6%,表明该流域水质较好且稳定。年际变化上,卧龙寺桥和兴平监测断面WQI值最稳定,水质最好;咸阳铁桥出现WQI值低于40的月份,但随后逐渐回升,说明短期间存在污染并得到及时治理。季节变化方面,流域水质表现为春、秋季较好,夏季最差。

2.3 水质空间特征评价
基于2021—2023 年WQI 均值分析,各监测断面总体水质均达良好及以上水平(图3)。上游水质较好、中下游较差。从水质评价等级分布来看,中上游水质多为“优秀”等级;自咸阳铁桥断面起,“良好”等级占主要部分,并短暂出现等级为差的情况。

水质预测分析
3.1 输入因子集选择
由于实时监测数据受噪声干扰,为确保模型预测精度,需分析DO与其他指标的相关性筛选有效输入因子集(李海华等,2024)。基于监测断面2021—2023年实时水质数据,对DO与水温、电导率、pH值、浊度、TP、TN、NH3-N进行Pearson相关性分析(图4)。结果表明,DO与水温、电导率、pH值、TN呈极强相关(|r|>0.8),与浊度呈中等相关(0.4≤|r|<0.5),与TP呈弱相关(0.2≤|r|<0.3),与NH3-N呈极弱相关(|r|<0.2)。依据|r|≥0.2的阈值,剔除NH3-N,选择其余6项指标作为输入因子,DO为输出项构建预测模型,可减少数据冗余,提升模型适用性与预测可信度。

3.2 溶解氧预测结果分析
本研究对比LSTM、GRU和SSA-LSTM模型对DO的预测效果(图5),并评估人工神经网络模型在水质预测中的性能(图6)。结果显示,3种模型整体预测趋势与实测值基本一致,均具备水质动态预测能力,但存在细节波动误差。其中,LSTM模型训期拟合较好,测试期误差较大,在实际值波动区域偏差明显。GRU模型预测精度优于LSTM,能捕捉真实值波动特征,但对波峰、波谷预测仍有不足。SSA-LSTM模型训练期及测试期拟合效果均优于前两个模型,R2更高,在数据波动区模拟效果更好,预测精度显著提升,验证了算法改进的有效性。研究表明,人工神经网络可通过多层非线性函数映射建立输入参数与DO的高精度关联,其中SSA-LSTM凭借参数优化机制,强化了模型的泛化能力与鲁棒性,为水质实时监测提供了可靠预测工具。


3.3 模型评价结果的对比分析
为评估人工神经网络模型对DO的预测性能,本研究对比了LSTM、SSA-LSTM和GRU模型的拟合效果与泛化能力。由表4可知,传统LSTM训练集RMSE和MAE分别为0.80mg·L-1和0.53mg·L-1(R2=0.92),测试集误差显著升高(RMSE=1.30mg·L-1、MAE=0.93mg·L-1,R2=0.73),存在过拟合;GRU模型精度优于LSTM(训练集RMSE=0.70mg·L-1、MAE=0.45mg·L-1,R2=0.91;测试集RMSE=0.92mg·L-1、MAE=0.65mg·L-1,R2=0.81),但仍低于SSA-LSTM模型。SSA法优化后的LSTM模型表现最佳,训练集RMSE和MAE分别为0.34mg·L-1和0.66mg·L-1(R2=0.93),测试集上RMSE和MAE分别为0.39mg·L-1和0.60mg·L-1(R2=0.94),误差降低且R2最接近1,其参数与网络结构优化有效提升了模型稳定性与预测精度。结合图5与表4,SSA-LSTM在波峰波谷处的预测趋势与真实值高度一致,验证其在复杂水质波动场景的优越性,为DO动态预测提供更可靠方案。





2021—2023年渭河关中段水质整体稳定,WQI优良率超97%,时空分布呈“上游优于中下游”“夏季较差”特征,NH3-N和TP波动显著。基于DO与水温等各因子相关性,对比LSTM、GRU及SSALSTM 3种模型发现,SSA-LSTM可克服过拟合,R2近0.95,为DO最优预测模型。本研究阐明水质时空演变驱动机制、构建高精度预测模型,可为流域水质动态监测预警、重点因子管控提供支撑,助力黄河流域生态保护与高质量发展。


