金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111103158.8 (22)申请日 2021.09.18 (71)申请人 陇东学院 地址 745000 甘肃省庆阳市西峰区兰州路 45号陇东学院 (72)发明人 唐兆民 唐启师 唐鑫钊 王玉玲  (74)专利代理 机构 青岛致嘉知识产权代理事务 所(普通合伙) 3723 6 代理人 高维波 (51)Int.Cl. G06F 30/27(2020.01) G06K 9/62(2022.01) G06N 20/20(2019.01) G06Q 10/04(2012.01) (54)发明名称 一种基于地理信息的污染物在线监测系统 (57)摘要 本发明公开的一种基于地理信息的污染物 在线监测系统, 是一种改进的集成学习方法S ‑ MStacking, 通过交叉验证的思想将训练数据集 划分为多个训练子集, 依次利用训练子集训练得 到多个基础学习器; 然后利用改进选择集成方法 对参与集 成的基础学习器进行选择; 利用多目标 优化算法MOBA在新的基础学习器集合中选择参 与最终集成的基础学习器; 利用改进Stacking集 成策略MStacking对选择出基础学习器进行集 成。 基于S ‑MStacking集成方法建立空气污染物 浓度预测模型, 以PM2.5浓度为预测目标, 设置 单 一模型对比实验和不同集成方法对比实验验证 本文提出的改进的集成方法的有效性, 表明利用 所提出的方法构建的模型在预测准确性和稳定 性上都有一定程度的提升 。 权利要求书1页 说明书8页 附图1页 CN 113987912 A 2022.01.28 CN 113987912 A 1.一种基于地理信息的污染物在线监测系统, 其特 征在于, 包括: 数据分析与预处理模块, 用于描述研究数据, 完成数据分析, 进行数据预处理, 执行特 征工程; 模型建立模块, 基于  S‑MStackin g 集成学习方法构建预测模型, 生成并选择基础 学习 器, 集成所述基础学习器; 分析评价模块, 完成MEIC  清单模拟结果分析、 本地清单模拟结果分析并获取污染物空 间分布特 征。 2.如权利要求1所述的一种基于地理信 息的污染物在线监测系统, 其特征在于, 上述数 据分析与预 处理模块, 用于描述研究数据, 完成数据分析, 进 行数据预 处理, 执行特征工程, 还包括: 上述描述研究数据获取获温度、 露点、 湿度、 风向、 风速和气压和天气条件的逐时数据; 在建模之前需要将两部分数据合并在同一个数据集中, 其中以两个数据集中相同的特 征意义的“Date”和“Time”为关键字, 以行为单位按照列合并数据集, 将缺少的数据用空值 代替, 同时将数据集中无关的特征删除, 得到最终特征为  PM2.5、 PM10、 NO2、 SO2、 O3  和 CO  的逐时浓度以及  Temperature、 Dew  Point、 Humidity、 Wind  Speed 和 Pressure  的逐时数 据; 上述完成数据分析包括基于季节的数据分析、 基于小时的数据分析、 数据相关性分析; 所述进行 数据预处 理包括数据清洗, 数据归一 化; 所述执行特征工程包括特 征构建和特 征选择。 3.如权利要求1所述的一种基于地理信 息的污染物在线监测系统, 其特征在于, 上述模 型建立模块, 基于  S‑MStacking  集成学习方法构建预测 模型, 生成并选择基础学习器, 集 成所述基础学习器, 还 包括: 基础学习器的生成, 通过交叉验证的思想对训练集数据进行划分, 针对每个训练子集 分别用不同的基础学习算法训练得到多个 基础学习器; 基础学习器选择, 利用  K‑Means 聚类方法对生成的多个基础学习器进行 聚类, 然后从 聚类结果中删减部 分相似性较强的基础学习器形成新的基础学习器集合, 最后基于多目标 蝙蝠算法 MOBA 选择部分基础学习器参与最终集成; 基础学习器集成, 基于传统的  Stacking  集成策略对元学习器的输入特征进行特征重 构得到改进集成策略  MStacking, 采用  MStacking  集成策略对参与最终集成 的基础学习 器进行集成。 4.如权利要求1所述的一种基于地理信息的污染物在线监测系统, 其特 征在于, 上述分析评价模块, 完成MEIC  清单模拟结果分析、 本地清单模拟结果分析并获取污染 物空间分布特 征, 还包括: 所述MEIC  清单模拟结果分析包括基准情景和控制情景下  PM10浓度对比, 基准情景和 控制情景 下 PM2.5浓度对比, M EIC 清单基准情景与控制情景 下日均值变化; 所述本地清单模拟结果分析包括基准情景和控制情景下  PM10浓度对比, 基准情景和 控制情景 下 PM2.5浓度对比, 本地 化清单基准情景与控制情景 下日均值变化; 所述获取污染物空间分布特征包括利用本地化排放源清单模拟的基准情景和控制情 景下的颗粒物空间分布进行对比分析。权 利 要 求 书 1/1 页 2 CN 113987912 A 2一种基于地理信息的污染物在线 监测系统 技术领域 [0001]本发明属于计算机领域和地理信息领域的交叉融合, 具体的, 涉及一种基于地理 信息的污染物在线监测系统。 背景技术 [0002]随着经济规模的不断扩大和城市化进程的加快, 对能源和 资源的需求不断增长, 我国大气 污染问题日益突出, 呈现出以PM2.5和O3为特征污染物的区域大气复合污染特征。 众多研究表明, 人为或自然排放的颗粒物(PM)是造成我国北方大气污染的主要原因之一, 更是造成雾霾天气的主要污染物。 受区域气候、 气象条件、 排放量空间分布和地形条件等综 合因素影响, 各地区大气 污染特征及污染成因差异明显, 运用观测和数值模拟的方法, 研究 区域大气污染成因是 科学制定污染减排措施、 持续改进环境空气质量的基础。 [0003]近年来, 随着人工智能技术的逐步成熟, 机器学习模型在学习复杂问题上已经取 得了巨大 的成功, 多数机器学习模型应用在空气污染物浓度预测研究工作中, 但是 由于空 气污染物浓度具有非平稳性的特点, 导致使用单一的机器学习模型无法得到较为准确的预 测结果并且模型的预测缺乏稳定性。 集成学习方法思想的提出解决了单一模型预测准确性 和稳定性低的问题, 集成学习方法主要是生成大量的基础学习器并通过集成策略对基础学 习器的输出结果进行集成。 虽然集成学习 可以有效地提升模型预测的准确 性和稳定性, 但 是当大量参与集成的基础学习器预测结果相似时, 会导致模型的预测性能提升效果不佳; 同时若选择性能较差的集成策略对基础学习器的结果进行集成, 也会对模 型的预测结果有 一定的影响。 利用集成学习方法进行建模可以得到准确 性较高的预测结果, 但是集成学习 模型多数都是 “黑盒模型 ”, 即给出模型的输入得到与之对应的输出, 并没有任何的依据可 以证明得到的输出是可信的。 这使得大多数人对于集成模型 的预测结果产生质疑, 使得集 成预测模型的应用饱受 争议。 发明内容 [0004]为解决当前机器学习模型进行空气污染物预测时的问题, 本发明请求保护一种基 于地理信息的污染物在线监测系统, 其特 征在于, 包括: [0005]数据分析与预处理模块, 用于描述研究数据, 完成数据分析, 进行数据预处理, 执 行特征工程; [0006]模型建立模块, 基于S ‑MStacking集成学习方法构建预测模型, 生成并选择基础学 习器, 集成所述基础学习器; [0007]分析评价模块, 完成MEIC清单模拟结果分析、 本地清单模拟结果分析并获取污染 物空间分布特 征。 [0008]进一步地, 上述数据分析与预处理模块, 用于描述研究数据, 完成数据分析, 进行 数据预处 理, 执行特征工程, 还 包括: [0009]上述描述研究数据获取获温度、 露点、 湿度、 风向、 风速和气压和天气条件的逐时说 明 书 1/8 页 3 CN 113987912 A 3

.PDF文档 专利 一种基于地理信息的污染物在线监测系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于地理信息的污染物在线监测系统 第 1 页 专利 一种基于地理信息的污染物在线监测系统 第 2 页 专利 一种基于地理信息的污染物在线监测系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:41:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。