基于大数据的广西碳排放智能预警预报方法研究

申报人：周国富申报日期：2025-04-30

基本情况

所属批次:

2025年批次

项目名称:

基于大数据的广西碳排放智能预警预报方法研究学生申报

项目类型:

创新训练项目

所属学科门类:

工学

所属专业类:

环境科学与工程类

项目来源名称:

学生来源于教师科研项目选题

项目归属学院:

项目期限:

一年期

项目简介:

通过卫星遥感数据、交通流量数据、工业生产统计和能源消耗记录等综合数据，研究者能够更全面地分析碳排放的根源和趋势。提取有价值的信息，如关键影响因素、碳排放热点区域等，为后续研究提供支持。通过聚类分析、分类分析等方法，识别碳排放的时空分布特征，以及碳排放的关键影响因素。利用回归分析、时间序列分析等方法，建立碳排放预测模型，并进行验证，以实现对未来一段时间内的碳排放进行预测和预警。本项目旨在建立一套综合的预警指标体系，涵盖碳排放量、能源效率和碳汇变化等关键指标。优选机器学习算法，包括随机森林、XGBoost、深度学习网络、支持向量机等，进行组合开发，以构建碳排放智能预警预报模型。通过对历史数据的学习，训练和优化模型，以提高预测的准确性和稳定性，并实现模型训练与优化：使用交叉验证、网格搜索、留出法和时间序列分割等技术，优化模型参数，以提高模型的预测性能。通过对模型进行训练和验证，不断调整和优化模型，以提高模型的适应性和鲁棒性。

负责人曾经参与科研的情况:

无

指导教师承担科研课题情况:

[1]气溶胶云下雨洗过程中的动力学机制研究，国家自然科学基金面上项目（41275157, 2013.01-2016.12），参与.

[2]基于多源卫星遥感的新疆地面太阳辐射及其主要环境气象影响因子研究，国家自然科学基金面上项目（ 41375021 ，2014.01-2017.12），参与.

[3]室内环境中的霾污染延迟效应研究，国家自然科学基金面上项目（51578121，2016/01-2019/12），参与.

[4]厌氧氨氧化工艺的固碳潜力及机理研究，国家自然科学基金地区基金(51668013，2016/09-2019/12)，参与.

[5]人工增雨对霾的清除预测模型研究，广西中青年教师基础能力提升项目( 2017KY0261，2017/05-2019/12) ，主持.

[6]湿沉降清除多分散气溶胶参数化研究，广西自然科学基金青年基金(2018GXNSFBA281082，2019/01-2021/12) ，主持.

[7]沸石-MSiO2-双功能化胺基杂化体增强CO2 捕集机理研究，国家自然科学基金地区基金(51966002，2020/01-2023/12) ，参与.

[8] 多物理场协同作用下云下雨洗对广西大气颗粒物捕集机理研究，广西自然科学基金面上项目（2024GXNSFAA010159，2024/05-2027/04），主持.

[9]基于大数据的广西碳排放智能预警预报算法模型系统研究与开发，广西数字基础设施重点实验室开放课题（GXDIOP2024014，2024/08-2026/07），参与.

指导教师对本项目的支持情况:

项目选题阶段，指导教师充分发挥专业优势，为学生提供了有研究价值和实际应用前景的选题建议。在学生确定研究方向后，指导教师针对选题进行了深入剖析，帮助学生明确研究目标和研究内

容。

在项目实施过程中，指导教师会密切关注项目进度，定期与学生沟通，了解项目进展情况。针对项目中遇到的问题和困难，会及时给予指导和帮助，确保项目顺利进行。同时注重培养学生的创新

能力和实践能力，鼓励学生自主探索和解决问题。对项目成果的质量严格把关，要求学生按照规范撰写项目报告，确保项目成果的完整性和准确性。

项目级别:

区级

项目成员

序号	学生	所属学院	专业	年级	项目中的分工	成员类型
1	周国富	环境科学与工程学院	给排水科学与工程	2023	组织协调，安排进度	第一主持人
2	俞莉玲	环境科学与工程学院	给排水科学与工程（创新班）	2023	分析数据	成员
3	邹如涛	环境科学与工程学院	给排水科学与工程	2024	分析数据	成员
4	彭馨怡	环境科学与工程学院	环境工程（实验班）	2022	收集数据	成员
5	罗悦瑄	环境科学与工程学院	环境工程（实验班）	2022	协助安排	成员

指导教师

序号	教师姓名	所属学院	是否企业导师	教师类型
1	王洪强	环境科学与工程学院	否	第一指导教师

立项依据

研究目的:

气候变化问题已经成为国际社会关注的焦点。随着全球气候变暖的加剧，极端天气事件、海平面上升等气候变化的负面影响日益严重，对人类社会和自然生态系统构成了严重的威胁[1-6]。为应对气候变化的挑战，全球各国都在努力采取行动，以减少温室气体排放，实现低碳发展。我国作为全球最大的碳排放国，承担着巨大的国际责任和压力。已承诺在2030年前达到碳排放峰值，并争取在2060年前实现碳中和。然而，碳减排面临着诸多挑战，包括碳排放的监测、预测和预警等方面的难题。大数据技术和人工智能算法在碳排放领域的应用，为解决碳排放问题提供了新的思路和方法。本研究紧跟学科前沿，将大数据技术和人工智能算法应用于广西碳排放预测和预警，具有较高的创新性和前瞻性。参考文献：

[1] 谢品杰, 解玉文, 杨帆. 经济周期视角下的中国碳排放强度影响因素研究 [J]. 生态经济, 2024, 40(05) : 13-20+38.

[2] 许嘉俊, 杨晓军, 李睿. 城市居民生活碳排放及影响因素的时空异质性 [J]. 中国环境科学, 2024, 44(03) : 1732-1742.

[3] 徐坚, 张蓝天, 钱宇佳. 基于STIRPAT模型的民用建筑碳排放影响机理分析及预测研究 [J]. 环境科学与管理, 2024, 49(03) : 39-44.

[4] Jiang K., Yu H., Sun Z., et al. Zero-Emission Cement Plants with Advanced Amine-Based CO(2) Capture [J]. Environ Sci Technol, 2024, 58(16) : 6978-6987.

[5] Kang J., Ng T. S., Su B., et al. Optimizing the Chinese Electricity Mix for CO(2) Emission Reduction: An Input-Output Linear Programming Model with Endogenous Capital [J]. Environ Sci Technol, 2020, 54(2) : 697-706.

[6] Turnbull J. C., Karion A., Davis K. J., et al. Synthesis of Urban CO(2) Emission Estimates from Multiple Methods from the Indianapolis Flux Project (INFLUX) [J]. Environ Sci Technol, 2019, 53(1) : 287-295.

研究内容:

（1）对广西排放大数据收集与处理，将处理后的数据进行大数据分析，相关性分析，利用回归分析、时间序列分析等方法，建立碳排放预测模型。

（2）智能预警预报算法优选、组合与开发，结合广西地区碳排放的特点，得出最适合广西地区碳排放预测的算法。

（3）碳排放预警预报模型应用与评估，利用构建好的预测模型，对广西地区进行碳排放预测，得出预测数据并与实际数据对比，优化与改进预测模型。

国、内外研究现状和发展动态:

1. 碳排放监测

碳排放监测主要是通过综合观测、统计分析和数值模拟等多种手段，获得已知温室气体准确的排放浓度、排放量和碳汇状况信息，从而进一步开展气候变化应对研究及管理等相关工作，主要监测对象为《京都议定书》和《多哈修正案》中规定控制的7种人为活动排放的温室气体，包括CO2、CH4、N2O、HFCs、PFCs、SF6和NF3[7]。

当前，美国采用的是较灵活的碳排放管理政策，美国燃煤发电机组必须采用（Continuous Emission Monitoring System）CEMS监测CO2排放，燃气或燃油可采用CEMS监测或燃料计算法，若排放量较低还可采用排放因子法。为获得准确的CO2排放参数，美国相关法规对CEMS装置构成提出了明确要求，主要包括浓度检测设备、烟气流量检测设备、取样设备、数据采集和控制系统、自动数据采集和处理系统。美国采用CEMS设备进行碳排放监测的方式普及率较高。图1为美国碳排放自动监测与碳排放核算关系图。

图1 美国碳排放自动监测与碳排放核算关系

欧盟火电行业碳排放量核算采用计算法和实测法，数据计算方法采用排放因子法和在线监测法。欧盟对CEMS数据做了明确规定，选取不确定度作为反应数据质量的指标，同时根据电厂年度CO2排放量确定数据质量等级，质量等级分为4级，排放量越少层级越低，数值质量要求越低。

我国碳排放监测开展较晚， 2021年9月，生态环境部发布《碳排放监测评估试点工作方案》，在全国范围内确定了上海、唐山等16个城市及火电、钢铁、石油天然气开采、煤炭开采和废弃物处理五类重点行业，开展温室气体试点监测，探索建立碳排放监测评估技术方法体系。当前我国碳排放核算方法主要是物料核算，2020年发布的《发电企业碳排放权交易指南》（DL/T 2126-2020），已经涵盖了在线监测法和物料衡算法两种方法。当前我国已建成16个国家级背景监测站，以CO2、CH4监测精度能够达到WMO/GAW计划中提出的全球本底观测要求为目标，对具备条件的站点（包括四川海螺沟，山东长岛等5个）实施温室气体检测系统的省级改造工作，进一步提升温室气体监测能力。随着“双碳”战略的提出，国内多家公司已经布局碳监测相关业务。目前已自主研发了碳排放在线监测系统，包括RJ-GHG碳排放连续在线监测分析系统、RJ-Carbon实时碳排放综合检测仪、Gasboard-3000 GHG型温室气体排放分析仪等，可以准确测量温室气体数据。

目前，地面测站如全球大气监测网（GAW）提供了关键的二氧化碳和甲烷浓度测量数据。碳排放监测的传统方法依赖于地面测站和排放因子的统计数据，这些数据通常涉及大量的人工收集和较低的更新频率。随着技术的发展，遥感技术已经成为碳排放监测的重要手段。特别是卫星遥感技术，如NASA的OCO-2（Orbiting Carbon Observatory 2）和OCO-3项目，这些卫星搭载的高精度光谱仪可以定量测量地球大气中的二氧化碳浓度，提供了全球尺度的碳排放动态数据。此外，欧洲空间局（ESA）的哥白尼计划通过Sentinel卫星系列同样为环境和气候监测提供了宝贵的数据资源。这些数据帮助科学家们在全球尺度上理解碳循环的动态变化。另外，空中测量，包括无人机和飞机搭载的传感器，能够在特定地区进行详细的碳排放监测，这对于理解城市和工业区的碳排放特别重要。

2. 大数据与碳排放数据分析

随着大数据技术的发展，碳排放研究开始利用复杂的数据集，这些数据集涵盖从交通流量、工业活动到能源消耗等多种因素。研究者利用这些大数据资源，通过高级数据分析技术如数据挖掘和统计学方法，进行碳排放模式的识别和分析。You等[8] 使用增广均值群(AMG)估计量和均值群(MG)估计量对2000年至2021年间64个“一带一路”倡议经济体的数据进行分析，研究了全球信息通信技术（ICT）、可再生能源消耗(REC)、人力资本(HC)和经济增长(EG)对CO2排放的影响。结果表明，ICT、HC和REC的使用与CO2排放呈负相关，而EG与CO2排放呈正相关。EG与ICT、REC和HC的交互项对“一带一路”经济体的CO2排放有负向影响。此外， ICT、REC和人力资本都是双向影响CO2排放的因果关系。为了减少能源利用和促进经济增长，研究结果强调了在工业部门实施尖端ICT和REC的重要性。

水产养殖场是碳循环和CO2和CH4等温室气体排放的潜在热点，但它们在全球温室气体预算中的评估往往很差。Yang等[9]研究了2017-2021年5年中国东南部沿海水产养殖场CO2和CH4浓度、扩散通量的时间变化及其环境驱动因素。结果表明，养殖池塘CH4通量的年际波动显著，CO2通量的年际变化在正负之间。CO2和CH4扩散通量的年际变化系数分别为168%和127%。除叶绿素-a和溶解氧是共同的环境驱动因子外，CO2还受溶解总磷和溶解有机碳的调节。根据CO2浓度计算的逐月(平均)CO2扩散通量数据进行线性回归，可用于估计CH4扩散通量，具有相当置信度(R2 = 0.66；P < 0.001)。该算法为水产养殖池塘碳扩散通量的估算提供了一种简单实用的方法。Xu等[10]使用动态STIRPAT模型分析了1975年至2020年八个人口最多的国家的数据，揭示了城市化路线(城市化总百分比、小城市百分比和大城市百分比)对二氧化碳排放的非线性影响。利用动态显示不相关回归(DSUR)和完全修正普通最小二乘(FMOLS)回归，结果表明总城市化比例和小城市比例对二氧化碳排放的影响是增量的。然而，小城市的平方百分比和总城市化的平方百分比对二氧化碳排放有显著的不利影响。小城市比例、城镇化总比例与二氧化碳排放呈正相关，而小城市比例、城镇化总比例与二氧化碳排放呈正相关。大城市百分比对二氧化碳排放的影响显著为负，而大城市平方百分比对二氧化碳排放的影响显著为正。能源强度、国内生产总值(GDP)、工业增长和交通基础设施都会刺激长期二氧化碳排放。Dumitrescu和Hulin因果关系检验表明，二氧化碳排放量与总城市化百分比的平方、大城市百分比与二氧化碳排放量、能源强度与二氧化碳排放量之间存在双向因果关系。Tang等[11] 从系统的角度研究了城市居住建筑的CO2减排潜力，认为是实现城市碳中和目标的必要条件，并建立了一个包含4个建设阶段的系统动力学模型框架，模拟了到2060年3种情景下江西省城市居住建筑碳排放变化及其减排潜力。结果表明，在3种情景下，整个过程碳排放动态在2014年已经达到峰值，峰值为3852 Mt，然后下降到2060年的956 Mt。四项建筑活动中采用了七项碳减排措施，总减碳量并不是单个措施减碳潜力的总和。一些碳减排策略表现出协同效应，如低碳电气化，电气化与清洁能源发电相结合是建筑运行过程中碳减排的最大贡献，是一种综合碳减排措施。相比之下，延长建筑物的使用寿命限制了拆除阶段的碳减排潜力，并抑制了2484万吨的碳减排。这些结果突出了清洁生产的有效政策干预的必要性，以及改善装配式建筑比例、促进电气化、提高能源效率、加强回收实践的必要性。并延长建筑寿命，促进城市住宅建筑体系的脱碳发展。Silva等[12]研究评价了土壤CO2排放(FCO2)与森林系统的关系，表明原生林转换为银林系统，FCO2值减少了36%，而原生林转换为桉树系统，FCO2值增加了19%，森林系统有助于土壤碳的连续积累和稳定。火电企业排放的二氧化碳是全球气候变化的主要原因，也是中国实现“碳峰值和碳中和”目标的关键挑战，Shi等[13]研究了甘肃省17家火电企业的碳核查数据，运用因子分析法提取影响CO2排放的常见因素。利用DISO(模拟指标与观测指标之间的距离)指标对多元线性回归、支持向量回归和GA-BP神经网络三种预测模型进行综合评价。结果表明，因子分析得到的三个常见因子，即能耗与输出因子、能源质量因子和能效因子，能够有效预测火电企业CO2排放量。在三种预测模型中，GA-BP神经网络的综合性能最好，DISO值为0.95，RMSE值为11848.236，MAE值为7880.543。预计2022-2030年，甘肃省17家火电企业CO2排放量将有所增加。在低碳、情景基线和高碳情景下，到2030年，二氧化碳排放量将分别达到7158万吨、79.25万吨和87.97万吨。喀斯特水-空气界面高频率CO2排放的幅度、动态及其影响因素，对于准确评估喀斯特环境的碳收支至关重要。Li等[14] 于2021年1 - 12月开展多参数高频监测研究，探究了喀斯特水体CO2排放的主要影响因素，采用薄边界模型方法估算水-气界面(CF) CO2通量。DLD水库年平均通量为84.48 mmol/(m2h)，总体上为CO2源。而在8月分层期，由于CO2负排放，存在暂态碳汇。水体热分层的变化在调节CF的季节变化中起着至关重要的作用，同时，热分层阶段水化学参数的变化对CF的日变化有显著影响。与低风速(<3 m/s)相比，高风速(>=3 m/s)对CO2通量的影响更大。此外，高频连续数据显示，水库在翻转过程中触发了CO2脉冲发射，主要是在夜间，导致CO2通量值异常高。这些研究有助于提高区域或流域碳预算的准确性。高等[15]以2003—2017年广西县级碳排放数据（GDP、人口、第二产业占比、经济水平、技术水平），进行广西碳排放量、碳排放强度及碳排放压力的时空变化预测分析，王等[16]结合广西发展特征以2005—2020年广西经济社会环境发展数据为基础，利用拓展的STIRPAT模型从经济因素、人口因素、结构因素、技术因素4个方面对广西碳排放影响因素进行分析。结果表明，人口规模与人口结构对广西碳排放的促进作用最为显著，人口规模与人口结构每增加1%，碳排放量将增加0.401%、0.199%。人均GDP、第二产业产值、进出口总额的增长均会显著促进碳排放，根据环境库兹涅茨曲线，广西经济发展程度仍处于转折点之前。研究与试验投入、研究与试验人员是对碳排放贡献率最大的因素，贡献率分别为16.81%和14.51%，是减少广西地区碳排放的重要工作方向。吴等[17] 采用国家统计数据和遥感夜间灯光数据，通过对数平均迪氏指数对15个典型城市的碳排放影响因素进行贡献率分析，并构建了3组变量用于机器学习ridge和Lasso回归模型的预测分析。结果表明，城市生产总值、能源消费量、人口、房地产开发施工面积、夜间灯光强度、货物运输量和旅客运输量等7个因子对CO2排放起促进作用，能源消费结构和第三产业占比对CO2排放起抑制作用。城市的成熟度越高，产业越丰富，则碳排放的影响因子越多样。上述研究可为本项目实时预警预报研究提供借鉴。

大数据技术使得来自不同源的数据（如卫星遥感数据、交通流量数据、工业生产统计和能源消耗记录）可以被整合和分析。通过这些综合数据，研究者能够更全面地分析碳排放的根源和趋势。例如，使用机器学习方法，可以在海量数据中识别出影响碳排放的关键因素，从而为政策制定提供支持。数据挖掘技术在碳排放研究中的应用主要包括分类、聚类和关联规则学习等。通过这些技术，可以识别出碳排放与其他变量之间的复杂关系和模式。机器学习方法，尤其是监督学习和无监督学习，已被广泛应用于预测模型的构建，能够基于历史数据预测未来的碳排放趋势。

3．碳排放智能预警预报研究

人工智能技术，尤其是机器学习和深度学习，已经被广泛应用于碳排放的预测和预警系统中。这些技术能够处理和分析大规模复杂数据集，识别出碳排放的模式和，实现对异常碳排放事件的即时预警，从而为政策制定者和环境管理者提供实时决策支持。基于大数据的预测模型正在改变碳排放管理。这些模型利用历史数据来预测未来的碳排放趋势，帮助政策制定者和企业制定更有效的减排策略。

家庭消费产生的CO2占中国温室气体排放总量的52%，Ren等[18]对中国家庭CO2排放量进行了微观估算，运用极大似然和结构方程模型探讨了居民消费模式转变与人均HCEs之间的动态关系。结果表明，某一年的人均HCE水平似乎与前一年同一家庭的HCE水平呈正相关。消费模式转变与人均HCEs呈u型关系，收入对消费模式转变的影响具有强化作用。消费倾向、家庭收入、工资收入份额、家庭资产价值和住房面积的增加导致人均HCEs增加。家庭规模和抚养比与HCE呈负相关，而以女性为主导且更依赖互联网的家庭倾向于产生更多的CO2。环境经济学家试图研究外国直接投资与增长关系的影响，但他们忽视了金融发展和技术创新所起的关键作用。Mngumi等[19]使用1990年至2021年的数据研究了金砖国家碳排放与外国直接投资、技术创新和经济增长等因素之间的关系。根据增强平均组(AMG)估计，金砖国家的金融发展、技术创新和外国直接投资都与CO2排放呈负相关，且在统计上具有显著的长期相关性。另一方面，经济增长、TI、IND和能源使用都与碳排放呈显著正相关。经济增长(EG)、数字经济增长(DEG)、金融效率(FE)、CO2排放(CO2)、工业化(IND)、技术创新(TI)、外国直接投资(FDI)和通货膨胀都被认为具有双向的长期因果关系。相反，FDI与CO2排放之间存在单向因果关系。为了吸引高质量的外国直接投资，金砖国家成员国必须推进其工业、金融机构和技术创新。此外，这些国家需要立即通过立法解决问题，因为IND是造成环境破坏的一个主要原因。垃圾发电(WtE)技术是通过大规模焚烧和能源回收管理不可回收废物的最有效解决方案。由于中国的工业固体废物(ISW)中含有大量塑料，在焚烧过程中产生了大量温室气体(GHG)。因此，监测垃圾焚烧设施的温室气体排放至关重要。由于缺乏合适的会计模型和特征化石碳分数(FCF)数据，目前的研究使用政府间气候变化专门委员会(IPCC)提供的默认值，这增加了计算的不准确性。Liu等[20]首先利用加速器质谱(AMS)技术测定中国固体废物组分的FCF，建立了一种精确计算固体废物焚烧过程中碳排放的改进方法。采用蒙特卡罗分析进行敏感性分析，结果表明，纸张、棉花、合成纺织品、人造橡胶、人造革、塑料的FCF实测值与IPCC的默认值存在显著偏差，分别为3.2%、32.48%、93.39%、93.76%、90.49%和93.8%。Ko等[21]调查了2020年韩国西海岸近岸水域的碳酸盐体系和海气CO2交换。考虑到黄海东南部的大气-海洋CO2通量与陆地、近海区域和沉积物的相互作用，忽略这些水域可能会在估计黄海东南部的大气-海洋CO2通量时产生重大误差。在夏季以外的时期，海水CO2分压的季节变化一般可以用热效应来解释。与近海地区相比，潮汐混合和浅深度导致的分层诱导碳输出较弱。然而，在夏季，近海水域的CO2分压表现出较高的空间变异性，范围约为185至1000μatm。与近海水域适度吸收CO2相比，浅于20米的近海水域向大气排放约100 Gg C /年。然而，考虑到研究区域的高度异质性，需要额外的高时空分辨率观测来完善海气CO2交换的估算。Amin等[22]探讨了CO2排放与其他重要相关指标之间的关系，并评估不同模型预测的准确性。采用广义加性模型(GAM)、多项式回归(PR)和多元线性回归(MLR)对CO2排放进行建模。采用贝叶斯信息准则(BIC)、赤池信息准则(AIC)、均方根误差(RMSE)、R方和均方误差(MSE)对模型性能进行评价。结果表明，数据集很少存在多重共线性问题，CO2排放量之间呈现非线性关系。GAM模型相对于MLR和PR模型RMSE = 0.008, MSE = 0.000063, AIC = -303.21, BIC = -266.64的RMSE值最低，R²= 0.996的R²值最高，表明GAM模型是预测孟加拉国CO2排放最合适的模型。研究结果表明，CO2排放总量与其他相关危险因素呈非线性关系。

3.1 数据挖掘与机器学习算法

数据挖掘技术在碳排放智能预警预报研究中具有重要意义。通过对大量碳排放数据的挖掘，可以揭示碳排放的时空分布特征、影响因素及演变规律。常用的数据挖掘方法包括关联规则挖掘、聚类分析和时间序列分析等。

机器学习算法在碳排放智能预警预报研究中具有广泛的应用。常见的机器学习算法包括神经网络、支持向量机、随机森林和梯度提升机等。神经网络具有强大的非线性拟合能力，适用于复杂关系的建模。支持向量机具有良好的泛化性能，适用于小样本问题的建模。随机森林和梯度提升机具有集成学习优势，可以有效地提高预测准确性。机器学习和深度学习方法已被广泛应用于碳排放数据的分析和预测。这些技术可以处理复杂的非线性关系，提高预测模型的准确性。Lei等[23]基于2003 - 2019年中国281个地级市的碳排放数据与火电站位置和夜间照明数据的匹配，分析了中国281个地级市碳排放的驱动因素。比较了多元线性回归和随机森林模型的精度，发现随机森林模型具有更好的结果。使用随机森林方法对各种因素的影响进行排序，发现人口、经济发展和工业化是前三位的影响因素。人口与经济发展之间的相互作用解释了68.5%的碳排放，影响因素的排名存在区域差异。研究表明不必过分关注人口增长对碳排放的影响，生育政策可以灵活调整，在一定程度上控制城市化有利于实现高效低碳城市，在工业化过程中，碳排放不可避免地增加，宜加快工业化进程，尽快达到拐点。Zheng等[24]使用STIRPAT-Kaya-EKC模型研究了分类能源使用与CO2排放之间联系的阈值影响。研究结果表明，技术对能源使用与碳排放之间的关系具有阈值影响，然而这种影响因行业而异。Zheng等[25]采用自下而上的能源模型，评估了2035年前中国在高投资情景(HIS)、中等增长情景(MGS)和创新驱动情景(IDS)下的未来能源消耗和CO2排放趋势。这些数据还用于预测最终部门的能源消耗和CO2排放趋势，并计算每个部门的缓解贡献。主要研究结果如下：在HIS下，中国将在2030年达到碳排放峰值，达到12.0 Gt CO2。适度降低经济增长速度，通过促进低碳产业发展，加快低碳关键技术应用，提高能源效率，优化最终产业能源结构，支持经济低碳转型，大湾区和中下游地区将在2025年左右达到碳峰值，大湾区和中下游地区的峰值分别为10.7 Gt CO2和10.0 Gt CO2。Singh等[26]使用EGM (1,1, alpha, theta)灰色模型预测了六个最重要的CO2贡献国(即中国、美国、印度、俄罗斯、日本和德国)的地表温度和CO2排放量的增加。该研究使用了2010年至2020年的地表温度(以摄氏度为单位)的时间序列数据，以及2009年至2019年的CO2排放量(人均公吨)数据。结果表明，到2028年，日本、德国、美国和俄罗斯的CO2排放量呈下降趋势。然而，在同一时期，预计印度的CO2排放量将增加，而中国的排放量几乎保持不变。研究将EGM (1,1, alpha, theta)灰色模型与一般的EGM(1,1)灰色模型进行了比较，发现EGM (1,1, alpha, theta)模型在样本内和样本外预测方面都有更好的表现。Kumari等[27]基于1980 - 2019年的单变量时间序列数据，通过对未来10年CO2排放量的预测来呈现印度的有害CO2排放效应。使用了三种统计模型，自回归积分移动平均(ARIMA)模型、季节性外生因素自回归积分移动平均(SARIMAX)模型和Holt-Winters模型，即线性回归和随机森林模型和基于深度学习的长短期记忆(LSTM)模型。性能分析表明，在基于9个性能指标的6个模型中，LSTM、SARIMAX和Holt-Winters是最准确的3个模型。结果表明，LSTM模型的MAPE值为3.101%，RMSE值为60.635，MedAE值为28.898，具有较好的预测CO2排放的性能指标。基于深度学习的LSTM模型被认为是最适合CO2排放预测的模型之一。土壤CO2排放(FCO2)是全球碳循环的重要组成部分，但由于土壤CO2的时空变异性较大，因此具有很大的不确定性。土壤呼吸模拟可以大大有助于减少与土壤中碳源和碳汇有关的不确定性。Canteral等[28]比较了5种机器学习(ML)模型来预测桉树(RE)、松树(RP)和本地物种(RNS) 3个再造林地区FCO2的时空变化。该研究还包括一个广义情景(GS)，其中所有来自RE, RP和RNS的数据都包含在一个数据集中。机器学习模型包括广义回归神经网络(GRNN)、径向基函数神经网络(RBFNN)、多层感知器神经网络(MLPNN)、自适应神经模糊推理系统(ANFIS)和随机森林(RF)。经过预处理，将32个变量精简成21个变量。将桉树、松树和本地物种的19个土壤性质和气候变量作为输入变量。得出RF是预测土壤呼吸对RE的最佳模型。

3.2 模型训练与优化

模型训练是碳排放智能预警预报研究的关键步骤。通过利用历史数据训练模型，可以获得碳排放预测的初步结果。然而，由于碳排放数据存在噪声和不确定性，模型训练过程中容易出现过拟合和欠拟合问题。为了提高模型性能，需要对模型进行优化。常见的模型优化方法包括交叉验证、网格搜索、留出法和时间序列分割等。Wu等[29]引入了深度学习机制提出了卷积神经网络(MHA-CNN)模型，通过有效的训练模型过拟合、特征提取和自监督学习的解决策略来获得对CO2排放性能指标的适应性。在使用8个影响变量对CO2排放性能指标进行多目标预测时，MHA-CNN模型比CNN模型和LSTM模型表现出压倒性的优势，凸显了MHA模块在多维特征提取方面的优势。此外，基于MHA分析的影响变量对CO2排放性能指标的贡献与地理分布分析具有较高的一致性，表明MHA模块在变量权识别和贡献剖析方面具有较好的能力。MHA-CNN模型的预测结果比CNN和LSTM模型的预测结果更准确，第三产业的增加和第一、第二产业的减少有利于碳低效排放地区全要素碳排放效率的提高和能源有效利用率的进一步提高。Singh等[30]比较了随机森林回归(RFR)、SARIMAX、Holt-Winters (H-W)和支持向量回归(SVR)四种预测方法对印度水稻作物CO2排放总量的预测效果，并提出一个有效的预测二氧化碳排放总量的模型。推断出H-W和SVR是预测水稻作物CO2排放总量的合适模型。为了对人工智能(AI)模型进行准确、快速的预测，输入特征的选择至少与模型的选择同样重要。Wen等[31]研究了输入特征选择对实际道路上行驶的轻型柴油车排放模型的影响。采用梯度增强回归(gradient boosting regression, GBR)模型对城市、郊区和高速公路上真实驾驶的柴油车的氮氧化物(NOx)、CO2排放和油耗进行了训练和预测。有10个特征与NOx模型相关，9个特征与CO2模型相关。对每个特征的重要性进行排序，并使用不同数量的特征作为输入来训练模型。NOx模型最重要的特征是质量空气流量、排气流量和CO2，而CO2模型最重要的特征是排气流量和质量空气流量。Peng等[32]探索使用基于数据分析的智能导航技术来减少道路网络上车辆的总体碳排放。基于遗传算法和粒子群优化增强支持向量回归实现了交通流预测方法，基于预测路况和车辆油耗构建了汽车尾气排放预测模型，基于空间优化动态路径规划算法构建了面向低碳排放的导航算法。结果表明，该方法可以显著降低道路网络中车辆的总体碳排放量。近年来，一些国家以不同的方式提出了采用绿色和可持续能源供应系统的各种模式，以优化水和能源的消耗，以减少水和能源的消耗和成本。Javanmard等[33]考虑了一个综合的、不集中的建筑水和能源消耗优化模型，并使用混合整数线性规划对其进行了经济和环境的研究。研究中收集了不同区段的数据，包括与气候条件、环境、成本、技术等相关的数据，使用12种高精度的机器学习算法来预测模型结果，并考虑四个指标来检查算法的预测准确性。通过对成本优化和碳减排目标函数所检测数据的算法指标进行考察，在12种检测算法中，Light Gradient Boosting Machine和Extra Tree算法的预测精度高于其他算法。为了分析结果，采用了主成分分析方法来降低算法的输入数据维数。算法的结果反映了降维后的预测精度下降。对两种目标函数分别采用逐步回归方法，给出了影响算法预测精度的有效变量。总体而言，算法的输出结果对于调查不同地理区域的模型条件具有较高的预测精度。

3.3 模型评估与验证

模型评估与验证是碳排放智能预警预报研究的重要环节。通过对模型预测结果与实际观测值进行比较，可以评估模型的预测性能。常用的模型评估指标包括均方误差、平均绝对误差和决定系数等。为了进一步提高模型性能，需要不断优化模型结构和参数，并进行迭代验证。Li等[34]使用了一套开放获取数据和机器学习方法来估计和预测中国城市层面的二氧化碳排放量。采用递归特征消除和Boruta两种特征选择技术提取CO2排放模型的重要关键变量和输入参数。从31个预测变量中选取18个变量建立CO2排放预测模型。研究发现，城市环境污染统计指标(如人均工业二氧化硫和粉尘排放量)是预测中国城市二氧化碳排放量的最重要变量。与其他方法相比，XGBoost模型的估计精度最高，R2 > 0.98，相对误差较小(约0.8%)。结合地理空间和气象插值预测变量(如DEM、年平均降水量和气温)，可以适度提高CO2排放的预测精度。当其他变量保持不变时，城市人均二氧化碳排放量与城市经济增长之间呈s型关系，而不是u型关系。在机器学习算法的帮助下，城市地区容易获得的社会经济统计记录和地理空间数据有可能准确预测城市层面的二氧化碳排放。该方法可用于为缺乏详细能源相关统计数据的欠发达地区频繁生成碳足迹地图，以帮助决策者设计具体的减排措施和分配碳减排目标。Nuta等[35]评估了1990年至2015年间欧洲新兴经济体的城市化和能源相关参数方面的碳排放驱动因素。机器学习算法和数据分析的使用提供了通过应用三种算法(随机森林，XGBoost和AdaBoost)确定输入变量重要性的可能性，然后通过建模城市化和能源强度对碳排放的影响。实证结果证实了城市化和能源强度对CO2排放的影响关系。研究结果强调，能源消耗的不同组成部分会影响碳排放，因此，向可再生能源的过渡是可取的。Alkhedar等[36]使用机器学习(ML)算法预测5年(2018-2022)的二氧化碳排放量，这些算法主要是支持向量机(SVM)、深度学习(DL)和人工神经网络。基于DL模型的5年预测CO2排放量分别为44.2、46、48、47和49 Mt CO2。而人工神经网络模型显示每年的CO2排放结果分别为43、44、49、51和50 Mt CO2。SVM算法预测5年的CO2排放量为43.8、52、56和56 Mt CO2。发现DL模型最适合拟合数据，其次是人工神经网络，最后是支持向量机。Kayakus等[37]通过机器学习方法估算了土耳其的二氧化碳排放量。在1980年至2014年间，共有34个数据被用于分析。土耳其使用了年平均气温、人口、国内生产总值(GDP)、工业(年增长率%)、用电量(人均千瓦时)、煤炭消耗(千吨)、农业用地(公里)、石油消耗(桶/天)等信息。研究中使用的机器学习方法的成功顺序是人工神经网络、支持向量机和决策树。Aryai等[38]提出了一个粒子群优化极度随机树(PSO-ERT)回归模型，用于预测澳大利亚国家电力市场(NEM)的排放强度。将PSO-ERT模型与另一种称为极限学习机(ELM)的方法LSTM进行比较，并与两种经典的机器学习算法多层感知器(MLP)和决策树(DT)进行比较。模型使用从五个NEM地区收集的1.5年的天气、需求和发电数据进行训练。结果表明，在新南威尔士州、塔斯马尼亚州、南澳大利亚州、昆士兰州和维多利亚州，ERT模型的均方根误差(RMSE)分别为42.9、109.8、165.7、25.4和74.1，优于LSTM和ELM。对于所有模型来说，对于可再生能源发电量较少的地区和可再生能源发电量占需求比例较小的时间，预测性能更好，这表明在预测器特征集中增加天气预报将进一步提高性能。Chang等[39]利用机器学习(ML)，特别是投影寻踪回归(PPR)来评估影响中国二氧化碳排放预测的关键因素。分析特别指出，不断上升的用电量是主要影响因素。除非实施新的限制或技术进步，否则建筑用电量将继续稳步上升，直到2050年，仅仅依靠降低电力的碳强度并不能使中国实现碳中和。因此，迫切需要更节能的建筑改造和技术，以减少住宅和商业物业的电力消耗。能源消费、能源生产和获取绿色能源的步骤是可持续发展的重要因素。能源是衡量一个国家发展水平的重要指标。Saxena等[40]采用多项式实现的灰色机器学习优化模型对发电量、功耗和CO2排放量进行预测，采用一个非线性核，并用最近发表的增强型乌鸦搜索算法(ACSA)进行优化。结果表明，与传统的灰色模型相比，所提出的框架在准确率方面取得了更好的结果。Sun等[41]对麻雀搜索神经网络进行训练，拟合能源消耗CO2排放与夜间灯光的关系。此外，利用SBM-DEA模型和空间计量技术，从全要素投入的角度对长三角地区27个城市2000 - 2020年的CEE价值进行了分析。研究结果表明，中东欧的总体趋势是不稳定和不平衡的。从2000年的0.720下降到2020年的0.628，表明新疆的资本和劳动力投入过剩，经济产出不足。低价值碳效率区主要集中在西部地区，即安徽地区。上海、无锡和苏州的碳效率值较高，分别为1.21、2.08和1.00，是碳效率的示范城市，而其余城市则存在不同程度的效率损失。以池州-嘉兴为中线，区域内中东欧格局呈现“中低两端高”的态势，重心总体南移。此外，中东欧冷点地区集中在安徽南部，形成以池州、安庆、宣城为集群并向外扩散的低效率区。Wang等[42]提出了一种基于支持向量回归(SVR)、随机森林(RF)、岭回归(ridge)和人工神经网络(ANN)的两阶段预测方法，并与单阶段预测方法进行了比较。采用9个自变量数据(研究周期：1985-2020)对我国CO2排放量进行预测。结果表明，当时间间隔h从1增加到8时，SVR-SVR、SVR-RF、SVR-Ridge和SVR-ANN的平均均方根误差(RMSE)和平均绝对误差(MAE)几乎一致地低于它们的单级版本。在两阶段模型中，SVR-ANN模型的预测误差最小，而SVR-RF模型的预测误差最大。SVR-SVR相对于SVR、SVR-RF相对于RF、SVR-Ridge相对于Ridge、SVR-ANN相对于ANN的预测误差平均下降百分比RMSE分别为36.06、5.98、43.05和14.81，MAE的预测误差平均下降百分比分别为36.06、6.91、43.27和15.35。Yao等[43]推导出三次环境库兹涅茨曲线和基于遗传算法的环境库兹涅茨曲线都具有n形。三阶EKC的第一个拐点出现在2011年左右，表明了碳减排政策的有效性。然而，时间序列模型预测，北京将在2026年左右达到第二个拐点，届时国内生产总值(GDP)约为5000亿元人民币，碳排放将再次开始增加。提出了可解释的机器学习来探索碳排放的社会经济驱动因素，表明总能源消耗和GDP贡献最大。全球二氧化碳排放已成为经济可持续性和人类健康的巨大威胁。碳市场被认为是遏制碳排放最具潜力的手段，碳价格预测将促进碳市场在减排中的作用，使排放主体以更低的经济成本实现减排目标。Yun等[44]结合CEEMDAN在分解多尺度时频碳价格信号方面的优势和LSTM模型在拟合金融信号方面的优势，构建了一种新的碳价格预测模型——具有自适应噪声的完全集合经验模态分解(CEEMDAN)长短期记忆(LSTM)模型。结果表明，CEEMDAN-LSTM模型对复杂碳价格信号的预测具有显著的准确性。均方根误差、平均绝对误差、平均绝对百分比误差和方向精度的预测误差和期望指标分别为0.638342、0.448695、0.015666和0.687631，优于其他基准模型。进一步的证据表明，短期预测绩效优于长期和中期绩效。结果表明，该模型从多尺度时频特征的角度揭示碳价驱动机制是一种可靠的方法。特别是短期预测更为准确，可以为减持主体和绿色金融公司判断市场形势、制定量化交易提供有价值的技术参考。Le等[45]本研究评估了算法在估计越南能源消耗和二氧化碳排放方面的有用性，其中使用训练数据集训练线性回归、随机森林、XGBoost和AdaBoost模型，使它们能够理解人口、GDP和二氧化碳排放、能源消耗之间的模式和关系。结果显示，随机森林、XGBoost和AdaBoost优于线性回归。此外，对于随机森林、XGBoost和AdaBoost，决定系数更高，表明与数据的拟合更好。利用自回归综合移动平均、季节自回归综合移动平均和指数平滑等时间序列预测模型对越南未来的能源消耗和二氧化碳排放进行了预测。利用历史数据对模型进行了训练和验证。到2050年，自回归综合移动平均模型预测人均二氧化碳排放量为6.51t，SARIMA模型预测为7.769 t，指数平滑模型预测为6.22 t。研究结果表明，机器学习技术和时间序列模型可以用来估计越南的能源使用和二氧化碳排放。Ye等[46]提出了一个新的碳排放预测框架，结合线性和机器学习模型，考虑时间动态和外部影响。为了提高模型的准确性和解释力，引入了12个初始影响因素，考虑了城市发展、经济发展、工业能耗和人口因素。然后采用Lasso回归算法过滤掉预测能力较差的指标。最后，建立了自回归综合移动平均(ARIMA)和支持向量回归(SVR)模型的组合预测模型，分别捕捉线性和非线性特征。仿真结果表明，与基准模型相比，该模型具有更强的预测性能，平均绝对百分比误差(MAPE)为0.096， R2为97.5%。此外，还进行了六种未来发展情景，包括工业增长的碳排放预测和环境保护因素，为碳减排计划和相关政策制定提供建议。

通过综合运用数据挖掘、机器学习和优化方法，可以提高碳排放预测的准确性和鲁棒性。然而，由于碳排放数据存在噪声和不确定性，模型训练和优化过程中仍存在一定的挑战。需要继续探索新的算法和方法，以提高广西碳排放智能预警预报的准确性和实用性。

综上所述，本研究立足于学科前沿，紧密结合国民经济和社会发展中的重要科技问题，具有广泛的应用前景。通过构建广西碳排放智能预警预报系统，有助于推动我国低碳发展和生态文明建设，为实现“碳达峰、碳中和”目标提供有力支持。

参考文献：

[7] 张娟, 郭腾飞. 碳排放监测技术发展现状及提升对策 [J]. 资源节约与环保, 2023, (05) : 45-48.

[8] You Z., Li L., Waqas M. How do information and communication technology, human capital and renewable energy affect CO(2) emission; New insights from BRI countries [J]. Heliyon, 2024, 10(4) : e26481.

[9] Yang P., Zhang L., Lin Y., et al. Significant inter-annual fluctuation in CO(2) and CH(4) diffusive fluxes from subtropical aquaculture ponds: Implications for climate change and carbon emission evaluations [J]. Water Res, 2024, 249: 120943.

[10] Xu X., Zeng L., Li S., et al. Dynamic nonlinear CO2 emission effects of urbanization routes in the eight most populous countries [J]. PLoS One, 2024, 19(2) : e0296997.

[11] Tang S., Leng W., Liu G., et al. Development of a framework to forecast the urban residential building CO(2) emission trend and reduction potential to 2060: A case study of Jiangxi province, China [J]. J Environ Manage, 2024, 351: 119399.

[12] Silva B. O., Moitinho M. R., Panosso A. R., et al. Implications of converting native forest areas to agricultural systems on the dynamics of CO(2) emission and carbon stock in a Cerrado soil, Brazil [J]. J Environ Manage, 2024, 358: 120796.

[13] Shi W., Yang J., Qiao F., et al. CO(2) emission prediction based on carbon verification data of 17 thermal power enterprises in Gansu Province [J]. Environ Sci Pollut Res Int, 2024, 31(2) : 2944-2959.

[14] Li R., Fan J., Zhao W., et al. High-frequency dynamics of CO(2) emission flux and its influencing factors in a subtropical karst groundwater-fed reservoir, south China [J]. Environ Res, 2024, 251(Pt 1) : 118552.

[15] 高淼, 吴秀芹. 广西壮族自治区碳排放时空规律及达峰预测 [J]. 中国岩溶, 2023, 42(04) : 763-774.

[16] 王安妮, 贝雷, 高雨雯, et al. 基于STIRPAT模型的广西碳排放影响因素分析 [J]. 环境保护科学, : 1-9.

[17] 吴宇恒, 白景昌. 基于遥感和机器学习的中国典型城市碳排放驱动因子及预测分析 [J]. 气象与环境学报, 2024, 40(01) : 105-112.

[18] Ren W., Wan S., Zhang Z., et al. Causal relationship between household consumption transition and CO(2) emission in China: a dynamic panel model [J]. Environ Sci Pollut Res Int, 2024.

[19] Mngumi F., Huang L., Xiuli G., et al. Financial efficiency and CO(2) emission in BRICS. Dose digital economy development matter? [J]. Heliyon, 2024, 10(2) : e24321.

[20] Liu G., Huang Q., Song K., et al. Improved method for calculating CO(2) emission from industrial solid wastes combustion system based on fossil and biogenic carbon fraction [J]. Waste Manag, 2024, 174: 164-173.

[21] Ko Y. H., Shin S. H., Kim S. G., et al. Significant CO(2) emission in the shallow inshore waters of the southeastern Yellow Sea in 2020 [J]. Mar Pollut Bull, 2024, 201: 116262.

[22] Amin R., Ar Salan M. S., Hossain M. M. Measuring the impact of responsible factors on CO(2) emission using generalized additive model (GAM) [J]. Heliyon, 2024, 10(4) : e25416.

[23] Lei Q., Yu H., Lin Z. Understanding China's CO(2) emission drivers: Insights from random forest analysis and remote sensing data [J]. Heliyon, 2024, 10(7) : e29086.

[24] Zhengxia T., Batool Z., Ali S., et al. Impact of technology on the relation between disaggregated energy consumption and CO(2) emission in populous countries of Asia [J]. Environ Sci Pollut Res Int, 2023, 30(26) : 68327-68338.

[25] Zheng X., Wang J., Chen Y., et al. Potential pathways to reach energy-related CO(2) emission peak in China: analysis of different scenarios [J]. Environ Sci Pollut Res Int, 2023, 30(24) : 66328-66345.

[26] Singh P. K., Pandey A. K., Chouhan A., et al. Prediction of surface temperature and CO(2) emission of leading emitters using grey model EGM (1,1, alpha, theta) [J]. Environ Sci Pollut Res Int, 2023, 30(14) : 39708-39723.

[27] Kumari S., Singh S. K. Machine learning-based time series models for effective CO(2) emission prediction in India [J]. Environ Sci Pollut Res Int, 2023, 30(55) : 116601-116616.

[28] Canteral K. F. F., Vicentini M. E., de Lucena W. B., et al. Machine learning for prediction of soil CO(2) emission in tropical forests in the Brazilian Cerrado [J]. Environ Sci Pollut Res Int, 2023, 30(21) : 61052-61071.

[29] Wu F., He J., Cai L., et al. Accurate multi-objective prediction of CO(2) emission performance indexes and industrial structure optimization using multihead attention-based convolutional neural network [J]. J Environ Manage, 2023, 337: 117759.

[30] Singh P. K., Pandey A. K., Ahuja S., et al. Multiple forecasting approach: a prediction of CO2 emission from the paddy crop in India [J]. Environ Sci Pollut Res Int, 2022, 29(17) : 25461-25472.

[31] Wen H. T., Lu J. H., Jhang D. S. Features Importance Analysis of Diesel Vehicles' NO(x) and CO(2) Emission Predictions in Real Road Driving Based on Gradient Boosting Regression Model [J]. Int J Environ Res Public Health, 2021, 18(24).

[32] Peng T., Yang X., Xu Z., et al. Constructing an Environmental Friendly Low-Carbon-Emission Intelligent Transportation System Based on Big Data and Machine Learning Methods [J]. Sustainability, 2020, 12(19).

[33] Javanmard M. E., Ghaderi S. F., Hoseinzadeh M. Data mining with 12 machine learning algorithms for predict costs and carbon dioxide emission in integrated energy-water optimization model in buildings [J]. Energy Conversion and Management, 2021, 238.

[34] Li Y., Sun Y. W. Modeling and predicting city-level CO emissions using open access data and machine learning [J]. Environmental Science and Pollution Research, 2021, 28(15) : 19260-19271.

[35] Nuta F. M., Nuta A. C., Zamfir C. G., et al. National Carbon Accounting-Analyzing the Impact of Urbanization and Energy-Related Factors upon CO Emissions in Central-Eastern European Countries by Using Machine Learning Algorithms and Panel Data Analysis [J]. Energies, 2021, 14(10).

[36] AlKheder S., Almusalam A. Forecasting of carbon dioxide emissions from power plants in Kuwait using United States Environmental Protection Agency, Intergovernmental panel on climate change, and machine learning methods [J]. Renewable Energy, 2022, 191: 819-827.

[37] Kayakus M. Forecasting carbon dioxide emissions in Turkey using machine learning methods [J]. International Journal of Global Warming, 2022, 28(3) : 199-210.

[38] Aryai V., Goldsworthy M. Day ahead carbon emission forecasting of the regional National Electricity Market using machine learning methods [J]. Engineering Applications of Artificial Intelligence, 2023, 123.

[39] Chang L., Mohsin M., Hasnaoui A., et al. Exploring carbon dioxide emissions forecasting in China: A policy-oriented perspective using projection pursuit regression and machine learning models [J]. Technological Forecasting and Social Change, 2023, 197.[40] Saxena A., Zeineldin R. A., Mohamed A. W. Development of Grey Machine Learning Models for Forecasting of Energy Consumption, Carbon Emission and Energy Generation for the Sustainable Development of Society [J]. Mathematics, 2023, 11(6).

[41] Sun Q. Q., Chen H., Wang Y. J., et al. Analysis of spatial and temporal carbon emission efficiency in Yangtze River Delta city cluster - Based on nighttime lighting data and machine learning [J]. Environmental Impact Assessment Review, 2023, 103.

[42] Wang C. Z., Li M. Y., Yan J. P. Forecasting carbon dioxide emissions: application of a novel two-stage procedure based on machine learning models [J]. Journal of Water and Climate Change, 2023, 14(2) : 477-493.

[43] Yao T. E., Wang Y. Q., Li X. H., et al. Forecasting Turning Points of Carbon Emissions in Beijing Based on Interpretable Machine Learning [J]. Atmosphere, 2023, 14(8).

[44] Yun P., Huang X. D., Wu Y. Q., et al. Forecasting carbon dioxide emission price using a novel mode decomposition machine learning hybrid model of CEEMDAN-LSTM [J]. Energy Science & Engineering, 2023, 11(1) : 79-96.

[45] Le T. T., Sharma P., Osman S. M., et al. Forecasting energy consumption and carbon dioxide emission of Vietnam by prognostic models based on explainable machine learning and time series [J]. Clean Technologies and Environmental Policy, 2024.

[46] Ye L., Du P., Wang S. B. Industrial carbon emission forecasting considering external factors based on linear and machine learning models [J]. Journal of Cleaner Production, 2024, 434.

创新点与项目特色:

本项目聚焦于将人工智能技术深度融入广西碳排放预警预报体系的构建之中，致力于运用人工智能技术对广西碳排放数据展开精准预测。预测成果将为政府部门、企业主体以及社会公众在制定决策时提供有力支撑，助力其实施针对性的减排策略，进而为我国早日达成碳达峰与碳中和目标贡献技术力量。

项目实施过程中，广泛收集广西本土的各类碳排放数据，涵盖能源消耗数据、居民生活碳排放数据以及空气质量监测站点数据等多源信息，并引入人工智能技术，借助机器学习中的数据挖掘技术对所收集数据进行整合与分析。在此基础上，运用人工神经网络（ANN）和随机森林（RF）构建碳排放模型，基于对历史数据的深入学习、训练与优化，持续提升模型预测的精确性与稳定性。通过反复的模型训练与验证环节，不断精细调整与优化模型，增强模型的适应性与鲁棒性，确保其能够有效实现对广西未来一段时间内碳排放情况的预警与预报功能。此外，项目采用自上而下的能源模型，该模型可精准研判不同能源政策对终端用户的影响效应，为碳减排政策的平稳推进与有效实施提供坚实保障。

技术路线、拟解决的问题及预期成果:

依据历史数据以及国家相关要求标准，构建一套综合性的预警指标体系，涵盖碳排放量、能源效率以及碳汇变化等关键指标。这些指标能够充当碳排放预测结果的报警信号，及时提示异常情况。

通过收集广西地区各类碳排放数据，如能源消耗数据、居民生活碳排放数据、空气质量监测站点数据以及卫星遥感影像数据等。这些源自不同渠道的数据虽能从多个维度反映碳排放量，但因其繁杂且难以区分，故需要引入人工智能技术，运用数据挖掘整合分析采集数据，构建人工神经网络（ANN）和随机森林（RF）的碳排放模型，使用广西历史碳排放数据对其训练，提升预测精度。利用堆叠法、交叉验证与并行融合法优化模型，训练验证中持续调整，增强模型适应性与鲁棒性。此外还采用自上而下的能源模型，可精准研判不同能源政策对终端用户的影响效应，为模型预测提供数据，使其能够更好地应对复杂多变的实际情况，为广西地区的碳排放管理与决策提供更为可靠的依据与有力支持。 summernote-img

项目研究进度安排:

summernote-img

已有基础:

与本项目有关的研究积累和已取得的成绩:

（1）已在研究智能预警预报算法优选、组合与开发、预警预报模型构建与验证和碳排放预警预报模型应用与评估方面取得了一定成绩，例如，已经优选出一部分算法，包括机器学习（如随机森林和XGBoost等）、神经网络、支持向量机等，它们能够处理非线性问题，具有较好的泛化能力；其次，项目有广西地区碳排放的历史数据，通过这些数据构建广西地区碳排放预测模型。这些模型将能够捕捉碳排放的时空变化特征，预测未来一段时间内的碳排放量。

（2）指导教师从事了大量相关研究工作并发表了相关研究论文，对该领域研究熟悉，可为项目的实施提供很好的理论指导。

已具备的条件，尚缺少的条件及解决方法:

（1）前期已对相关文献进行了大量调研，初步的实验方案已拟定。

（2）碳排放数据存在噪声和不确定性，模型训练和优化过程中仍存在一定的挑战。需要继续探索新的算法和方法，以提高广西碳排放智能预警预报的准确性和实用性。

经费预算

开支科目	预算经费（元）	主要用途	阶段下达经费计划（元）
开支科目	预算经费（元）	主要用途	前半阶段	后半阶段
预算经费总额	5000.00	无	1000.00	4000.00
1. 业务费	4000.00	无	500.00	3500.00
（1）计算、分析、测试费	1000.00	无	500.00	500.00
（2）能源动力费	0.00	无	0.00	0.00
（3）会议、差旅费	0.00	无	0.00	0.00
（4）文献检索费	0.00	无	0.00	0.00
（5）论文出版费	3000.00	论文版面费	0.00	3000.00
2. 仪器设备购置费	0.00	无	0.00	0.00
3. 实验装置试制费	0.00	无	0.00	0.00
4. 材料费	1000.00	撰写报告	500.00	500.00

结束