基于数据分析下的光伏发电
摘 要(文末获取)
根据最新数据,中国的总发电量超过20万亿千瓦时,总体排名世界第一,而光伏发电是一种重要的可再生能源,可以将太阳能转化为电能可以减少对传统能源的依赖,并具有显著的环保和可持续发展优势。因此,本文将收集光伏发电相关的数据集进行研究分析。
问题一,建立电力供应预测模型。以电力供应为关键词,在知网、PubMed、Google Scholar等期刊检索网站进行检索,查阅相关文献。对查阅的文献涉及的关键词进行频数标记,最终选择出现频率较高的指标作为本题研究电力供应的指标。最终得到经济与产业类、能源消费与结构类、人口与社会类、环境与排放类四大类指标17项指标数据。为了找到相关的数据,利用python数据爬虫以及自行寻找等方式,在国家统计局、工信部、能源局、世界银行等开放数据库获取数据。
对于数据预处理,利用收集到的数据集利用q-q图以及k-s检验判定分布方式,得出数据基本服从正态分布。对于数据进行3σ原则判定异常值。将异常值替换为缺失值,对于缺失值,这里采用牛顿线性插值的方式。由于指标数量过多,这里使用KMO检验和Bartlett球形检验判定指标独立性,对于通过检验的使用主成分分析法进行降维,对于未通过检验的指标使用相关性分析进行降维。利用降维后的数据进行相关性分析,判断指标与电力供应之间的关系。利用数据预处理之后的数据,建立LSTM预测模型,对2024年到2060年电力供应进行预测。
问题二,利用羲和能源气象大数据平台收集到我国十个地区的光伏发电相关数据,对该数据集采用与问题一相同的数据清洗方式。利用数据预处理之后的结果,构建主成分分析模型,对十个地区进行评价,得出最好的地方,从而完成光伏电站选址模型构建与求解。
问题三,利用数据爬虫方式,收集数据。以光伏发电量最大为目标函数,引入开关变量,以及选材作为决策变量。通过分析数据,得出具体的变量之间的关系,构建等式与不等式约束条件。为了进一步提升求解速度,引入粒子群算法进行求解。
问题四,收集碳排放相关的数据集。对数据进行预处理,使用回归预测、灰色预测、LSTM进行预测,对预测结果以误差最小为目标函数,构建优化模型进行加权。进项两次预测模型的求解,第一次将光伏发电相关的数据剔除后,进行预测。第二次,引入光伏发电相关数据进行预测。比较两种不同情况下,有无光伏发电的碳排放变化结果。从而实现对于可持续发展战略规划的分析。
综上所述,基于前四个问题的研究结果,简要概述主要发现和建议,给中国政府写一封关于光伏发电的信。
关键词:发电供应、光伏发电、预测模型、数据预处理、粒子群算法
为了更加直观的展示可视化结果,我们对指标进行计数,筛选出排名前十七的指标,相关指标示意图如下所示:
图2:频数统计柱状图
最终,确定下面四个一级指标经济与产业类、能源消费与结构类、人口与社会类、环境与排放类构建指标评价体系。为了更加直观地展示我们构建的指标评价体系,我们使用X-mind绘制了指标评价体系,如下所示
图3:指标评价体系
经济与产业类指标
分类依据:这类指标主要衡量国家或地区的经济规模、产业结构以及发展水平。它们通常与GDP、产业投入、高科技产业等相关。
意义:经济规模与发展水平评估:通过电力产业投入、人均GDP等指标,可以评估一个国家或地区的经济规模和发展阶段。
产业结构分析:这些指标有助于了解经济中不同产业(如电力产业、高科技产业)的比重和重要性,从而分析产业结构的合理性和发展趋势。
政策制定与调整:政府可以根据这些指标来制定相应的产业政策,促进经济增长和产业升级。
能源消费与结构类指标
分类依据:这类指标主要关注能源的消费总量、消费结构以及能源消费与经济增长的关系。它们通常涉及煤炭、石油、天然气等不同类型的能源。
意义:能源供需平衡分析:通过能源消费总量和结构的分析,可以了解一个国家或地区的能源需求和供应状况,为能源规划和政策制定提供依据。
能源效率与可持续发展评估:能源消费弹性系数等指标可以反映能源利用效率和经济增长的关系,有助于评估能源使用的可持续性和经济性。
环境影响分析:不同类型的能源消费对环境的影响不同,这些指标有助于分析能源消费对环境的影响程度,为环保政策制定提供参考。
人口与社会类指标
分类依据:这类指标主要关注人口的数量、分布、结构以及城镇化水平等社会特征。
意义:人口发展规划:通过人口数量和分布的分析,可以制定合理的人口发展规划,优化资源配置和社会服务。
城镇化进程评估:城镇人口比例等指标可以反映一个国家或地区的城镇化进程和水平,为城镇化政策制定提供依据。
社会问题研究:这些指标还可以用于研究社会问题,如人口老龄化、劳动力供需等,为政府制定相应政策提供参考。
环境与排放类指标
分类依据:这类指标主要关注环境状况和温室气体排放情况,涉及生态保护、气候变化等领域。
意义:环境保护政策制定:通过环境和排放指标的分析,可以了解环境状况和污染排放情况,为环境保护政策的制定提供依据。
气候变化应对:温室气体排放是导致气候变化的主要原因之一,这些指标有助于评估一个国家或地区在应对气候变化方面的努力和成效。
可持续发展评估:这些指标还可以用于评估一个国家或地区的可持续发展水平,为可持续发展战略的制定和实施提供参考。
5.1.2 数据预处理-异常值
Kolmogorov-Smirnov检验是一种非参数的统计检验方法,是一种用于检验数据集是否服从某种分布的统计方法,其中最常用的是检验数据集是否服从正态分布。其基本原理是将数据集的累积分布函数与理论分布函数进行比较,通过计算两者之间的最大差距来判断数据集是否符合该理论分布。如果最大差距小于某个临界值,则认为数据集服从该理论分布,单样本的K-S检验是用来检验一个数据的观测经验分布是否是已知的理论分布。当两者间的差距很小时,推断该样本取自已知的理论分布。作为零假设的理论分布一般是一维连续分布F(如正态分布、均匀分布、指数
2024华数杯B题成品论文word52页(附带所有可执行代码+和高质量数据)
点击链接加入群聊【2024华数杯数学建模资料总群】: