Datawhale组队学习 Task10 环境影响

第12章 环境影响

在本章中,首先提出一个问题:大语言模型对环境的影响是什么?

这里给出的一个答案是:气候变化

一方面,我们都听说过气候变化的严重影响(文章1、文章2):

  • 我们已经比工业革命前的水平高出1.2°C
  • 需要保持在1.5°C以下以避免气候危机
  • 根据目前的轨迹,在未来几十年内将达到2.7°C

另一方面,我们看到训练大语言模型所需的计算量大幅增加(从而导致二氧化碳排放)。以下是一些数据:

  • Strubell et al., 2018估计,训练排放了626,000磅二氧化碳(5辆汽车终生的排放量)。
  • DeepMind的Gopher报告称,训练产生的二氧化碳估计为380吨。

本章将学习如何将大语言模型与环境影响联系起来。

学习目标:

  • 全面了解大语言模型对环境的影响。
  • 能够计算训练特定语言模型产生的排放量。
  • 提高对监测和减轻(负面)环境影响的认识,甚至承担个人责任。

注意事项:

  • 本章的重点是了解(环境)成本。大语言模型大幅提升了效果,但是需要考虑成本。如何做到这一点非常具有挑战性。
  • 与此同时,世界人口的收益和成本往往非常不均衡,成本“不成比例地落在穷人和弱势群体身上”。
  • 所提供的所有数字都是估计,因为:
    • 缺乏对数据中心的监控和信息
    • 这些信息通常是私有的
    • 很难用摊余成本进行信用/责任分配(例如,建立数据中心+训练多个模型,训练一个模型+使其适配许多下游任务)。

12.1 生命周期评估

本节主要基于Ligozat et al. (2021)的论文,从多个角度进行探讨语言模型/AI对气候影响的内容:

哲学角度来说,大多数关于人工智能和机器学习对环境影响的工作都集中在温室气体排放(受气候变化启发)上,但更重要的是(尽管很难)采取系统方法来思考:

  • 对环境的全面影响(排放、水足迹)
  • IT设备的整个生命周期(例如,生产、使用、寿命终止)

从**生命周期评估(LCA)**的角度来说:

  • 生命周期评估(LCA)(ISO 14040和14044)为实现这一点提供了一个框架。
  • 需要“从系统的角度”来避免“一个问题的解决方案会产生几个新的、经常被忽视的问题”。

IT设备的生命周期来说:

  • 生产:
    • 原材料提取:提取矿石以及转化为金属的所有过程
    • 制造:包括制造设备的所有过程
    • 运输:设备运输过程
  • 使用:设备的实际能耗
  • 寿命终止:拆除、回收/处置设备

此时要对生命周期中的注意事项做一下说明:

  • 生产

    • 我们没有针对GPU/TPU的生命周期评估
    • 法国仅使用CPU的数据中心:40%的温室气体排放源于生产阶段(Berthoud et al. 2020)
    • 数据中心的建立有很多目的,需要进行信用分配,以确定由于大型语言模型(由于情况变化很快,很难提前估计)所占的份额。
    • 示例:制造占iPhone 5总排放量的75%
  • 使用

    • 主要取决于能源(煤炭或水电)的碳强度
  • 生命的终结

    • 通常没有很好的记录
    • 80%的电子设备未被正式回收

特别地,在使用阶段:

  • 数据:需要获取、生成和存储数据

  • 学习:训练大语言模型

    • 这包括实验和超参数调整。
    • 这是“一次性成本”,直到您需要再次更新模型。
  • 推理:在生产中运行模型

    • 示例:谷歌每天收到56亿次搜索查询(来源)。

    • 通常部署的是从大模型中蒸馏出来的小得多的模型(如果特定于任务,则可以小得更多)。

    • 如果你需要进行多个预测(例如,情感、主题分类等),可以对句子进行一次编码(例如,BERT),并使用不同的任务特定的分类头。

环境影响的角度来说:

  • 温室气体排放:导致气候变化

  • 水足迹:淡水在一些地区是稀缺资源

    • 数据中心使用水进行冷却(需要电力)
    • 发电是第二大用水需求,处理水和废水需要电力
  • 对人类的危害:释放到环境中(空气、水、土壤)的化学物质,可导致癌症等。

    • 芯片制造在制造种产生有毒废料
  • 非生物资源枯竭

    • 化石燃料
    • 用于制造电子设备的矿物(锂、钴)。您可以通过此链接了解更多关于数据中心对环境的影响。

其他二阶效应(更多细节):

  • 更高的效率创造更多的需求(反弹效应和杰文悖论)
  • 环境变化(荒漠化加速,灭绝率上升)
  • 冻土融化反过来又加速了温室气体排放
  • 芯片短缺导致汽车制造业停工

language model⇒compute⇒energy use⇒greenhouse gas emissions⇒environmental impact

12.2 气候变化

虽然考虑整个生命周期很重要,但我们将主要关注气候变化和温室气体排放,因为这是大部分研究人工智能和机器学习对环境的影响所关注的。

气温正在上升:

  • 自1900年以来,平均表面温度增加了2.14˚F(1.19˚C)。
  • 自2005年以来,出现了10个最热年份。
  • 温度随时间增加(来源):

负面影响:

  • 自然灾害增加(极端热浪、洪水、干旱、野火)
  • 海平面上升破坏沿海社区和野生动物生态系统

原因:

  • 排放到大气中的温室气体(二氧化碳、甲烷、一氧化二氮)锁住了太阳的热量(过去80万年的相关性)
  • 自1970年以来增长了90%(来源)
  • 人类活动加速:
    • 燃烧化石燃料(煤、石油、天然气)发电、制造、运输(汽车、卡车、船舶、飞机)
    • 种植作物(肥料)
    • 砍伐森林(例如,建立农场)

碳排放量的计量单位为kg CO2 eq:

  • 每种温室气体都具有全球变暖潜力(GWP):
    • 取决于(i)吸收的热量和(ii)它在大气中停留的时间。
    • 对于二氧化碳,全球升温潜能值=1(定义为参考值)。
    • 对于甲烷,100年全球升温潜能值=25。
    • 对于一氧化二氮,全球升温潜能值在100年内为300(因为它存在的时间太长了——121年)。

12.3 能源使用和温室气体排放

到目前为止,我们已经讨论了温室气体排放及其对气候变化的影响,气候变化是环境影响的一种特别突出的形式。数据中心使用能源(以电力的形式)。这是如何映射到排放量上的?答案是,这取决于电力是如何产生的。

碳强度(Carbon intensity:):使用每千瓦时能源排放的碳量(来源)

  • 化石燃料(煤、天然气)产生的排放量最多(来自直接排放)
  • 如果考虑到整个生命周期(发电厂建设、采矿、废物管理),其他绿色能源(太阳能、风能)也会产生排放
  • 在魁北克运行同样的任务(水电)的排放量将比爱沙尼亚(煤炭)少30倍

来自Lacoste et al. (2019):

de Chalendar et al. 2019

  • 取决于位置(那里有什么类型的发电厂)
  • 取决于时间效应(季节、一天中的时间)
  • 电力交换意味着它更难追踪,负面影响往往在其他地方
  • 加利福尼亚州main Balancing Authority(BA)40%的排放是在其他地方产生的

数据中心统计数字 (Md Abu Bakar Siddik et al., 2021):

  • 2018年,全球数据中心用电量为2050亿千瓦时(占总用电量的1%)。
  • 在美国,2014年数据中心用电量占总用电量的1.8%。
  • 30%的数据中心位于美国。
  • 美国温室气体排放总量的0.5%来自于于数据中心。
  • 好消息:从2010年到2018年,计算量增加了550%,但电力消耗仅增加了6%(由于能源效率的提高)。

12.4 估算训练模型的排放量

现在让我们试着计算训练所需的能源使用量,从而计算温室气体排放量。

12.4.1 ML CO2 Impact Calculator

ML CO2 Impact Calculator(Lacoste et al., 2019)提供了一种基于硬件、使用的小时数、供应商和地区来估计排放量的简单方法。

12.4.2 Strubell et al., 2018

这是第一篇真正激发NLP社区对环境影响认识的论文。

计算功耗(kWh):

  • �cpu:CPU的平均功率(W)
  • �gpu:GPU的平均功率(W)
  • �dram:DRAM的平均功率(W)
  • PUE:用电效率:提供给数据中心的总功率/IT设备消耗的功率

emissions=�power→emitPUE(�cpu+�gpu+�dram)

它们的平均值:

  • PUE=1.58(2018年全球数据中心平均值)
  • �power→emit=0.954(2018年平均排放量-磅/千瓦时)

结果

  • BERT-base(110M参数):1438 lbs CO2eq

    • NVIDIA在64个V100 GPU上训练79.2小时
  • 神经结构搜索(213M参数)以获得Evolved Transformer So et al. (2019):626155 lbs CO2eq

    • 基模型在一个TPUv2上训练需要10个小时(300K步)
    • 训练一共需要32623小时(979M步)
  • 1名乘客乘坐从纽约到旧金山的往返航班:1984 lbs CO2eq(0.9吨)

  • 汽车生命周期:126,000 lbs CO2eq

12.4.3 Patterson et al., 2021

简单形式: $$ \text{emissions} = R_{\text{power} \to \text{emit}} (\text{energy-train} + \text{queries} \cdot \text{energy-inference}) $$

  • NVIDIA:80%的ML工作负载是推理,而不是训练

许多设计决策:

  • 模型架构:Transformer与Evolved Transformer
  • 处理器:NVIDIA的P100与Google的TPU
  • 数据中心:平均(1.58)与谷歌(1.11)
  • 能源供应组合(如煤炭、水电):平均(0.429千克二氧化碳/千瓦时)与谷歌(0.080千克二氧化碳/千瓦时)
    • 注:总额为0.478,净额为0.080
    • 扣除出售给其他公司的清洁能源

对于训练:

emissions=hours-to-train⋅num-processors⋅power-per-processor⋅PUE⋅�power→emit

不同模型的估计值:

  • T5:86 MWh,47t CO2eq
  • GShard(用于机器翻译的MOE模型):24 MWh,4.3t CO2eq
  • Switch Transformer:179 MWh,59t CO2eq
  • GPT3:1287 MWh,552t CO2eq

反驳Strubell et al. (2019)的神经结构搜索的估计值:

  • 对于搜索小任务,18.7x太高
  • 神经结构搜索只需一次,然后每个人都可以使用Evolved Transformer
  • 排放量被高估了88倍

要点:

  • 如果可能的话,测量比在线计算更好
  • 谷歌使用了12.2t 千瓦时(训练谷歌最大的4个模型不到0.005%)
  • 这是比特币挖矿计算支出的1/10

12.5 推荐的Python包

  • Environment Impact Tracker
  • Carbon Tracker
  • CodeCarbon

12.6 总结

  • 环境影响是一个巨大的话题。一切都是相互联系的,所以很难得出一个干净的定量指标。但要真正着眼于全局。

  • 尽管如今大语言模型的还很少,但它正在快速增长。

  • 大语言模型的通用性提供了节省成本的潜力(“一次性训练”并适用于许多不同的任务)。但它们的成本要高得多,需要可能需要重新训练。这里的权衡是什么?

  • 缓解措施

    • 尝试在使用清洁能源的数据中心训练模型
    • 碳抵消的效果各不相同(森林种植活动产生单一种植)
    • 更高效的模型架构、训练程序、硬件(但要注意反弹效应)
  • 在论文报告排放量

    • 可以提高认识(想象一下,如果每一篇论文都能报告排放量)
    • 调整激励(人们目前关注准确性,但碳排放也很重要!)

以上内容为了可读性部分选择Datawhale的开源资料。

总而言之,环境问题在科技发展达到一定程度后愈加收到关注,而这需要全体成员的生活方式的深刻转变。从本文我们收获了一些模型训练的环境指标的度量方式和一定的警醒,知晓了芯片的制造所产生的一定的环境效应——故而中国为一个制造业大国有一定的碳排放也可以理解,但这一切也是亟待了解并且亟待解决。

觉得有用的话给个一键三连哦,关注无神一起学习AI方面知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/368551.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode热题HOT100【栈的压入、弹出序列】

🔥LeetCode热题HOT100【栈的压入、弹出序列】 1. 题目来源2.题目 1. 题目来源 来自LeetCode热题HOT100 https://leetcode.cn/studyplan/top-100-liked/?isDarktrue 2.题目 题目地址 Leetcode地址 3.Stack 在Java中,Stack 是一个基于后进先出&#…

玩美移动为花西子海外官网打造AR虚拟试妆决方案

全球领先的增强现实(AR)及人工智能(AI)美妆科技领导者及玩美系列APP开发商——玩美移动(纽交所代码:PERF)于近日宣布携手知名美妆品牌花西子,在其线海外官方网页提供多项彩妆虚拟试妆…

TanDEM-X30米DEM数据介绍

一、背景 之前介绍了Copernicus 30米DEM以及Alos 30米DEM数据的详细介绍以及接入到Cesium中的效果展示,有遥感专业工作者对比了Copernnicus、ALOA、ASTER、NASA、SRTM这几家30米DEM数据,得出了Copernicus 30米DEM数据是最好的全球级30米DEM数据&#xf…

Java8 中文指南(一)

Java8 中文指南(一) 文章目录 Java8 中文指南(一)《Java8 指南》中文翻译接口的默认方法(Default Methods for Interfaces)Lambda 表达式(Lambda expressions)函数式接口(Functional Interfaces)方法和构造函数引用(Method and Co…

Unity 图片不改变比例适配屏幕

Unity 图片不改变比例适配屏幕 前言项目场景布置代码编写添加并设置脚本效果 前言 遇到一个要让图片适应相机大小,填满屏幕,但不改变图片比例的需求,记录一下。 项目 场景布置 代码编写 创建AdaptiveImageBackground脚本 using System.C…

QT 应用中集成 Sentry

QT 应用中集成 Sentry QT应用中集成 SentrySentry SDK for C/C注册 Sentry 账号QT 应用中集成 Sentry触发 Crash 上报 QT应用中集成 Sentry Sentry 是一个开源的错误监控和日志记录平台,旨在帮助开发团队实时捕获、跟踪和解决软件应用程序中的错误和异常。它提供了…

Python flask 表单详解

文章目录 1 概述1.1 request 对象 2 示例2.1 目录结构2.2 student.html2.3 result.html2.4 app.py 1 概述 1.1 request 对象 作用:来自客户端网页的数据作为全局请求对象发送到服务器request 对象的重要属性如下: 属性解释form字典对象,包…

如何批量获取当前文件夹下的文件名

最近,在和网友交流时,对方推荐了一个视频,我打开一看,是一个手工获取当前目录下所有文件名的手机视频。用的方法是在win11中复制所有文件的路径,然后粘贴到Excel当中,通过查找替换和分列的方法,…

EasyX图形库学习(二)

目录 一、文字绘制函数 settextstyle 设置当前文字样式。 outtextxy 在指定位置输出字符串。 ​编辑 但如果直接使用,可能有以下报错: 三种解决方案: 将一个int类型的分数,输出到图形界面上 如果直接使用: 会把score输入进去根据A…

被人疯狂吐槽的预制菜,居然是资本看重的“万亿级”市场?

被人疯狂吐槽的预制菜,居然是资本看重的“万亿级”市场? 文丨微三云营销总监胡佳东,点击上方“关注”,为你分享市场商业模式电商干货。 - 大家是不是以为只有被天天吐槽难吃的外卖和小饭店,才会用预制菜,…

#从零开始# 在深度学习环境中,如何用 pycharm配置使用 pipenv 虚拟环境

为Python项目创建虚拟环境 在深度学习环境和一般python环境中安装pipenv基本一致,只需要确认好pipenv指定的python版本即可,安装pipenv前,可以通过python --version来确认安装版本 快捷键:crtl alt S 查看interpreter,查看所有…

代码随想录算法训练营第42天 | 01背包问题,你该了解这些! 01背包问题,你该了解这些! 滚动数组 416. 分割等和子集

目录 01背包问题,你该了解这些! 01 背包 二维dp数组01背包 💻实现代码 01背包问题,你该了解这些! 滚动数组 一维dp数组(滚动数组) 💻实现代码 416. 分割等和子集 &#x1f…

《Numpy 简易速速上手小册》第9章:Numpy 在机器学习中的应用(2024 最新版)

文章目录 9.1 数据预处理9.1.1 基础知识9.1.2 完整案例:数据标准化9.1.3 拓展案例 1:缺失值处理9.1.4 拓展案例 2:非数值数据的转换 9.2 特征提取和处理9.2.1 基础知识9.2.2 完整案例:特征归一化9.2.3 拓展案例 1:特征…

MySQL知识点总结:构建可靠高性能的关系型数据库

摘要:MySQL是一款广泛使用的开源关系型数据库管理系统,具备可靠性和高性能的特点。本文将总结MySQL的一些重要知识点,帮助读者了解如何使用MySQL构建可靠高性能的关系型数据库。 正文: ### 1. 数据类型 MySQL支持多种数据类型&…

SpringBoot整合Activiti7—— 补偿边界/补偿中间事件(十五)

文章目录 补偿边界/补偿中间事件代码实现xml文件测试流程流程执行步骤 补偿边界/补偿中间事件 补偿事件可以被触发来回滚或修复之前已经完成的任务或活动。 补偿事件通常与错误边界事件(Error Boundary Event)结合使用。当任务或活动发生异常时&#xff…

SQL sever2008中创建用户并赋权

一、创建数据库dream CREATE DATABASE dream; 二、创建登录用户XZS 法一:使用SSMS创建 通过查询 sys.syslogins 系统视图来确定当前登录是否具有系统管理员权限。执行以下查询语句: SELECT name, isntname FROM sys.syslogins WHERE sysadmin 1;选…

Android Studio从零基础到APP上线(3)

第3章 简单控件 本章介绍App开发常见的几类简单控件的用法,主要包括:显示文字的文本视图,容纳视图的常用布局,响应点击的按钮控件,显示图片的图像视图等。然后结合本章所学的知识,演示一个实战项目“简单计算器”的设计与实现。 3.1 文本显示 本节介绍如何在文本视图Tex…

Jmeter,如何从数组参数中取值

有个post请求,参数“equipment_ids”,是个数组,需求每次执行的时候,按顺序取equipment_ids中不同的值 要实现在 JMeter 中每次执行请求时按顺序取不同的 equipment_ids 中的值,你可以使用 Counter 元件来生成索引&…

【面试深度解析】掌上先机后端面试(Java基础能力夯实)

欢迎关注公众号(通过文章导读关注:【11来了】),及时收到 AI 前沿项目工具及新技术的推送! 在我后台回复 「资料」 可领取编程高频电子书! 在我后台回复「面试」可领取硬核面试笔记! 文章导读地址…

HTML音频标签

新增的语义化的标签: 即直接给了一个具象化的盒子。 新增的多媒体标签: 视频格式: 当都不支持的时候会显示文字。 video仍然是可以看成一个盒子。 音频格式: 新增的input 表单控件: 新增的表单属性: 提示文…