登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
尽管2024年全球煤炭使用量达到了新的高度,但比特币挖矿已逐渐摆脱煤炭这一能源来源。在过去13年间,比特币挖矿中碳氢化合物燃料的使用量急剧下降,其中煤炭能源的使用量显著减少。尽管比特币挖矿的煤炭能源消耗据报每年平均下降8%,但全球煤炭消耗量却在上升。据总部位于巴黎的国际能源署(IEA)介绍
近日,山东环保旗下鲁控数字技术(山东)有限公司(以下简称“鲁控数字”)成功研发“零碳园区能碳管理平台”,以数字化、智能化手段赋能园区及企业,实现能源消耗和碳排放的精准计量、精细管控和智能决策,构建园区全方位的能碳管理体系,助力产业园区绿色低碳转型实现新突破。“零碳园区能碳管理平台
2019年7-8月,中央生态环境保护督察组对福建省开展第二轮生态环境保护督察,指出福州市存在“能耗总量控制指标”问题。福州市采取多种措施认真整改,2025年2月,经省级核查,确认福州市存在的问题已整改完成,同意验收销号。根据上级有关规定,现将整改情况予以公示:一、督察指出问题中央生态环境保护
日前,北京市发改委发布北京市可再生能源开发利用条例,文件指出,市发展改革部门应当会同经济和信息化、规划和自然资源、住房城乡建设、城市管理、农业农村等部门,推进建设下列可再生能源发电项目:(一)分布式光伏发电项目;(二)在具备条件的关停废弃矿区、垃圾填埋场和荒滩、荒坡等未利用地建设
在5-6C超快充技术步入规模化应用阶段的当下,国内电动汽车补能技术的发展却已呈现出向更高功率等级演进的趋势。近期,包括宁德时代、华为、比亚迪在内的行业主要参与者相继发布了“兆瓦级”充电解决方案,宣称功率高达1兆瓦乃至1.5兆瓦,远超当前主流水平。这一动向表明,相关企业正着眼于下一代大功率
为全面贯彻党的二十大和二十届二中、三中全会精神,认真落实党中央、国务院决策部署,推动热泵行业高质量发展,助力重点领域节能降碳,近日,国家发展改革委会同工业和信息化部、生态环境部、住房城乡建设部、交通运输部、国家能源局等部门联合印发《推动热泵行业高质量发展行动方案》(发改环资〔2025
北极星氢能网获悉,近日,北京市十六届人大常委会第十六次会议表决通过了《北京市可再生能源开发利用条例》(以下简称《条例》),自今年5月1日起施行。文件提出:本市科学布局和建设可再生能源制氢、加氢基础设施,拓展氢能在发电、供热、交通等领域的应用。利用可再生能源生产的燃气、热力、氢,符合
来源:《中国电力》2025年第2期引文:许文俊,马刚,姚云婷,等.考虑绿证-碳交易机制与混氢天然气的工业园区多能优化调度[J].中国电力,2025,58(2):154-163.编者按目前,全球变暖和能源短缺问题引起了世界各国的广泛关注,中国为此提出“双碳”目标。工业生产作为碳排放和能源消耗的主要来源,实现工业园区
近日,国家发展改革委等部门发布《关于促进可再生能源绿色电力证书市场高质量发展的意见》,明确对数据中心等实行绿证强制消费要求。数据中心是承载算力、发展人工智能的关键基础设施,具有高能耗的特性。在加快发展新一代人工智能和实现“双碳”目标的双重驱动下,算力和绿色电力的协同发展亟待加强。
北极星售电网获悉,2025年3月26日,北京市第十六届人民代表大会常务委员会第十六次会议通过《北京市可再生能源开发利用条例》。文件明确,市加强与其他地区的能源合作,支持可再生能源基地和可再生能源电力输送通道建设,通过政府间合作协议等方式拓宽可再生能源电力来源;鼓励和支持开展跨区域绿色电
北极星垃圾发电网获悉,北京市人大常委会发布《北京市可再生能源开发利用条例》,本条例适用于本市行政区域内太阳能、地热能、风能、水能、生物质能、空气能等可再生能源的开发利用及相关管理活动。自2025年5月1日起施行。全文如下:北京市可再生能源开发利用条例(2025年3月26日北京市第十六届人民代
4月10日上午,中关村储能产业技术联盟发布2024年度中国储能企业出货量八大榜单。双登股份再获行业认可,荣登中国储能技术提供商2024年度全球市场基站/数据中心电池出货量榜首。在数字经济蓬勃发展、全力迈向碳中和的新纪元,“连接与算力”是发展的主旋律。数据中心、算力中心作为算力革命的核心载体,
自DeepSeek模型发布以来,电力企业接入DeepSeek已成为一股新潮流。据北极星不完全统计,截至目前,国家电网、南方电网、国家能源集团、中国华能、国家电投、中国华电、中广核、中核集团、等多家电力企业都官宣接入了DeepSeek大语言模型。国家电网国网信通产业集团自主研发的模型服务云MSC(Model-Servi
北极星氢能网获悉,近日,中国石油天然气管道工程有限公司联合管道科学研究院召开《康保输氢管道材料性能确定及评估技术研究》课题阶段讨论会,深入研究钢管及环焊缝氢相容性试验课题。该课题基于国内距离最长、规模最大的输氢管道——康保-曹妃甸输氢管道项目开展,用以支撑该项目建设,助力管道局在
4月7日,工业和信息化部公布了全国168个万兆光网试点入围项目,覆盖“万兆小区”“万兆工厂”“万兆园区”三类试点。国能清远电厂成功入围试点名单,成为广东省5个“万兆工厂”试点之一,也是广东省唯一入围的电厂。全国仅有2家电厂入围。万兆光网是继千兆光纤网络之后的下一代光网络技术的升级演进方
今年全国两会,科技创新是当之无愧的焦点,新质生产力、“人工智能+”等科技创新领域的关键词被持续热议。人工智能正加速与实体经济深度融合,不断赋能传统产业,催生新兴产业和未来产业。万里长风在百米叶片上舞出新韵律,滚滚乌金在斗轮机上迸发新能量,千丈水头在智能闸门前激荡新乐章,万道阳光在
2025年初,“136号文”的发布吹响了新能源全面参与电力市场的号角;Deepseek横空出世引发的AI平权化浪潮,则让信息安全要求严格的能源企业用上了低成本私有大模型,风电的生产运营又一次来到了拐点时刻。在这两大因素的交织影响下,“十五五”期间的风电生产会是什么模样?我们又将如何面对这一行业巨
3月28日-30日,中国电动汽车百人会(2025)论坛在京成功召开。会上,中国电动汽车百人会副理事长、中国科学院院士欧阳明高在百人会理事会暨汽车产业发展形势与政策研讨会上发表总结,主题为《从新能源汽车革命演进过程看汽车产业竞争态势与趋势》,以下是他的发言原文,略有编辑节选。01从2021-2025年
3月31日,陕投电力运营开展“DeepSeek”人工智能应用专题培训,帮助员工掌握AI工具使用技能,切实提升办公效率与创新能力。此次培训重点围绕文本起草、文件审批等日常办公场景,系统讲解DeepSeek智能系统在快速生成文档、智能分析文本等场景的应用方法,现场演示了如何通过优化提问方式,高效完成安全
“之前从现场确定到最终答复,写一份供电方案需耗费供电员工大量时间,现在使用基于光明电力大模型的AI智能体后,供电方案生成时间从数小时压缩至几分钟,还通过标准化输出减少人为误差,提高了工作效率和准确性。”3月31日,国网甘肃白银供电公司城区分公司业扩报装员王奇说。自DeepSeek爆火以来,国
“分析一下2025年春节期间聊城地区电力客户诉求。”3月19日,山东聊城供电公司供电服务指挥中心工作人员贾凯莉在对话框中,询问该公司自主研发的AI数智员工“供指小研”。不到20秒,“供指小研”就用图表和文字的“双模式”输出了服务质量、客户满意程度、热点诉求等关键数据,客观展示了2025年春节期
3月31日,深圳市科技创新局关于征集2025年度深圳市重点产业研发计划备选课题(第一批)的通知。包括新能源专项,重点支持方向包括新型储能技术、新一代核能技术、新能源汽车、能源数字化与智能化、氢能技术、可再生能源高效利用。深圳市重点产业研发计划单个项目资助强度最高不超过3000万元。受科技研
北极星电力网整理了2025年4月7日至2025年4月11日一周火电项目,涉及项目的核准、开工、投运等。国家能源集团宁夏六盘山2×1000MW、广东清远2×1000MW等60个项目电缆采购中标公示国家能源集团发布科环集团国能智深宁夏六盘山2×1000MW、广东清远2×1000MW等60个项目电缆采购公开招标中标候选人公示,第
北极星电力网整理了2025年4月7日至2025年4月11日一周电力项目:涉及火电、水电、核电项目的核准、开工、并网等。火电项目国家能源集团宁夏六盘山2×1000MW、广东清远2×1000MW等60个项目电缆采购中标公示国家能源集团发布科环集团国能智深宁夏六盘山2×1000MW、广东清远2×1000MW等60个项目电缆采购公
据正蓝旗发展和改革委员会消息,4月10日,内蒙古自治区正蓝旗人民政府与北方联合电力有限责任公司签署华能上都新能源外送基地联营项目合作框架协议。华能上都新能源外送基地联营项目由正蓝旗、北方电力公司共同谋划建设,项目依托正蓝旗良好的风能资源、上都发电公司火电调峰和上承三线送出通道,着力
记者从美国白宫官网获悉,美国总统特朗普于当地时间4月9日签署《零基监管预算释放美国能源》行政令(ZERO-BASEDREGULATORYBUDGETINGTOUNLEASHAMERICANENERGY),要求特定能源监管机构对能源法规实施“日落条款”。依据行政令的具体要求,美国环境保护局(EPA)、能源部(DoE)、联邦能源监管委员会(FE
国能清远石角热电一期燃机项目是广东省重点能源项目,也是国家能源集团在广东省内首个分布式能源站项目。建设为2×100MW级燃气-蒸汽联合循环抽凝热电联产机组,采用两套“一拖一”双轴配置的燃气-蒸汽联合循环机组。继2025年4月4日第一套机组完成72+24小时满负荷试运考核顺利转入商业运行后,2025年4月
在全球能源转型的浪潮中,绿电直连正逐渐成为能源领域的热门话题。对于行业从业人员来说,深入理解绿电直连的内涵、参与主体、实施原因、实现方式以及成功案例,对于把握行业发展趋势、挖掘投资机会至关重要。本文带大家一起了解一下。(来源:微信公众号“能源电力公社”)01什么是绿电直连绿电,通常
北极星售电网获悉,4月11日,甘肃省工业和信息化厅发布2025年3月甘肃省电力生产运行情况。3月,全省完成发电量210.76亿千瓦时,同比增长12.48%。1-3月,全省完成发电量602.34亿千瓦时,同比增长8.06%。3月,全省全社会用电量154.96亿千瓦时,同比增长4.73%。1-3月,全省全社会用电量累计451.12亿千瓦时
近日,浙能嘉兴电厂四期扩建项目10号机组建设用地获省政府批准。该项目总投资41.12亿元,项目总规模15.24公顷,新增建设用地9.6公顷。本项目规划新建1台1000MW一次再热超超临界燃煤发电机组,项目建成后将有效发挥煤电基础性调节作用,为嘉兴、杭州等浙江北部地区提供用电需求的同时,有效发挥煤电机组
北极星电力网获悉,近日,陕煤集团发布陕煤电力汨罗有限公司2×100万千瓦燃煤发电工程第一批辅机设备采购19个包设备招标公告。陕煤电力汨罗有限公司2×100万千瓦燃煤发电工程,位于湖南省岳阳市汨罗市白水镇双桥村。本期建设2×1000MW超超临界二次再热燃煤发电机组,同步建设烟气脱硫、脱硝、除尘装置。
陕煤电力汨罗有限公司陕煤汨罗2×100万千瓦燃煤发电工程桩基工程施工招标公告(招标编号:0866-25C1SXQY0279)项目所在点:湖南省岳阳市汨罗市一、招标条件本招标项目名称为陕煤汨罗2×100万千瓦燃煤发电工程桩基工程施工,招标人为陕煤电力汨罗有限公司,建设资金来自企业自筹,该项目已具备招标条件
近日,大唐集团发布【(陕西公司)大唐陕西西王寨煤电一体化项目电厂2X660MW新建工程烟气余热利用装置】中标候选人公示。第一中标候选人:济南山源环保科技有限公司,投标报价:19670000.00元;第二中标候选人:哈尔滨锅炉厂有限责任公司,投标报价:21250000.00元。
请使用微信扫一扫
关注公众号完成登录
| 姓名: | |
| 性别: | |
| 出生日期: | |
| 邮箱: | |
| 所在地区: | |
| 行业类别: | |
| 工作经验: | |
| 学历: | |
| 公司名称: | |
| 任职岗位: |

我们将会第一时间为您推送相关内容!
扫码下载APP
扫码关注公众号