本文來自微信公眾號(hào):集智俱樂部 (ID:swarma_org),作者:Sophia Chen
本文來自微信公眾號(hào):集智俱樂部 (ID:swarma_org),作者:Sophia Chen
在弗吉尼亞州的庫(kù)爾佩珀縣,空氣中彌漫著干草和糞便的氣息,這里的牛數(shù)量是人類的三分之一。“我們有大片農(nóng)場(chǎng),大多數(shù)仍然是家族經(jīng)營(yíng),并且有很多森林,”Sarah Parmelee說道,她是該縣55,000名居民之一。“這里是迷人的美國(guó)小鎮(zhèn)風(fēng)情,”她補(bǔ)充道。
但是這個(gè)田園般的世外桃源正經(jīng)歷21世紀(jì)的重大轉(zhuǎn)變。過去幾年里,該縣已經(jīng)批準(zhǔn)了七個(gè)大型數(shù)據(jù)中心項(xiàng)目的建設(shè),這些項(xiàng)目將支持技術(shù)公司在生成式人工智能(AI)方面的擴(kuò)張計(jì)劃。在這些巨大的建筑內(nèi)部,成排的計(jì)算機(jī)服務(wù)器將用于訓(xùn)練像ChatGPT這樣的對(duì)話式AI模型,并向全世界每天約數(shù)十億的請(qǐng)求提供答案。這種建設(shè)將會(huì)給弗吉尼亞帶來長(zhǎng)遠(yuǎn)的影響,每個(gè)設(shè)施可能會(huì)消耗與數(shù)萬住宅相同的電量,這可能會(huì)推高居民的用電成本,并使該地區(qū)的電力基礎(chǔ)設(shè)施使用超出其容量限制。帕梅利和其他社區(qū)成員對(duì)數(shù)據(jù)中心的用電需求持謹(jǐn)慎態(tài)度,尤其弗吉尼亞已經(jīng)是全球的數(shù)據(jù)中心之都。2024年12月發(fā)布的一項(xiàng)審查指出,盡管數(shù)據(jù)中心帶來了經(jīng)濟(jì)效益,但持續(xù)增長(zhǎng)可能會(huì)在未來十年內(nèi)使弗吉尼亞的電力需求翻倍。
“電將從哪里來?”帕梅利問道,她正在繪制該州數(shù)據(jù)中心的增長(zhǎng)地圖,并為位于弗吉尼亞州沃倫頓的非營(yíng)利組織皮埃蒙特環(huán)境委員會(huì)(Piedmont Environmental Council)工作。他們都說,“我們會(huì)從其他地區(qū)購(gòu)買電力。”但可能那個(gè)區(qū)正計(jì)劃從你這里購(gòu)買電力。”
類似關(guān)于AI和能源的沖突正在全球許多地方上演,這些地方的數(shù)據(jù)中心都在以創(chuàng)紀(jì)錄的速度涌現(xiàn)。大型科技公司正大力押注生成式AI,這比舊的AI模型需要更多的能量來運(yùn)行,因?yàn)榕f模型只是提取數(shù)據(jù)中的模式,而不生成新的文本和圖像。這使得企業(yè)集體花費(fèi)數(shù)百億美元用于新建數(shù)據(jù)中心和服務(wù)器,以擴(kuò)大其算力容量。
從全球視角來看,AI對(duì)未來電力需求的影響相對(duì)較小,但是對(duì)數(shù)據(jù)中心密集的地方的影響較為深遠(yuǎn)。與其他能源密集型設(shè)施相比,如鋼鐵廠和煤礦,數(shù)據(jù)中心的空間密集度要高得多。公司傾向?qū)?shù)據(jù)中心的建筑建設(shè)地彼此靠近,以便共享電網(wǎng)和冷卻系統(tǒng),并高效地傳輸信息,既包括內(nèi)部傳輸,也包括傳輸?shù)接脩簟L貏e地,由于弗吉尼亞州提供稅收優(yōu)惠,越來越多的數(shù)據(jù)中心公司在此聚集。
“如果有了一個(gè),很可能就會(huì)有更多,”帕梅利說。弗吉尼亞已經(jīng)擁有340個(gè)這樣的設(shè)施,而帕梅利繪制的地圖顯示弗吉尼亞還有159個(gè)計(jì)劃中的數(shù)據(jù)中心或現(xiàn)有中心的擴(kuò)建項(xiàng)目,據(jù)位于加利福尼亞州帕洛阿爾托的研究機(jī)構(gòu)EPRI的一份報(bào)告稱,這些數(shù)據(jù)中心占該州電力使用的四分之一以上[2]。在愛爾蘭,數(shù)據(jù)中心消耗的電力超過了全國(guó)用電量的20%,其中大部分位于都柏林邊緣地區(qū)。在美國(guó),至少有五個(gè)州的數(shù)據(jù)中心耗電量已超過10%。
更棘手的情況是,企業(yè)對(duì)其AI系統(tǒng)電力需求的數(shù)據(jù)缺乏透明度。“真正的問題是,我們?cè)诓僮鲿r(shí)幾乎無法獲取詳細(xì)數(shù)據(jù)和信息,”獨(dú)立研究員喬納森·庫(kù)米說,他研究計(jì)算機(jī)能源使用三十多年時(shí)間,并在加州伯靈格姆運(yùn)營(yíng)一家分析公司。
“我認(rèn)為這個(gè)領(lǐng)域的研究人員都在抓狂,因?yàn)槲覀兊貌坏轿覀冃枰臄?shù)據(jù),”阿姆斯特丹自由大學(xué)研究員、荷蘭公司Digiconomist的創(chuàng)始人亞歷克斯·德弗里斯說,這家公司研究數(shù)字趨勢(shì)帶來的意外后果。“我們只能盡力而為,嘗試各種方法來得出一些數(shù)字。”
估算AI能源需求
由于缺乏公司的詳細(xì)數(shù)據(jù),研究人員以兩種方式探討了AI的能源需求。2023年,德弗里斯使用了一種供應(yīng)鏈(或基于市場(chǎng)的)方法。他查看了NVIDIA服務(wù)器的功耗,該服務(wù)器在生成式AI市場(chǎng)占據(jù)主導(dǎo)地位,并據(jù)此推算一年所需的電力。然后,他根據(jù)特定任務(wù)所需此類服務(wù)器總數(shù)的估計(jì)值乘以這一數(shù)字。
德弗里斯用這種方法估計(jì)了如果谷歌搜索使用生成式AI所需的能量。兩家能源分析公司估計(jì),谷歌搜索使用類似ChatGPT的AI需要40到50萬臺(tái)NVIDIA A100服務(wù)器,基于這些服務(wù)器的功率需求,這將相當(dāng)于每年23至29太瓦時(shí)(TWh)的電力。然后,根據(jù)分析師提供的每日高達(dá)90億次搜索的估算(不同來源的估計(jì)數(shù)字),德弗里斯計(jì)算出每次通過AI服務(wù)器的請(qǐng)求大約需要7至9瓦時(shí)(Wh)的電力。按照谷歌在2009年博客文章中報(bào)道的數(shù)字,這是普通搜索使用電力的23至30倍(參見go.nature.com/3d8sd4t)。對(duì)此,谷歌方?jīng)]有回應(yīng)。
德弗里斯說,這種計(jì)算方式感覺像是“抓住救命稻草”(grasping at straws),因?yàn)樗坏貌灰揽縼碜缘谌降墓浪恪6臄?shù)字很快過時(shí)了,因?yàn)楝F(xiàn)在的AI模型在計(jì)算成本僅為2023年模型一小部分的情況下,也可以達(dá)到相同的準(zhǔn)確度,所以現(xiàn)在用于集成AI的谷歌搜索所需的服務(wù)器數(shù)量可能更低,正如美國(guó)能源分析公司SemiAnalysis(德弗里斯估算的來源數(shù)據(jù))在給《自然》雜志的電子郵件中所寫道。
即便如此,該公司表示,評(píng)估生成式AI能耗的最佳方式仍然是監(jiān)控服務(wù)器發(fā)貨量及其功率需求,這是許多分析師廣泛采用的方法。然而,要分離出僅由生成式AI使用的能量是很困難的,因?yàn)閿?shù)據(jù)中心通常也需要執(zhí)行非AI任務(wù)。
自下而上的估算
另一種評(píng)估AI能耗需求的方法是“自下而上”的:研究人員測(cè)量一個(gè)與AI相關(guān)的請(qǐng)求在一個(gè)具體數(shù)據(jù)中心中的電力需求。然而,獨(dú)立研究人員只能使用開源的AI模型進(jìn)行測(cè)量,這些模型的能耗預(yù)計(jì)和私有模型(非開源)類似。
這些測(cè)試背后的概念是用戶提交一個(gè)提示,例如生成圖像或文本聊天的請(qǐng)求,然后Python軟件包CodeCarbon可允許用戶電腦訪問數(shù)據(jù)中心,獲取模型執(zhí)行芯片的技術(shù)細(xì)節(jié)。“在運(yùn)行結(jié)束時(shí),它會(huì)提供所使用的硬件消耗了多少電力的估計(jì)值,”薩莎·盧西奧尼說,他是幫助開發(fā)CodeCarbon的AI研究員,并且在紐約市的Hugging Face工作,該公司托管了一個(gè)開放源代碼平臺(tái),用于AI模型和數(shù)據(jù)集。
盧西奧尼和其他人發(fā)現(xiàn)不同的任務(wù)需要不同的能量。根據(jù)他們最新的結(jié)果,平均而言,根據(jù)文本提示生成圖像大約消耗0.5 Wh的電力,而生成文本則略少。作為比較,現(xiàn)代智能手機(jī)充滿電大約需要22 Wh。但存在很大的差異:較大的模型需要更多的能量(參見‘AI使用多少能量?’)。德弗里斯說,這些數(shù)字低于他論文中的數(shù)字,但這可能是因?yàn)楸R西奧尼等人測(cè)試用的模型至少比支持ChatGPT的模型小一個(gè)數(shù)量級(jí),以及AI變得越來越高效。
這些數(shù)字是一個(gè)下限,根據(jù)卡內(nèi)基梅隆大學(xué)的計(jì)算機(jī)科學(xué)家艾瑪·斯特魯貝爾(Emma Strubell)的說法,他是盧西奧尼的合作研究者。他們說,“否則,公司會(huì)出來糾正我們,但他們并沒有。”此外,公司通常不會(huì)提供估算數(shù)據(jù)中心冷卻(data-centre cooling)所需電力相關(guān)的信息。據(jù)法國(guó)的數(shù)據(jù)科學(xué)家本諾瓦·科爾蒂(Beno?t Courty)所說,CodeCarbon也無法訪問某些類型的芯片的能量消耗數(shù)據(jù),這包括谷歌的專有TPU芯片,他是CodeCarbon的維護(hù)者。
AI在不同任務(wù)上的能耗
盧西奧尼還研究了一個(gè)模型從大量數(shù)據(jù)中提取統(tǒng)計(jì)模式,也就是訓(xùn)練生成式AI模型需要多少能量。訓(xùn)練像GPT-3這樣的模型,即ChatGPT的第一個(gè)版本背后的模型,需要的能量約為千兆瓦時(shí)。但按照模型每天接收數(shù)十億次請(qǐng)求的計(jì)算,那么回答這些查詢所消耗的電力,能耗在太瓦時(shí)量級(jí),依然主導(dǎo)AI每年的能耗需求。
上個(gè)月,盧西奧尼和其他研究人員發(fā)起了AI Energy Score項(xiàng)目,這是一個(gè)公共倡議,旨在比較不同任務(wù)上的AI模型的能效,并給每個(gè)模型評(píng)級(jí)。封閉源代碼模型的開發(fā)者也可以上傳測(cè)試結(jié)果,然而目前只有美國(guó)軟件公司Salesforce參與了進(jìn)來,盧西奧尼說。
隨著競(jìng)爭(zhēng)的加劇,公司對(duì)于其最新行業(yè)模型的能源需求越來越閉口不談,‘公司間共享信息的現(xiàn)象有所減少’,斯特魯貝爾說。如谷歌和微軟等公司的報(bào)告所稱,歸因于支持AI的數(shù)據(jù)中心建設(shè),他們的碳排放量正在增加。(當(dāng)被《自然》雜志提及缺乏透明度的批評(píng)時(shí),包括谷歌、微軟和亞馬遜在內(nèi)的公司沒有回應(yīng);相反,它們強(qiáng)調(diào)正在與地方當(dāng)局合作,確保新建的數(shù)據(jù)中心不會(huì)影響當(dāng)?shù)氐墓迷O(shè)施供應(yīng)。)
一些政府現(xiàn)在要求公司提高透明度。2023年,歐盟通過了一項(xiàng)能源效率指令,要求能耗500千瓦功率以上的數(shù)據(jù)中心運(yùn)營(yíng)商每年報(bào)告其能源消耗。
全球性的預(yù)測(cè)
基于供應(yīng)鏈估算方法,分析師表示數(shù)據(jù)中心目前僅占世界電力需求的一小部分。國(guó)際能源署(IEA)估計(jì),在2022年,此類設(shè)施使用的電量為240至340太瓦時(shí),或占世界需求的1%到1.3%,如果包括加密貨幣挖掘和數(shù)據(jù)傳輸基礎(chǔ)設(shè)施,這一比例將升至2%[4]。
AI的爆發(fā)將會(huì)增加這一比例,但由于許多行業(yè)的電氣化、電動(dòng)汽車的增長(zhǎng)以及空調(diào)需求的增加,預(yù)計(jì)到2050年全球電力消耗將增長(zhǎng)超過80%,因此數(shù)據(jù)中心“在全球電力需求增長(zhǎng)中所占的比例相對(duì)較小”,IEA報(bào)道[4]。
即使有對(duì)AI當(dāng)前能源需求的估算值,也很難預(yù)測(cè)未來趨勢(shì),庫(kù)米警告說。“沒有人知道即使是幾年后,數(shù)據(jù)中心(無論是AI還是傳統(tǒng)型)將使用多少電力”,他說。主要原因是未來所需的服務(wù)器和數(shù)據(jù)中心數(shù)量存在問題,在財(cái)政的激勵(lì)下,公用事業(yè)公司和技術(shù)公司通常夸大數(shù)字。并且,許多預(yù)測(cè)是基于“簡(jiǎn)單化的假設(shè)”,他們將最近的趨勢(shì)外推到未來十年或十五年。
去年晚些時(shí)候,庫(kù)米與他人合著了一份由美國(guó)能源部資助的報(bào)告[5],該報(bào)告估計(jì)美國(guó)的數(shù)據(jù)中心目前使用國(guó)家電力的176太瓦時(shí)(4.4%),并且到2028年可能會(huì)翻倍或三倍,達(dá)到總用電量的7%到12%。
與此同時(shí),SemiAnalysis在其2024年3月的報(bào)告中指出(參見go.nature.com/439becc),到2028年,數(shù)據(jù)中心將消耗美國(guó)15%的電力,到2030年將消耗全球能源生產(chǎn)的4.5%(大約是IEA數(shù)據(jù)的兩倍)。IEA計(jì)劃下個(gè)月更新其數(shù)據(jù),但無論其預(yù)測(cè)如何,顯然,AI對(duì)能源的影響在地方和區(qū)域?qū)用嫔献顬槊黠@。
弗吉尼亞的壓力
就在世界各地的研究人員盡力評(píng)估AI對(duì)能源的影響時(shí),弗吉尼亞州的居民也缺少有關(guān)該地區(qū)數(shù)據(jù)中心用電情況的信息。帕梅利通過查閱新聞報(bào)道、行業(yè)出版物、稅務(wù)申報(bào)和眾包提示,追蹤了一些數(shù)據(jù)中心的電力需求,然而,要找到相關(guān)的信息非常具有挑戰(zhàn)性。
里士滿弗吉尼亞州立法審計(jì)審查委員會(huì)的首席立法政策分析師馬克·格里賓(Mark Gribbin)表示,當(dāng)?shù)仉娏敬_實(shí)知道建造數(shù)據(jù)中心的公司承諾需要多少電力。作為監(jiān)督州級(jí)項(xiàng)目和機(jī)構(gòu)的政府機(jī)構(gòu)成員,他共同撰寫了那份數(shù)據(jù)中心將在十年內(nèi)使弗吉尼亞的電力需求翻倍的報(bào)告[1]。但是,公司通常不會(huì)公開單個(gè)數(shù)據(jù)中心的具體電力需求。
上個(gè)月,弗吉尼亞州議員通過了一項(xiàng)數(shù)據(jù)中心透明度法案,該法案在《自然》雜志付印時(shí)正等待州長(zhǎng)簽署。它不要求公司披露其電力需求,而是呼吁報(bào)告對(duì)環(huán)境的影響,涉及用水、土地使用等方面。
與此同時(shí),弗吉尼亞州的電力基礎(chǔ)設(shè)施已顯示出緊張跡象。位于華盛頓特區(qū)以西的威廉王子縣的一些批準(zhǔn)的數(shù)據(jù)中心面臨長(zhǎng)達(dá)三年的延遲,因?yàn)殡娏緹o法按承諾的時(shí)間向它們供電。
JLARC的報(bào)告稱,弗吉尼亞州的公用事業(yè)公司將“非常困難”地建立足夠的基礎(chǔ)設(shè)施以滿足預(yù)期的數(shù)據(jù)中心需求。太陽(yáng)能設(shè)施需要以2024年年度兩倍的速度增加,風(fēng)力發(fā)電能力則必須超過迄今為止所有為未來發(fā)展預(yù)留的海上風(fēng)電場(chǎng)。
在某些情況下,建造數(shù)據(jù)中心的公司正試圖自己采購(gòu)電力供應(yīng)。例如,去年微軟達(dá)成了一項(xiàng)重啟賓夕法尼亞州三里島核電站反應(yīng)堆的協(xié)議,以幫助為其AI運(yùn)營(yíng)供電。雖然其中一些項(xiàng)目使用低碳或可再生能源,但一些公用事業(yè)公司和立法者正在推動(dòng)發(fā)展更多的化石燃料電廠,比如燃燒天然氣的電廠,然而這將增加碳排放。
AI的需求是否會(huì)下降?
建造數(shù)據(jù)中心的熱潮基于更多人想要更頻繁地使用AI的預(yù)期。但是,“AI使用的速度和方式仍然根本不確定”,IEA分析員在去年的一篇評(píng)論文章中寫道(參見go.nature.com/4hu2hos)。人們擔(dān)心AI表現(xiàn)的不一致性以及版權(quán)侵權(quán)訴訟;也不清楚將來為生成式AI提供計(jì)算能力究竟需要多少資源。
2014年1月至2024年8月美國(guó)數(shù)據(jù)中心投資情況,圖片來源:go.nature.com/4hu2hos
中國(guó)今年早些時(shí)候發(fā)布的DeepSeek-R1模型能夠以明顯的成本優(yōu)勢(shì)與美國(guó)模型相匹敵。這讓一些研究人員認(rèn)為現(xiàn)在可以創(chuàng)建更好的模型而不必使其變得更“大”,這可能降低數(shù)據(jù)中心的計(jì)算需求。
集智百科團(tuán)隊(duì)對(duì)DeepSeek-R1模型原理的拆解:DeepSeek-R1|集智百科
相比之下,如果生成式AI變得更加高效,人們很可能會(huì)更加頻繁地使用它——這就是所謂的杰文斯悖論(Jevons paradox),得名于十九世紀(jì)英國(guó)經(jīng)濟(jì)學(xué)家威廉·斯坦利·杰文斯。他觀察到煤炭技術(shù)效率的提高也加速了開采,從而抵消了節(jié)省下的能源。
十年后,按照計(jì)劃,生成式AI的使用量可能會(huì)增長(zhǎng),庫(kù)爾佩珀縣目前提議的所有數(shù)據(jù)中心都將以滿負(fù)荷運(yùn)行;也有可能生成式AI將成為一種相對(duì)小眾的技術(shù),由于需求不足,一些數(shù)據(jù)中心將關(guān)閉。
“如果做出有把握的預(yù)測(cè),但這件事本身又存在巨大的不確定性,有人就會(huì)遭受損失”,庫(kù)米說。
參考文獻(xiàn):
1.Joint Legislative Audit and Review Commission.Data Centers in Virginia 2024.JLARC Report 598(JLARC,2024).
2.Electric Power Research Institute.Powering Intelligence:Analyzing Artificial Intelligence and Data Center Energy Consumption(EPRI,2024).
3.De Vries,A.Joule 7,2191–2194(2023).
4.International Energy Agency.World Energy Outlook 2024(IEA,2024).
5.Shehabi,A.et al.United States Data Center Energy Usage Report(Lawrence Berkeley National Laboratory,2024).
支持一下 ??修改