我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
搞機(jī)器學(xué)習(xí)模型訓(xùn)練,算力不行,不行。谷歌 Cloud TPU v4 Pods 預(yù)覽版最新發(fā)布,算力再刷新高。
最近,在谷歌的I/O開發(fā)者大會(huì)上,谷歌除了發(fā)布令人眼花繚亂的新手機(jī)、AR 眼鏡和全家桶軟件升級(jí)之外, 還為全球的機(jī)器學(xué)習(xí)玩家?guī)砹艘话l(fā)「重磅炸彈」。
一年前亮相的 TPU v4,已經(jīng)正式部署在谷歌云機(jī)器學(xué)習(xí)集群上了。這件機(jī)器學(xué)習(xí)「大殺器」,已經(jīng)正式用在了 Google Cloud 最新機(jī)器學(xué)習(xí)集群的預(yù)覽版上。
谷歌表示,它將成為世界上最大的公開機(jī)器學(xué)習(xí)中心。
目前,除了最新的 Google Cloud 預(yù)覽版外,谷歌其余 SOTA 級(jí)別的產(chǎn)品,比如搜索引擎、視頻網(wǎng)站 Youtube 等等,都應(yīng)用了 TPU 處理器(即張量處理單元)。
劃時(shí)代的 TPU v4,碾壓 v3
TPU v4 是谷歌在去年的I/O大會(huì)上推出的芯片。
在當(dāng)時(shí)的開發(fā)者大會(huì)上,谷歌 CEO Sundar Pichai 花了 1 分 42 秒的時(shí)間介紹了這款芯片。
TPU v4 是谷歌的第四代定制 AI 芯片,其算力是上一版本 v3 的兩倍。性能相比前一代也提升了十倍多。
可以說,TPU v4 芯片給谷歌谷歌云平臺(tái)補(bǔ)上了十分關(guān)鍵的一環(huán)。機(jī)器學(xué)習(xí)的訓(xùn)練速度得以顯著提升。
量化來看,4096 個(gè) v4 TPU,即一個(gè) pod 的芯片,就可以提供超過一個(gè) exaflop(百億億浮點(diǎn)運(yùn)算)的 AI 計(jì)算能力。
可能上述數(shù)據(jù)還不夠直觀。對(duì)比來看,一個(gè) TPU pod 的計(jì)算能力如果達(dá)到了每秒百億億次浮點(diǎn)計(jì)算的級(jí)別,相當(dāng)于一千萬臺(tái)筆記本電腦之和。
以前要想獲得 1 個(gè) exaflop(每秒 10 的 18 次方浮點(diǎn)運(yùn)算)的算力,通常需要建立一個(gè)定制的超級(jí)計(jì)算機(jī)。
TPU 是谷歌的第一批定制芯片之一,當(dāng)包括微軟在內(nèi)的其他公司決定為其機(jī)器學(xué)習(xí)服務(wù)采用更靈活的 FPGA 時(shí),谷歌很早就在這些定制芯片上下了賭注。
谷歌早已部署了許多這樣的計(jì)算機(jī),在他們的數(shù)據(jù)中心有幾十個(gè) TPU v4 pods。
此外,最重要的是,谷歌這些數(shù)據(jù)中心將以 90% 或接近 90% 的無碳能源運(yùn)行。
看來,TPU v4 不光性能強(qiáng)大,還環(huán)保。
Google Cloud 最新預(yù)覽版!
在最近的谷歌I/O開發(fā)者大會(huì)上發(fā)布的 Google Cloud 最新機(jī)器學(xué)習(xí)集群的預(yù)覽版可謂是會(huì)上的一大亮點(diǎn)。
谷歌表示,「客戶對(duì)機(jī)器學(xué)習(xí)的容量、性能和規(guī)模的需求一直在快速增長(zhǎng)。為了支持 AI 的下一代基礎(chǔ)性進(jìn)步,我們推出了谷歌云機(jī)器學(xué)習(xí)集群。其中就包括預(yù)覽版的 Cloud TPU v4 Pod。」
谷歌毫不客氣的表示,「這就是世界上最快、最高效和最可持續(xù)的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施中心。」
在 Cloud TPU v4 Pods 的支持下,研究和開發(fā)人員能夠訓(xùn)練日益復(fù)雜的模型,來支持諸多算法系統(tǒng)。
比如,NLP(大規(guī)模自然語言處理)、推薦系統(tǒng)和計(jì)算機(jī)視覺算法等等。
谷歌表示,在算力最高可達(dá) 9 exaflops 的峰值聚合性能下,Cloud TPU v4 Pods 集群在算力方面是全世界最大的公開可用的機(jī)器學(xué)習(xí)中心。
而且別忘了上面說過的,不光算力強(qiáng),還環(huán)保。
谷歌數(shù)據(jù)中心的 Matt Eastwood 表示,「我們最近對(duì) 2000 名 IT 從業(yè)者進(jìn)行了調(diào)查。我們發(fā)現(xiàn),基礎(chǔ)設(shè)施算力不足往往是 AI 項(xiàng)目失敗的根本原因。」
「這也正是我們要推出 Cloud TPU v4 Pods 的原因。再加上我們能夠做到 90% 的操作由無碳能源提供動(dòng)力,說明我們不光在拔高算力水平,還同時(shí)關(guān)注可持續(xù)性。」
這其實(shí)很好理解。哪怕算力再?gòu)?qiáng),如果耗能過大,也不會(huì)是長(zhǎng)久之計(jì)。
既然聊到了可持續(xù)性,就再多說點(diǎn)有關(guān)該集群對(duì)能源利用的高效性。
除了上述提到的清潔能源供應(yīng)外,谷歌數(shù)據(jù)中心的電源使用效率(PUE)等級(jí)為 1.10。
而且,TPU v4 芯片每瓦特最大功率的峰值 Flop 還是上一代的 3 倍。
在去年推出這款芯片的時(shí)候,谷歌就承諾會(huì)在去年年底前推廣。當(dāng)時(shí),谷歌就給了一些 AI 巨頭使用許可,包括 Cohere、LG AI 研究中心、Meta、Salesforce 等等。
谷歌表示,用戶很喜歡新款芯片的性能和可擴(kuò)展性,TPU v4 的快速互連和優(yōu)化的軟件堆棧滿足了他們的需求。客戶可以通過該芯片優(yōu)良的架構(gòu)構(gòu)建各自的交互發(fā)展環(huán)境。
并且,因?yàn)?TPU v4 的靈活性,這款芯片也能完美的契合到客戶使用的框架中,包括 JAX、Pytorch、TensorFlow 等等。
這些特點(diǎn)讓研究人員能不斷推動(dòng) AI 的發(fā)展,訓(xùn)練大規(guī)模的 SOTA 機(jī)器學(xué)習(xí)模型。
幾年前谷歌還成立了 TRC,即 TPU Research Cloud 項(xiàng)目,給機(jī)器學(xué)習(xí)的從業(yè)人員提供了極強(qiáng)的算力支持。
憑借谷歌推出的芯片架構(gòu),開發(fā)人員得以實(shí)現(xiàn)自己的各種奇思妙想。
比方說,有人用 AI 寫波斯語詩(shī)集,有人利用計(jì)算機(jī)視覺和行為遺傳學(xué)來研究睡眠和運(yùn)動(dòng)引起的疲勞的區(qū)別等等。
谷歌副總裁、人工智能研究中心的 Jeff Dean 表示,「Cloud TPU v4 是一個(gè)里程碑式的產(chǎn)品。我們相信,有了它,未來我們可以和全球的機(jī)器學(xué)習(xí)開發(fā)人員開展更多合作,讓 AI 造福整個(gè)世界。」
(邯鄲小程序開發(fā))
小米應(yīng)用商店發(fā)布消息稱 持續(xù)開展“APP 侵害用戶權(quán)益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實(shí)體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購(gòu)物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺(tái)推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13