摘要: 原標(biāo)題:天垓100完成百億級(jí)參數(shù)大模型訓(xùn)練 6月10日,在第五屆智源大會(huì)AI系統(tǒng)分論壇上,上海天數(shù)智芯半導(dǎo)體有限公司宣布,在天垓100加速卡的算力集群,
原標(biāo)題:天垓100完成百億級(jí)參數(shù)大模型訓(xùn)練
6月10日,在第五屆智源大會(huì)AI系統(tǒng)分論壇上,上海天數(shù)智芯半導(dǎo)體有限公司宣布,在天垓100加速卡的算力集群,基于北京智源人工智能研究院70億參數(shù)的Aquila語(yǔ)言基礎(chǔ)模型,使用代碼數(shù)據(jù)進(jìn)行繼續(xù)訓(xùn)練,穩(wěn)定運(yùn)行19天,模型收斂效果符合預(yù)期,證明天數(shù)智芯有支持百億級(jí)參數(shù)大模型訓(xùn)練的能力。
上海天數(shù)智芯半導(dǎo)體有限公司是通用GPU高端芯片及超級(jí)算力系統(tǒng)提供商。據(jù)介紹,在北京市海淀區(qū)的支持下,智源研究院、天數(shù)智芯與愛(ài)特云翔共同合作,聯(lián)手開(kāi)展基于自主通用GPU的大模型CodeGen(高效編碼)項(xiàng)目,通過(guò)中文描述來(lái)生成可用的C、Java、Python代碼以實(shí)現(xiàn)高效編碼。
智源研究院負(fù)責(zé)算法設(shè)計(jì)、訓(xùn)練框架開(kāi)發(fā)、大模型的訓(xùn)練與調(diào)優(yōu),天數(shù)智芯負(fù)責(zé)提供天垓100加速卡、構(gòu)建算力集群及全程技術(shù)支持,愛(ài)特云翔負(fù)責(zé)提供算存網(wǎng)基礎(chǔ)硬件及智能化運(yùn)維服務(wù)。
據(jù)介紹,與國(guó)際主流的A100加速卡集群相比,天垓100加速卡集群的收斂效果、訓(xùn)練速度、線(xiàn)性加速比相當(dāng),穩(wěn)定性更優(yōu)。天數(shù)智芯將與合作伙伴們共同建設(shè)更大規(guī)模的天垓100算力集群,完成更大參數(shù)規(guī)模的大模型訓(xùn)練,以自主通用GPU產(chǎn)品更好支持國(guó)內(nèi)大模型創(chuàng)新應(yīng)用。
原標(biāo)題:武大雷軍班100%具備保研資格 配備最優(yōu)師資力量,實(shí)行小班教學(xué) 據(jù)武漢
快資訊2024-04-11 17:05:21
原標(biāo)題: 官方:一批省會(huì)高校,落戶(hù)縣城! 近日,廬江縣與安徽新聞出版職業(yè)
快資訊2024-04-10 19:24:31
原標(biāo)題:東莞高中引進(jìn)香港高中教學(xué)體系,學(xué)子可參加香港高考 東莞市海逸外
快資訊2024-04-10 19:18:36
原標(biāo)題:盤(pán)點(diǎn)!OSSD課程申請(qǐng)全球TOP大學(xué)有哪些優(yōu)勢(shì)? OSSD全稱(chēng)為Ontario Secondary
快資訊2024-04-08 18:13:22
原標(biāo)題:北京大學(xué),公布重要院系排名! 本科課堂教學(xué)質(zhì)量不僅關(guān)乎學(xué)生個(gè)體的
快資訊2024-04-07 21:05:17
原標(biāo)題:親歷南昌雷暴大風(fēng)天氣的大學(xué)生:風(fēng)雨突然破窗灌入教室 4月2日17時(shí)許
快資訊2024-04-04 19:31:30
原標(biāo)題:一系列新政實(shí)施 澳洲學(xué)簽發(fā)放量暴跌35% 澳大利亞政府本周宣布,由于
快資訊2024-04-01 22:57:11
原標(biāo)題:救命打人可觸發(fā)警報(bào)!多地學(xué)校廁所安裝防欺凌裝置 校園欺凌現(xiàn)象備
快資訊2024-03-31 20:02:29