在线观看免费成人av_久久久久久久久久久综合_国产精品视频一区二区三区四区五区_另类小说第一页_天天干在线影院_九一免费在线观看_草草久久久无码国产专区_成人短视频在线观看免费_无码熟妇人妻av在线电影_中文字幕第一页亚洲_成人黄色片视频_日韩精品久久一区二区

首頁 > 生活分享 > 免費教學 > 還得是華為!Pangu Ultra MoE架構:不用GPU,你也可以這樣訓練準萬億MoE大模型

還得是華為!Pangu Ultra MoE架構:不用GPU,你也可以這樣訓練準萬億MoE大模型

發布時間:2025-05-30 14:41:39

Pangu Ultra MoE 是一個全流程在昇騰 NPU 上訓練的準萬億 MoE 模型,此前發布了英文技術報告[1]。最近華為盤古團隊發布了 Pangu Ultra MoE 模型架構與訓練方法的中文技術報告,進一步披露了這個模型的細節。

超大規模和極高稀疏性的 MoE 模型極具挑戰,訓練過程中的穩定性往往難以保障。針對這一難題,盤古團隊在模型架構和訓練方法上進行了創新性設計,成功地在昇騰 NPU 上實現了準萬億 MoE 模型的全流程訓練。

盤古團隊提出 Depth-Scaled Sandwich-Norm(DSSN)穩定架構和 TinyInit 小初始化的方法,在昇騰 NPU 上實現了 10+ T tokens 數據的長期穩定訓練。此外,他們還提出了 EP group loss 負載優化方法,這一設計不僅保證了各個專家之間能保持較好的負載均衡,也提升了專家的領域特化能力。同時,Pangu Ultra MoE 使用了業界先進的 MLA 和 MTP 架構,在訓練時使用了 Dropless 訓練策略。

  • 技術報告標題:Pangu Ultra MoE 模型架構與訓練方法

  • 技術報告地址:https://raw.gitcode.com/ascend-tribe/pangu-ultra-moe/raw/main/Pangu_Ultra_MoE_CN_Report.pdf

破解準萬億 MoE 模型性能瓶頸

打造芯片協同的先進架構

近期,盤古團隊在 MoE 模型訓練領域再進一步,重磅推出參數規模高達 718B 的準萬億全新模型 ——Pangu Ultra MoE。該模型旨在實現超大規模 MoE 架構在模型效果與效率之間的最佳平衡。

為了達到這個目標,研究團隊在設計 Pangu Ultra MoE 架構的時候,充分考慮昇騰硬件特性,在昇騰 NPU 平臺上,融合計算、通信和內存等多維度指標,構建了大規模系統模擬器,并系統性地探索約一萬個不同的 MoE 結構組合,最終搜索出一套在訓練與推理吞吐上均達最優的架構方案。

Pangu Ultra MoE 是一個超大規模、高稀疏比的架構,同時也包含 MLA 和 MTP 等先進架構和特有的 DSSN 穩定性架構和 EP group loss 負載優化。下面是 Pangu Ultra MoE 的主要的架構和訓練特性:

  • 超大規模和超高稀疏比:采用 256 個路由專家,每個 token 激活 8 個專家,模型總參數量 718B,激活量 39B。

  • MLA 注意力機制:引入 MLA(Multi-head Latent Attention),有效壓縮 KV Cache 空間,緩解推理階段的內存帶寬瓶頸,優于傳統 GQA 方案。

  • MTP 多頭擴展:采用單頭 MTP 進行訓練,后續復用 MTP 參數擴展至多頭結構,實現多 Token 投機推理,加速整體推理過程。

  • Dropless 訓練:采用 Dropless 訓練可以避免 Drop&Pad 訓推不一致問題,并且提升訓練的數據效率。

  • RL 訓練:采用迭代難例挖掘與多能力項均衡的獎勵函數,并參考 GRPO 算法,提升了模型的訓練效率與最終推理性能。

以下是 Pangu Ultra MoE 昇騰親和設計考慮:

  • 隱藏維度貼合硬件:設置 7680 維隱藏層,精準匹配昇騰芯片的 16×16 MatMul 單元,充分發揮 Cube 核心的計算潛力。

  • 層數親和流水線并行:設置 61 層 Transformer 結構,并預留額外 MTP 層空間,保障計算負載均衡的 PP/VPP 流水線調度,減少 pipeline 氣泡,提升整體并行效率。

  • 專家規模符合冪次規律:路由專家數量設為2?=256,在 TP×EP 并行下提升 All-to-All 通信效率,有效加速分布式訓練。

Pangu Ultra MoE 的預訓練階段在 6k 到 10k 張 NPU 上進行,全流程采用 dropless 訓練模式。預訓練階段進行了長序列擴展,最終模型具備 128k 長序列能力。在后訓練階段,Pangu Ultra MoE 移除了負載均衡輔助損失,保留專家間已有的特化能力,從而進一步提升模型對目標數據的學習效率。如表1所示,最終模型在多個權威開源評測集上展現出一流的效果。

表 1: Pangu Ultra MoE 與目前主流模型效果對比

免費教學更多>>

央視“第一發布”車企首秀 長安馬自達EZ-60獲央視認證 又有兩款行星關節模組成功下線,萬里揚機器人業務再曝進展 因韓美關稅協議陷入停滯,現代汽車集團承壓 速騰聚創單月激光雷達交付量超12萬臺 Grab將向遠程駕駛服務公司Vay投6,000萬美元 實測卓馭10萬元級城市領航輔助:上車端到端2.0模型,復雜路口、人車混行都能應對 硬派越野破局者福特智趣烈馬重慶預售 三季度銷量營收均創新高后,蔚來汽車還是虧損近35億 北京越野BJ40探險家發布,老外觀、新內飾,配分時四驅,兩種動力 福特智趣烈馬正式亮相,全能新能源露營 SUV 滿足日常與戶外需求 嵐圖泰山上市 自成豪華SUV標桿 中國汽車開始書寫豪華車市場新規則 油電同智有高招 一汽奧迪轉型穩中求進 奔馳“小G”諜照曝光,外觀很方正硬朗,背掛小書包,2027年發布 安森美推出一項突破性的功率半導體技術 第十三屆汽車與環境創新論壇 蔚來全新ES8交付破萬 尚元智行獲近億元A輪融資 實力蟬聯汽車新供應鏈百強,移遠智能座艙模組彰顯硬核實力! 東風日產天籟·鴻蒙座艙第四季度上市 三電系統持續升級 技術打磨精細化 浩思動力斬獲“2025蓋世汽車金輯獎中國汽車新供應鏈百強”稱號 日產汽車預警當前財年將虧損18億美元,股價應聲下跌 小馬智行通過港交所聆訊,“全球Robotaxi第一股”回港上市進入倒計時 70萬級超豪華轎車9月銷量榜:尊界S800一騎絕塵,市場格局重塑 連續7個月銷量破萬,微小卡“金九”表現如何?遠程/福田/奇 瑞前三 阿里投融,穹徹智能完成新一輪融資 報廢機動車細則修改破局:82萬噸退役動力電池回收有了新路徑 尹同躍與任正非在深圳華為總部會晤 零跑汽車明年將在歐洲投產B10純電SUV,對標大眾ID.4與斯柯達Elroq 挪威提議擴大電動汽車征稅范圍,特斯拉車型將被納入
在线观看免费成人av_久久久久久久久久久综合_国产精品视频一区二区三区四区五区_另类小说第一页_天天干在线影院_九一免费在线观看_草草久久久无码国产专区_成人短视频在线观看免费_无码熟妇人妻av在线电影_中文字幕第一页亚洲_成人黄色片视频_日韩精品久久一区二区
欧美久久在线观看| 日韩人妻无码精品久久久不卡| 国产又黄又爽免费视频| 97成人在线观看视频| 黄色一级视频播放| xx欧美撒尿嘘撒尿xx| 亚洲中文字幕无码专区| 波多野结衣av一区二区全免费观看| 久久久精品麻豆| 欧美 国产 日本| 欧美一级免费播放| 天天做天天躁天天躁| 国产一级片中文字幕| 欧美成人福利在线观看| 日本新janpanese乱熟| 男人日女人bb视频| 黄色一级片播放| 337p粉嫩大胆噜噜噜鲁| 911av视频| 亚洲一二三区av| 日本免费黄视频| 国产午夜福利视频在线观看| 男女日批视频在线观看| 白白操在线视频| 欧美大黑帍在线播放| www.激情网| 国产一级不卡视频| 隔壁人妻偷人bd中字| 无码熟妇人妻av在线电影| www.亚洲成人网| 欧美一级片免费播放| 国产九九九九九| 动漫av网站免费观看| 免费日韩视频在线观看| 青青青国产在线视频| 天天干天天草天天| 亚洲制服在线观看| www.男人天堂网| 日韩中文字幕在线视频观看| 99精品视频播放| 三级a三级三级三级a十八发禁止| 成人日韩在线视频| 亚洲欧美日韩一二三区| 欧美日韩午夜爽爽| 国产 日韩 亚洲 欧美| 精品中文字幕av| jizz大全欧美jizzcom| 亚洲图片 自拍偷拍| 波多野结衣 作品| 波多野结衣家庭教师在线播放 | 网站在线你懂的| 日本精品免费视频| 国产精品后入内射日本在线观看| 成人在线看视频| 久无码久无码av无码| 欧美国产亚洲一区| www.这里只有精品| 日本一二三区视频在线| 免费看一级大黄情大片| 奇米影音第四色| av中文字幕av| 欧美牲交a欧美牲交aⅴ免费下载| 久热精品在线播放| 成年人深夜视频| 人人爽人人av| 亚洲区成人777777精品| 精品99在线视频| 香蕉视频xxx| 欧美日韩黄色一级片| 亚洲天堂av一区二区| 国产精品一线二线三线| 天天爽天天爽夜夜爽| 欧洲美女和动交zoz0z| 国产成人精品视频免费看| 天堂在线中文在线| 2019日韩中文字幕mv| 艹b视频在线观看| 妞干网在线观看视频| 182午夜视频| 黑森林福利视频导航| 欧美日韩一区二区三区电影| 北条麻妃在线视频| 亚洲理论电影在线观看| 天天做天天干天天操| 妺妺窝人体色www在线小说| 强开小嫩苞一区二区三区网站 | 鲁一鲁一鲁一鲁一澡| 最新av免费在线观看| 人妻精品无码一区二区三区| 男女h黄动漫啪啪无遮挡软件| 9999在线观看| 欧美伦理视频在线观看| 免费看欧美黑人毛片| 青青草久久伊人| 欧美黄网站在线观看| 精品视频在线观看一区二区| 色呦色呦色精品| 日本一本二本在线观看| 日本aa在线观看| 性久久久久久久久久久久久久| 国产精品99久久免费黑人人妻| 久久久久99精品成人片| 欧美一级免费在线| 不卡av免费在线| 成年人午夜免费视频| 99久热在线精品视频| 两性午夜免费视频| www.com黄色片| 亚欧在线免费观看| 久久久久久久久久久视频| www.激情网| 国产人妻人伦精品| 亚洲av综合色区| 亚洲第一综合网站| 精品视频在线观看一区| 777久久精品一区二区三区无码 | 久久婷婷五月综合色国产香蕉| 吴梦梦av在线| 在线观看免费污视频| 国产午夜福利视频在线观看| 人妻夜夜添夜夜无码av| 黄色一级片av| 日韩a一级欧美一级| youjizzxxxx18| 少妇人妻互换不带套| 毛片一区二区三区四区| 欧美日韩视频免费| 亚洲精品综合在线观看| 国产精品久久a| 在线免费观看av的网站| 日韩无套无码精品| 亚洲乱码中文字幕久久孕妇黑人| 亚洲中文字幕无码av永久| 狠狠精品干练久久久无码中文字幕| 国产大片一区二区三区| 欧美aaa在线观看| 欧美日韩第二页| 亚洲性生活网站| 亚洲天堂网2018| 一级黄色高清视频| 精品国产三级a∨在线| 国产日韩欧美大片| 国产欧美日韩小视频| 久久亚洲中文字幕无码| 国产最新免费视频| 日本美女高潮视频| 久久婷婷综合色| 久久久国产精华液999999 | 午夜影院免费观看视频| theporn国产精品| 中文字幕制服丝袜在线| 国内精品视频一区二区三区| 北条麻妃在线观看| 日本女优爱爱视频| 日韩精品视频一二三| 五月六月丁香婷婷| 女女百合国产免费网站| 亚洲人成无码网站久久99热国产 | 国产a级一级片| 欧美日韩午夜爽爽| 青青青在线视频播放| 亚洲精品乱码久久久久久自慰| 91制片厂毛片| 麻豆映画在线观看| 黄色免费福利视频| 亚洲黄色小视频在线观看| www.色欧美| 8x8x华人在线| 激情伊人五月天| 搡女人真爽免费午夜网站| 毛片毛片毛片毛片毛| 欧洲精品在线播放| 成人免费无码av| 在线观看成人免费| 亚洲 高清 成人 动漫| 超碰在线97免费| 欧美 日韩 国产 在线观看| 污污污污污污www网站免费| 日本一本二本在线观看| 精品综合久久久久| 成熟了的熟妇毛茸茸| 中文字幕第66页| 成人中文字幕在线播放| 超碰成人在线播放| 欧美一区二区三区爽大粗免费| 欧美视频亚洲图片| 国产无套内射久久久国产| 天天做天天爱天天高潮| 欧美丰满熟妇xxxxx| 秋霞在线一区二区| 能看的毛片网站| 日韩精品综合在线| 99九九99九九九99九他书对| 久久免费视频3| 中文字幕超清在线免费观看| 精品久久久久久久免费人妻| 国产亚洲精品久久久久久久| xxww在线观看| 日本免费一级视频| 男女私大尺度视频|