算力網絡人工智能模型推理算力度量研究報告》由中國聯通研究院、中訊郵電咨詢設計院及聯通數字科技有限公司聯合發布,聚焦算力網絡中AI模型推理算力度量展開研究。2025年AI模型推理成算力需求核心驅動力,搜索AI化、智能體爆發、多模態內容生成及大模型推理普及使推理算力需求激增,如豆包token消耗量2025年達16萬億,較2024年增長約160倍。算力網絡作為新型基礎設施,整合云 - 邊 - 端算力資源,其架構含服務提供層、服務編排層等模塊,能靈活調配資源滿足不同推理任務需求,為模型推理提供算力支撐。報告明確算力網絡AI模型推理算力度量概念,即量化評估推理任務算力資源需求,為模型部署等提供依據,構建“算力消耗量”與“算力使用量”雙維度度量模型,前者通過業務、節點、資源三層級架構實現業務與資源映射,后者聚焦用戶需求量化算力使用。還建立多維度指標體系,涵蓋模型參數、計算量、處理速度等指標,并介紹模型剖析、推理并行、基本操作數測量等關鍵技術。結合ResNet50、DeepSeek R1模型及聯通云計量計費案例驗證度量方法有效性,聯通云將AI推理服務封裝成云產品,提供按量計費與Token資源包兩種模式,未來需進一步完善算力度量技術,推動算力網絡與AI深度融合。