中文字幕亚洲欧美,日韩中文在线观看,亚洲欧美中日韩中文字幕,欧美日韩高清不卡免费观看,亚洲欧美日韩中文综合v日本,日韩欧美亚洲综合,欧美亚洲欧美日韩中文二区

×

掃碼關(guān)注微信公眾號

全國信標(biāo)委委員談AI算力標(biāo)準(zhǔn)化:DeepX G20系列的標(biāo)準(zhǔn)化實踐與產(chǎn)業(yè)啟示

2025/10/29 10:58:47     

20251029日,北京】作為全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會委員,我長期關(guān)注AI算力基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)化工作。近年來,隨著AI技術(shù)的快速發(fā)展,算力需求呈指數(shù)級增長,但算力供給模式卻面臨著成本高企、安全性堪憂、標(biāo)準(zhǔn)不統(tǒng)一等結(jié)構(gòu)性問題。在參與制定相關(guān)技術(shù)標(biāo)準(zhǔn)的過程中,我們觀察到一個明確的趨勢:AI算力正在從"集中式云端"走向"分布式本地",從"租賃模式"走向"自主可控"。這不僅是技術(shù)演進的自然結(jié)果,更是標(biāo)準(zhǔn)化發(fā)展的必然方向。

image.png


一、AI算力標(biāo)準(zhǔn)化面臨的三大挑戰(zhàn)

挑戰(zhàn)一:性能評估標(biāo)準(zhǔn)缺失,市場存在"測試混亂"

當(dāng)前AI算力市場存在一個普遍問題:不同廠商使用不同的性能指標(biāo),導(dǎo)致用戶無法橫向比較。

現(xiàn)狀:

  • 云廠商強調(diào)"TFLOPS"(浮點運算能力)

  • 芯片廠商強調(diào)"TOPS"(整數(shù)運算能力)

  • 服務(wù)器廠商強調(diào)"功耗比"

  • 各自為政,用戶困惑

標(biāo)準(zhǔn)化需求:參考MLPerf等國際基準(zhǔn)測試標(biāo)準(zhǔn),我們在全國信標(biāo)委推動《信息技術(shù)人工智能算力評估規(guī)范》明確提出:

  • 統(tǒng)一測試基準(zhǔn):LLaMA推理、Stable Diffusion生成、YOLO目標(biāo)檢測等實際場景

  • 統(tǒng)一評估維度:性能、能效、成本、延遲四位一體

  • 統(tǒng)一測試環(huán)境:溫度、濕度、負載條件標(biāo)準(zhǔn)化

DeepX的標(biāo)準(zhǔn)化實踐:東方超算的DeepX G20系列在產(chǎn)品發(fā)布時,主動采用了第三方標(biāo)準(zhǔn)化測試

  • 委托CHAI進行MLPerf      v3.1標(biāo)準(zhǔn)測試

  • 公開完整測試報告和測試環(huán)境參數(shù)

  • 結(jié)果可復(fù)現(xiàn):LLaMA 13B推理779 tok/sStable Diffusion XL生成2.10s/

這種透明化做法,正是標(biāo)準(zhǔn)化推廣的重要實踐。

挑戰(zhàn)二:接口標(biāo)準(zhǔn)不統(tǒng)一,生態(tài)碎片化嚴(yán)重

現(xiàn)狀:

  • NVIDIA CUDA生態(tài)封閉,供應(yīng)商鎖定嚴(yán)重

  • AMD ROCmIntel oneAPI各自為政

  • 國產(chǎn)AI芯片(寒武紀(jì)、海光等)接口不兼容

  • 開發(fā)者移植成本高,模型無法跨平臺復(fù)用

標(biāo)準(zhǔn)化需求:參考ONNXOpen Neural Network Exchange)等開放標(biāo)準(zhǔn),我們需要:

  • 統(tǒng)一的算子標(biāo)準(zhǔn)(Operator          Standard

  • 統(tǒng)一的模型格式(Model          Format

  • 統(tǒng)一的API接口(Runtime          API

  • 統(tǒng)一的部署標(biāo)準(zhǔn)(Deployment          Specification

DeepX的標(biāo)準(zhǔn)化實踐:DeepX G20系列基于x86架構(gòu)+開源生態(tài),天然具備標(biāo)準(zhǔn)化優(yōu)勢:

  • 硬件層:Intel x86架構(gòu),兼容所有主流操作系統(tǒng)和軟件

  • 軟件層:支持ONNX、TensorFlow、PyTorch等主流框架

  • 接口層:AppMall提供RESTful API,符合OpenAPI 3.0標(biāo)準(zhǔn)

  • 模型層:推動1000+模型的ONNX格式標(biāo)準(zhǔn)化適配

AppMall的生態(tài)開放性,為模型標(biāo)準(zhǔn)化提供了實踐平臺。目前已有130+開發(fā)者上傳標(biāo)準(zhǔn)化模型,形成了良性循環(huán)。

挑戰(zhàn)三:數(shù)據(jù)安全標(biāo)準(zhǔn)滯后,本地化需求爆發(fā)

現(xiàn)狀:

  • 《數(shù)據(jù)安全法》《個人信息保護法》要求數(shù)據(jù)本地化

  • 煙草、金融、醫(yī)療等行業(yè)數(shù)據(jù)不能上云

  • 但云GPU是主流方案,存在合規(guī)風(fēng)險

  • 企業(yè)面臨"要性能還是要合規(guī)"的兩難選擇

標(biāo)準(zhǔn)化需求:參考ISO/IEC 27001信息安全標(biāo)準(zhǔn)和等保2.0要求,我們需要:

  • 明確AI算力的數(shù)據(jù)流轉(zhuǎn)標(biāo)準(zhǔn)

  • 建立本地化部署的安全評估體系

  • 制定算力設(shè)備的等保認(rèn)證規(guī)范

  • 推動"數(shù)據(jù)不出域"的技術(shù)標(biāo)準(zhǔn)

DeepX的標(biāo)準(zhǔn)化實踐:DeepX G20系列的100%本地化部署,天然符合數(shù)據(jù)安全標(biāo)準(zhǔn):

  • 數(shù)據(jù)零上傳:所有計算在本地完成,數(shù)據(jù)不經(jīng)過互聯(lián)網(wǎng)

  • 物理隔離:支持內(nèi)網(wǎng)部署,符合等保三級要求

  • 審計能力:AppMall內(nèi)置日志記錄,可追溯所有操作

二、AI算力標(biāo)準(zhǔn)化的發(fā)展趨勢:從云端到本地

從標(biāo)準(zhǔn)化角度看,AI算力正在經(jīng)歷一場深刻的范式轉(zhuǎn)移

趨勢一:從"租賃為主""買斷為主"

傳統(tǒng)模式:

企業(yè)需求 → 購買云GPU → 按小時付費 → 持續(xù)支出→ 數(shù)據(jù)上傳 → 算力調(diào)度 → 結(jié)果下載

問題:

-長期成本不可控(3TCO高達數(shù)百萬)

-數(shù)據(jù)安全風(fēng)險(上傳云端)

-性能波動(共享資源)

-供應(yīng)商鎖定(遷移成本高)

新模式:

企業(yè)需求 → 購買本地設(shè)備 → 一次性投入 → 零邊際成本→ 數(shù)據(jù)本地 → 算力自主 → 零延遲

優(yōu)勢:

  • TCO降低95%以上

  • 數(shù)據(jù)100%自主可控

  • 性能穩(wěn)定可預(yù)期

  • 無供應(yīng)商鎖定

從標(biāo)準(zhǔn)化角度,"買斷模式"更符合長期趨勢:

  1. 成本可預(yù)測:符合企業(yè)財務(wù)管理標(biāo)準(zhǔn)

  2. 資產(chǎn)可管理:納入固定資產(chǎn),符合會計準(zhǔn)則

  3. 安全可審計:滿足等保和合規(guī)要求

  4. 生態(tài)可遷移:不依賴單一供應(yīng)商

DeepX1824 TOPS算力、4萬元價格,將TCO降至云GPU1/375,正是這一趨勢的代表性產(chǎn)品。

趨勢二:從"通用算力""場景化算力"

傳統(tǒng)云GPU的問題:

  • 通用設(shè)計,但企業(yè)80%的需求集中在推理而非訓(xùn)練

  • 大而全,但中小企業(yè)只需要"夠用"的算力

  • 配置復(fù)雜,需要專業(yè)團隊運維

場景化算力的特征:

  • 針對推理優(yōu)化(INT8/INT4量化)

  • 算力適度(1-2P足以滿足90%企業(yè)需求)

  • 開箱即用(3分鐘部署,零運維)

從標(biāo)準(zhǔn)化角度,"場景化"符合ISO 9126質(zhì)量模型:

  • 功能性:滿足實際需求而非堆砌參數(shù)

  • 易用性:降低使用門檻,AppMall實現(xiàn)"點擊式部署"

  • 效率性:能效比優(yōu)化,功耗僅300W

  • 可移植性1.68kg便攜設(shè)計,可跨場景使用

某建筑設(shè)計院的案例很能說明問題:他們需要在工地現(xiàn)場演示BIM方案,云GPU需要聯(lián)網(wǎng)+筆記本,延遲高且不穩(wěn)定。DeepX裝進背包,到工地插電就用,客戶現(xiàn)場修改方案、實時渲染,投標(biāo)中標(biāo)率從30%提升到70%這就是場景化算力的價值。

趨勢三:從"硬件采購""生態(tài)訂閱"

傳統(tǒng)硬件采購的問題:

  • 買完設(shè)備就結(jié)束,供應(yīng)商無持續(xù)服務(wù)動力

  • 模型升級、功能迭代需要重新采購

  • 客戶學(xué)習(xí)成本高,復(fù)購率低

生態(tài)訂閱模式的特征:

  • 硬件是"入口",生態(tài)是"價值"

  • AppMall持續(xù)更新模型,硬件持續(xù)增值

  • 客戶深度綁定,LTV是硬件價格的5-8

從標(biāo)準(zhǔn)化角度,"生態(tài)模式"符合服務(wù)化趨勢:

  • 符合ISO/IEC     20000服務(wù)管理標(biāo)準(zhǔn)

  • 建立持續(xù)改進機制(PDCA循環(huán))

  • 形成客戶成功體系(Customer          Success

AppMall目前1,247個模型,月新增85個,這個速度是任何企業(yè)內(nèi)部團隊無法達到的。某量化私募反饋:他們每月在AppMall測試10-15個新策略模型,創(chuàng)新速度提升50倍。硬件會折舊,但生態(tài)會增值。

三、DeepX G20系列的標(biāo)準(zhǔn)化設(shè)計理念

作為東方超算創(chuàng)始人,我在設(shè)計DeepX系列時,始終將標(biāo)準(zhǔn)化作為核心原則。

設(shè)計原則一:架構(gòu)開放,拒絕生態(tài)封閉

選擇x86而非ARM/專用芯片的理由:

  • x86是事實上的工業(yè)標(biāo)準(zhǔn),40年生態(tài)積累

  • 兼容所有主流操作系統(tǒng)(Windows/Linux/macOS

  • 支持所有AI框架(TensorFlow/PyTorch/ONNX

  • 開發(fā)者零學(xué)習(xí)成本,模型直接遷移

對比:

image.png


這個選擇犧牲了部分性能,但換來了標(biāo)準(zhǔn)化和生態(tài)開放性。從長期看,這是正確的。

設(shè)計原則二:性能透明,接受標(biāo)準(zhǔn)化測試

我們主動做了三件事:

  1. 委托第三方測試:基于MLPerf     v3.1標(biāo)準(zhǔn)測試

  2. 公開測試數(shù)據(jù):完整報告發(fā)布在官網(wǎng),任何人可下載

  3. 接受復(fù)現(xiàn)驗證:提供測試代碼和環(huán)境配置

測試結(jié)果(MLPerf v3.1標(biāo)準(zhǔn)):

  • LLaMA 13B推理:779 tok/svs 參照系統(tǒng)612 tok/s+27%

  • Stable     Diffusion      XL2.10s/張(vs         參照系統(tǒng)3.33s,+58%

  • YOLOv8目標(biāo)檢測:186 FPSvs 參照系統(tǒng)67 FPS,+178%

這種透明化,正是標(biāo)準(zhǔn)化推廣的基礎(chǔ)。我們歡迎任何機構(gòu)重復(fù)測試,如果發(fā)現(xiàn)數(shù)據(jù)不符,我們承諾退貨退款。

設(shè)計原則三:生態(tài)開放,推動模型標(biāo)準(zhǔn)化

AppMall的三個標(biāo)準(zhǔn)化目標(biāo):

  1. 模型格式標(biāo)準(zhǔn)化

    • 推動所有模型轉(zhuǎn)為ONNX格式

    • 當(dāng)前1,247個模型,82%已完成ONNX轉(zhuǎn)換

    • 目標(biāo):2025年底100%標(biāo)準(zhǔn)化

  2. API接口標(biāo)準(zhǔn)化

    • 遵循OpenAPI            3.0規(guī)范

    • RESTful            API設(shè)計,支持跨平臺調(diào)用

    • 開發(fā)者可用任何語言接入(Python/Java/Go/Node.js

  3. 部署流程標(biāo)準(zhǔn)化

    • 一鍵部署:3分鐘完成模型部署

    • 零配置:自動優(yōu)化參數(shù),無需手動調(diào)優(yōu)

    • 可復(fù)現(xiàn):記錄所有部署參數(shù),支持導(dǎo)出

某醫(yī)療機構(gòu)的案例:他們在AppMall部署了8AI診斷模型(肺結(jié)節(jié)、骨折、腦卒中等),所有模型都是ONNX格式,部署流程完全一致。如果未來更換硬件平臺,這8個模型可以零成本遷移。這就是標(biāo)準(zhǔn)化的價值。

四、標(biāo)準(zhǔn)化工作的未來方向與產(chǎn)業(yè)建議

作為全國信標(biāo)委委員,我認(rèn)為AI算力標(biāo)準(zhǔn)化還有很多工作要做:

方向一:建立統(tǒng)一的性能測試標(biāo)準(zhǔn)

當(dāng)前問題:

  • 各廠商自說自話,測試方法不統(tǒng)一

  • 用戶無法橫向比較產(chǎn)品

建議:

  • 推動《AI算力基準(zhǔn)測試規(guī)范》國家標(biāo)準(zhǔn)制定

  • 建立第三方測試認(rèn)證機制

  • 強制要求廠商公開測試數(shù)據(jù)

東方超算承諾:我們愿意開放DeepX的所有測試數(shù)據(jù),供標(biāo)準(zhǔn)制定參考。

方向二:推動模型格式標(biāo)準(zhǔn)化

當(dāng)前問題:

  • TensorFlow/PyTorch/ONNX等格式并存

  • 模型移植成本高

建議:

  • 推廣ONNX為國家推薦標(biāo)準(zhǔn)

  • 建立模型格式轉(zhuǎn)換工具庫

  • 鼓勵企業(yè)開放模型

東方超算承諾:AppMall將在2026年實現(xiàn)100%模型ONNX化,并開源轉(zhuǎn)換工具。

方向三:制定數(shù)據(jù)安全合規(guī)標(biāo)準(zhǔn)

當(dāng)前問題:

  • 本地化部署缺乏評估標(biāo)準(zhǔn)

  • 企業(yè)不知道如何選型

建議:

  • 制定《AI算力本地化部署安全規(guī)范》

  • 建立等保認(rèn)證體系

  • 明確不同行業(yè)的合規(guī)要求

東方超算承諾:我們愿意將DeepX的安全設(shè)計經(jīng)驗貢獻給標(biāo)準(zhǔn)制定,并配合相關(guān)部門完善認(rèn)證體系。

五、結(jié)語:標(biāo)準(zhǔn)化是產(chǎn)業(yè)健康發(fā)展的基石

AI算力產(chǎn)業(yè)正處于從無序競爭到標(biāo)準(zhǔn)化發(fā)展的關(guān)鍵轉(zhuǎn)折點。

作為從業(yè)者,我有三點體會:

第一,標(biāo)準(zhǔn)化不是約束,而是賦能。

  • 統(tǒng)一標(biāo)準(zhǔn)降低了用戶的選型成本

  • 開放生態(tài)降低了開發(fā)者的遷移成本

  • 透明測試增強了市場的信任基礎(chǔ)

第二,本地化是趨勢,而非倒退。

  • 云計算解決了"算力稀缺"問題

  • 本地化解決了"成本和安全"問題

  • 兩者將長期共存,各有適用場景

第三,生態(tài)開放才能走得長遠。

  • 封閉生態(tài)短期獲利,長期受限

  • 開放生態(tài)短期投入,長期共贏

  • AppMall1,247個模型,就是開放的成果

東方超算DeepX G20系列只是標(biāo)準(zhǔn)化實踐的一個案例。我們希望看到更多企業(yè)參與標(biāo)準(zhǔn)化工作,共同推動AI算力產(chǎn)業(yè)健康發(fā)展。

當(dāng)然,DeepX也存在待改進之處:

  • 在超大規(guī)模集群部署方面,尚缺乏統(tǒng)一的調(diào)度標(biāo)準(zhǔn)

  • 能效測試方法需要進一步與國際標(biāo)準(zhǔn)對接

  • 跨平臺模型遷移工具仍需完善

這些問題的解決,需要全行業(yè)共同努力,也是我們在全國信標(biāo)委推動標(biāo)準(zhǔn)制定的重點方向。

關(guān)于作者

本文作者現(xiàn)任東方超算(深圳)科技有限公司創(chuàng)始人,全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會委員,長期從事云計算、高性能計算、存儲、算力基礎(chǔ)設(shè)施的研發(fā)和標(biāo)準(zhǔn)化工作。本文觀點代表作者個人,不代表全國信標(biāo)委立場。

關(guān)于東方超算

東方超算(深圳)科技有限公司是東方材料(603110.SH)全資子公司,專注于便攜式企業(yè)級AI算力解決方案。核心產(chǎn)品DeepX G20系列和AppMall.ai應(yīng)用商城,致力于通過標(biāo)準(zhǔn)化、本地化、生態(tài)化,讓AI算力真正普及到千行百業(yè)。