曙光人工智能云計(jì)算平臺(tái)解決方案底層依托云計(jì)算的彈性資源,中層則采用XMachine高性能集群組成云GPU計(jì)算平臺(tái)。計(jì)算數(shù)據(jù)、日志log和模型數(shù)據(jù)統(tǒng)一存儲(chǔ)在曙光ParaStor300分布式并行存儲(chǔ)中。并通過曙光容器化的企業(yè)級(jí)分布式深度學(xué)習(xí)平臺(tái),提供數(shù)據(jù)集管理、模型管理、訓(xùn)練等服務(wù)。幫助用戶解決多用戶組資源分配、開發(fā)環(huán)境快速搭建、應(yīng)用程序靈活遷移等技術(shù)需求。該系統(tǒng)以主流深度學(xué)習(xí)框架為基礎(chǔ),支持Caffe/TensorFlow等多種深度學(xué)習(xí)框架,與Kubernetes和Docker容器技術(shù)相結(jié)合,提供實(shí)驗(yàn)環(huán)境、離線任務(wù)和在線服務(wù)三大功能,支持業(yè)務(wù)從模型研究、批量訓(xùn)練到在線預(yù)測(cè)的全流程打通,完美的滿足了一站式深度學(xué)習(xí)訓(xùn)練與實(shí)時(shí)推理的需求,是目前具有高性價(jià)比的整體 AI 訓(xùn)練與推理解決方案。