
少林寺的藏經閣
逍遙派的靈鷲宮
在武俠世界中
各大門派總有一處秘密“基地”
存放著秘籍至寶
戴爾科技也有這樣一個
“殿堂級”實驗室
那里有高性能計算領域
最先進的IT設備和技術
今天小編決定自爆“家底”
跟大家嘮嘮關于戴爾科技
HPC和AI創新實驗室的二三事
前一段時間全球芯片荒鬧得沸沸揚揚,美國、日本占據了半導體產業鏈第一梯隊,其實歐洲有一個國家在芯片制造領域也擁有很高的話語權,那就是風車之國荷蘭。
除了芯片等高端設備制造和機械產業,荷蘭在醫療信息、生物制藥等生命科學與健康領域也擁有很強的技術地位。而這一優勢得益于企業、學術協會和政府之間的良好合作。
風車之國的“酷炫”項目
更快、更高、更強是奧林匹克運動的口號,而高性能計算也在追求更快的運算速度、更高的性能以及更強的可擴展性。當荷蘭的科學家需要獲得高性能計算系統和先進的數據服務時,他們通常會向SURFsara超級計算中心尋求幫助。
該中心隸屬于荷蘭教育和研究機構的合作協會——SURF,運營著荷蘭國家超級計算機和其他高性能計算系統。
SURFsara與研發新藥、改進太陽能電池、研究天氣系統以及執行其他計算和數據密集型研究計劃的團隊展開合作,為研究人員提供廣泛的支持,包括計算、數據存儲、可視化、網絡和云服務等。同時,它還致力于幫助組織利用深度學習能力來實現新的人工智能應用。
比如說,在2018年開始實施的一個項目中,SURFsara的一個研究小組就利用戴爾科技HPC和AI創新實驗室的資源,訓練出一個能夠從胸部X光片中診斷出肺炎、肺氣腫和其他胸腔病癥的AI模型。
具體說來,這個項目堪稱“酷炫”。團隊將HPC和AI創新實驗室的戴爾易安信Zenith超級計算機和256個英特爾?至強?可擴展處理器節點一起投入使用,利用并行計算的力量加速訓練過程。
通過優化網絡拓撲結構、提高訓練吞吐量,并使用全尺寸的X射線圖像,研究人員能夠快速對數據集進行處理,以便建立更高精度的模型。
SURFsara高級HPC顧問Valeriu Codreanu博士表示:
“一般來說,在HPC中強擴展是很難實現的,但我們在強擴展的情況下,用200多個節點成功實現了121倍的性能。在單個節點上訓練一個變壓器模型需要一個多月的時間,通過使用這些節點,我們成功地將訓練時間縮減到只需六個小時。”
在提高準確率方面,結果也是令人滿意的。與最初的模型相比,利用Zenith和英特爾節點訓練的AI模型提高了14種胸部病癥中10種病癥的診斷準確率,有幾個類別甚至達到近90%的準確率。
創新實驗室的三大“金剛”
在AI模型訓練方面如此給力的戴爾科技HPC和AI創新實驗室,坐落于德克薩斯州首府奧斯汀市。它擁有一個占地約13000平方英尺的數據中心,容納了數以千計的服務器、存儲和網絡系統。
該實驗室承擔了戴爾科技大量的創新工作,從硬件體系結構的設計到深度學習系統的應用,從各種HPC與AI的研究到售前與售后服務,可以說這個實驗室無所不包,也成為了戴爾科技不斷創新的源動力。
HPC和AI創新實驗室常見項目包括:
01
集群比較。在三個不同的集群上測試工作負載,看哪一個能夠提供最好的性能。
02
系統參數掃描。建立一個系統測試平臺,找出核心數量、內存和處理器速度的組合,以優化應用性能。
03
加速器測試比較。找出哪個加速器最符合需要。
04
效率調整。為應用確定最佳的基本輸入/輸出系統(BIOS)和其它設置和配置。
05
網絡測試。弄清哪種HPC網絡最適合應用性能要求。
06
存儲系統優化。建立和測試HPC存儲和文件系統,不管是分層的還是其它的,以獲得最佳性能。
說起來,戴爾科技HPC和AI創新實驗室最吸引人的,就是Zenith、Rattler和Minerva這三個強大的高性能計算集群。讓我們來“康康”這三大“金剛”有何過人之處?
Zenith
Zenith集群是戴爾科技和英特爾之間合作的成果。團隊使用它來進行基準測試、工作負載評估以及廣泛的人工智能、高性能數據分析和高性能計算項目。
Zenith包括英特爾?至強?可擴展處理器、數據中心存儲解決方案、FPGA、適配器、軟件和工具。項目包括圖像分類以識別X射線中的疾病,建立更快的神經網絡以驅動推薦引擎等。
Rattler
Rattler集群是戴爾科技和NVIDIA之間合作的成果。該系統旨在通過利用GPU與NVLINKTM來展示極強的可擴展性。Rattler不僅可以加速服務器內部GPU之間的流量,還可以通過InfiniBand互連在服務器之間進行加速。團隊使用該系統進行特定應用的基準測試和工作負載特性分析。
Minerva
Minerva集群是戴爾科技與AMD合作的成果,采用PowerEdge C6525服務器,配備第二代AMD EPYC?處理器、InfiniBand HDR200和BeeGFS存儲。這個集群突出了最新的服務器工程,旨在利用最新的內核、內存帶寬和PCIe Gen4吞吐量技術。
敲黑板,這些集群可不是一成不變的,實驗室團隊會不斷對集群進行擴展和改進,使它們保持巔峰性能。比方說,基于戴爾易安信PowerEdge C6420和PowerEdge R740服務器而構建的Zenith,未來將升級到由新一代PowerEdge C6520和PowerEdge R750服務器組合而成。
20多年來,戴爾科技在HPC領域不斷創新,除了成立了HPC和AI創新實驗室,作為首家提供HPC打包的方案廠商,持續推出高密度、高性能GPU計算服務器,以及存儲加速器(DAC)等。未來,戴爾科技將通過在產品和解決方案方面的不斷創新,繼續滿足各界對高性能計算方面的需求。
所有大朋友們 兒童節快樂!
這里還有一份驚喜等著你們
即日起
戴爾科技618企業購機節
精彩開啟!
新品0元試用、千元優惠券
每日整點秒殺、曬單領好禮……
特惠狂歡 只等你來
快來點擊文末閱讀原文
速速參與活動