提升高性能計(jì)算資源統(tǒng)籌管理,助力一站式科研計(jì)算用戶服務(wù)
——上??萍即髮W(xué)科研計(jì)算自服務(wù)平臺(tái)正式上線試運(yùn)行!
2022年1月10日,由上海賦算通云計(jì)算科技有限公司研制開發(fā)的上??萍即髮W(xué)科研計(jì)算自服務(wù)平臺(tái)第一期項(xiàng)目正式完成部署并上線試運(yùn)行。
上科大科研計(jì)算自服務(wù)平臺(tái)實(shí)現(xiàn)了全校高性能計(jì)算資源的一站式綜合管理和用戶服務(wù),打破了算力資源校院協(xié)同建設(shè)模式下的資源使用壁壘,強(qiáng)化了全校算力資源統(tǒng)籌共享、按需配置、精準(zhǔn)調(diào)度的能力,進(jìn)一步提升了圖信中心為學(xué)??蒲杏脩籼峁┯?jì)算支持的服務(wù)水平。
上科大科研計(jì)算自服務(wù)平臺(tái)項(xiàng)目按照“總體規(guī)劃、循序漸進(jìn)、模塊化開發(fā)”的原則,經(jīng)過了前期調(diào)研、方案評(píng)審、數(shù)據(jù)準(zhǔn)備、流程制訂、業(yè)務(wù)對(duì)接、系統(tǒng)測(cè)試、模擬運(yùn)行、人員培訓(xùn)等階段,首期上線的功能主要包括:資源概覽、集群管理、在線命令行、集群資源組及成員管理、賬號(hào)管理、作業(yè)管理、數(shù)據(jù)管理、跨集群數(shù)據(jù)傳輸、可視化作業(yè)模板、遠(yuǎn)程可視化應(yīng)用等。首期項(xiàng)目不僅集成支持了Torque PBS和Slurm集群管理與作業(yè)調(diào)度系統(tǒng),而且也對(duì)接打通了學(xué)校主數(shù)據(jù)系統(tǒng)、統(tǒng)一認(rèn)證系統(tǒng)、外訪生管理系統(tǒng)和監(jiān)控管理系統(tǒng)。全校學(xué)生和老師用戶通過校園網(wǎng)或VPN即可便捷的訪問和使用科研計(jì)算自服務(wù)平臺(tái),通過平臺(tái)的智能資源推薦進(jìn)行作業(yè)提交、作業(yè)管理和資源使用實(shí)時(shí)跟蹤。自服務(wù)平臺(tái)的便捷性受到了學(xué)校用戶的贊譽(yù)和肯定,物質(zhì)科學(xué)與技術(shù)學(xué)院學(xué)生劉曉遷表示:“科研計(jì)算自服務(wù)平臺(tái)提供了各項(xiàng)集群基本操作功能,尤其 [在線命令行] 模式,節(jié)省了許多裝軟件的過程,而且不限操作系統(tǒng),可以說(shuō)隨時(shí)隨地,哪怕不在校內(nèi),只需要帶個(gè)pad也能隨時(shí)訪問學(xué)校的計(jì)算資源,隨時(shí)查看計(jì)算任務(wù)的完成情況。”此外,科研計(jì)算自服務(wù)平臺(tái)通過解耦資源賬號(hào)和用戶身份,提供用戶所屬資源的租戶式管理授權(quán)方式,為計(jì)算平臺(tái)上的跨學(xué)科、跨課題組的科研協(xié)作提供便捷管理,提升了算力資源授權(quán)的時(shí)效性,用戶通過查看系統(tǒng)運(yùn)行和作業(yè)運(yùn)行的數(shù)據(jù)信息,更為便捷的獲取相關(guān)聯(lián)動(dòng)信息,進(jìn)一步促進(jìn)科研計(jì)算任務(wù)的合理規(guī)劃和算力資源的高效使用。
上海賦算通云計(jì)算科技有限公司是一家定位于提供“中國(guó)芯”算力賦能的科技型公司,旨在建立國(guó)產(chǎn)化算力和數(shù)據(jù)創(chuàng)新賦能平臺(tái),賦“算力”通“產(chǎn)業(yè)”。其核心團(tuán)隊(duì)和技術(shù)骨干擁有在超級(jí)計(jì)算、高性能計(jì)算領(lǐng)域深耕十余年的豐富行業(yè)經(jīng)驗(yàn),外腦團(tuán)隊(duì)匯聚了分子動(dòng)力學(xué)、計(jì)算化學(xué)、數(shù)據(jù)處理、深度學(xué)習(xí)算法、基礎(chǔ)設(shè)施建設(shè)等領(lǐng)域資深專家。公司堅(jiān)持專業(yè)領(lǐng)先,專注生態(tài),深耕行業(yè),成為客戶值得信賴的合作伙伴。