高性能人工智能與視頻處理芯片解決方案提供商瀚博半導體(上海)有限公司(下稱“瀚博半導體”或“瀚博”)7月7日在2021世界人工智能大會期間發(fā)布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,這款通用推理加速卡可實現(xiàn)深度學習應用超高性能、超低延時的推理性能,可顯著降低數據中心與邊緣智能應用的部署成本。據悉,SV100系列及VA1通用推理加速卡預計會上發(fā)布的兩款新產品將于2021年今年四季度量產上市。
人工智能行業(yè)隨著持續(xù)的技術演進,算法模型的精度、性能等關鍵指標在眾多領域不斷取得突破性進展,已進入算法規(guī)?;瘧寐涞仉A段。全球范圍內各行業(yè)數據中心對推理算力的需求在快速增長,下游客戶多樣化的算力應用場景,催生了多樣化的AI計算加速芯片需求,然而市面上卻鮮有主流GPU廠商外的其他更優(yōu)解決方案?;趯π袠I(yè)產品技術需求的洞察及顯而易見的巨大市場機遇,經過兩年多的技術論證與軟硬件一體化設計,瀚博半導體重磅推出了專為云端數據中心而生的SV100系列芯片與VA1通用推理加速卡。
瀚博本次發(fā)布的SV100系列芯片性能強大優(yōu)異,單芯片INT8峰值算力超200 TOPS,深度學習推理性能指標數倍于現(xiàn)有主流數據中心GPU,具有超高吞吐率、超低延時的特性。瀚博自研的通用架構,為各種深度學習推理負載極致優(yōu)化。 此次推出的SV100系列芯片支持FP16, BF16和INT8等數據格式,并可以實現(xiàn)眾多主流神經網絡的快速部署及計算機視覺、視頻處理、自然語言處理和搜索推薦等多樣化推理應用場景。同時集成高達64路以上H.264/H.265/AVS2的1080p視頻解碼,廣泛適用于云端與邊緣智能應用場景,在應用中能夠提升客戶的設備資產效益、降低運營成本。
瀚博半導體此次在這次發(fā)布會上同步推出的基于SV100系列芯片的VA1推理加速卡,為單寬半高半長75瓦PCIe x16卡,支持32GB內存和PCIe 4.0高速接口協(xié)議,無需額外供電,即可適用于所有廠商的人工智能服務器,實現(xiàn)數據中心高密度高算力部署。
瀚博半導體創(chuàng)始人兼CEO錢軍表示:“SV100系列產品是所有瀚博人的心血結晶,我為我們的團隊感到無比驕傲!我們深度了解行業(yè)客戶對吞吐量、延遲、通用性和成本的需求。同時,向前兼容性非常重要,我們的軟件棧具有極高靈活性與可擴展性,能夠支持未來新興算法模型和用戶自定義算子擴展等。另一方面,占據過半中國AI應用市場的計算機視覺應用需要高密度的視頻解碼算力配合AI算力實現(xiàn)端到端的計算加速,在兩者之間的算力配比平衡方面,我們也做了大量的工作。瀚博通過前期核心技術積累和前瞻性布局,正式發(fā)布我們性能優(yōu)異的SV100系列云端通用AI推理芯片和VA1推理卡,可有效應對上述低延時、通用性和視頻處理等方面的行業(yè)痛點,推進云端與邊緣的智能應用落地?!?/p>
瀚博半導體創(chuàng)始人兼CTO張磊表示:“SV100系列芯片基于先進的DSA架構,相同功耗下實現(xiàn)數倍于數據中心GPU的最高深度學習推理性能。同時支持計算機視覺、自然語言處理、搜索推薦、智能視頻處理領域的眾多常用神經網絡,軟件棧支持靈活擴展,支持用戶自定義算子。VA1推理卡采用75W單寬半高半長設計,可無縫適配各種人工智能服務器,最大化算力部署密度。我們的VastStream軟件平臺支持TensorFlow, PyTorch, Caffe2等常見的深度學習框架模型與ONNX格式的模型,通過高度定制的AI編譯器充分優(yōu)化模型在瀚博硬件上的執(zhí)行效率。 我們的軟件棧完備,同時提供了符合行業(yè)開發(fā)者使用習慣的工具,方便使用者以極低成本向瀚博硬件平臺遷移、部署現(xiàn)有算法應用。”