當(dāng)前位置:首頁 > 原創(chuàng) > 劉巖軒
[導(dǎo)讀]從長期來看,掌握AI底層芯片能力,構(gòu)建本土GenAI生態(tài)系統(tǒng),是我們不得不走的道路。這種局勢倒逼著我們的應(yīng)用者必須要選擇國產(chǎn)的替代方案,來構(gòu)建本地化的場景和應(yīng)用;而對于本土芯片供應(yīng)商而言,就一定要抓住這一機(jī)遇,從芯片底層做好主流大模型的適配,為開發(fā)者提供高效的開發(fā)體驗。

自ChatGPT發(fā)布之后,AI開始出圈,我們都切實感受到了AI的能力。近年來,AI一方面在模型能力上不斷加速演進(jìn),在處理更復(fù)雜的語言任務(wù)方面變得更加有效;另一方面在應(yīng)用領(lǐng)域逐步拓展,幫助專業(yè)人員在各自的垂直領(lǐng)域內(nèi)提高生產(chǎn)效率。不僅于此,最近更是出現(xiàn)了“主權(quán)AI”的概念,這進(jìn)一步上升到了國家安全的層次,各國也開始更加關(guān)注自己的AI基礎(chǔ)設(shè)施能力。

而對于我國而言,挑戰(zhàn)和機(jī)遇并存。我們有著豐富的應(yīng)用場景和用戶數(shù)據(jù),能夠?qū)崿F(xiàn)AI率先落地實踐;但同時由于地域政治摩擦、芯片禁令的限制,迫使我們更需要構(gòu)建自己的AI端到端生態(tài),擁有底層AI芯片的能力。

近日,Gartner針對“中國企業(yè)突破人工智能芯片限制”這一話題召開了記者分享活動。 Gartner研究副總裁盛陵海(Roger Sheng)進(jìn)行了精彩的分享。


AI時代到來,美國對中國的高性能AI芯片限制不斷加碼

為了在即將到來的AI時代保持技術(shù)主導(dǎo)權(quán),近年來美國對中國AI領(lǐng)域的限制措施逐步升級,從最初的黑名單、禁令到現(xiàn)在的全面禁運(yùn)和技術(shù)封鎖,涉及到多個層面,尤其是高性能計算和芯片制造領(lǐng)域。

【芯片禁運(yùn)和限制】

美國政府早在幾年前就開始對中國的高科技企業(yè)實施限制,特別是針對芯片領(lǐng)域的出口禁令。2020年,美國出臺了針對人工智能芯片的禁令,直接影響了中國企業(yè)對高性能計算資源的獲取。為了應(yīng)對這些限制,英偉達(dá)推出了專門為中國市場設(shè)計的 A800 和 H800 GPU,這些產(chǎn)品在原有 A100 和 H100 基礎(chǔ)上進(jìn)行了性能削減以符合出口規(guī)定。例如,A800 和 H800 的通信帶寬被限制在 400 GB/s 以下,但它們?nèi)员A袅藦?qiáng)大的計算能力,能夠滿足大多數(shù) AI 和高性能計算需求。

然而,這些措施顯然不足以滿足美國的限制意圖。2022年,美國進(jìn)一步降低了對高性能計算芯片的限制閾值,將禁令適用的性能上限設(shè)定為每秒 300 萬億次浮點運(yùn)算(300 TFLOPS),幾乎等同于 A100 的水平。去年下半年,禁令范圍再次收緊,不僅限制總體計算性能,還開始關(guān)注單位芯片面積的性能密度,超過每平方毫米 370 GFLOPS 的芯片也被列入受限范圍。這些嚴(yán)格的限制措施,顯著打擊了中國在超級計算和 AI 訓(xùn)練領(lǐng)域的進(jìn)步能力。

【制造工藝和供應(yīng)鏈的封鎖】

除了芯片本身的禁運(yùn),美國還在芯片制造工藝和供應(yīng)鏈上進(jìn)行嚴(yán)厲封鎖。高端芯片的制造依賴于先進(jìn)的工藝和設(shè)備,例如 TSMC 等公司提供的 14nm 及以下的技術(shù),這些技術(shù)對提升芯片的性能和降低能耗至關(guān)重要。美國的禁令禁止國際先進(jìn)制造工藝向中國出口,這使得中國在追趕全球芯片制造技術(shù)水平上面臨巨大的挑戰(zhàn)。

同時,美國還禁止其公民參與中國的先進(jìn)制造業(yè)設(shè)備相關(guān)領(lǐng)域,這直接打擊了中國吸引頂尖人才和技術(shù)的能力。例如,最近的一個案例顯示,中微公司的一位高管為了專注于中國的半導(dǎo)體設(shè)備制造,選擇了出售一部分股票,以支付美國的離境稅。這表明,即使在巨大的經(jīng)濟(jì)和個人壓力下,中國的企業(yè)和個人仍在努力推進(jìn)本土半導(dǎo)體制造技術(shù)的發(fā)展。

“從整體上來看,美國不斷地是在‘補(bǔ)漏洞’,中國這邊也是不斷地在看有沒有機(jī)會利用現(xiàn)有的資源打一些‘游擊戰(zhàn)’,當(dāng)前是不斷地‘補(bǔ)漏洞’和‘打游擊戰(zhàn)’的狀況?!笔⒖偡窒淼?。

為了突破封鎖,中國企業(yè)和研究機(jī)構(gòu)正在積極尋找應(yīng)對之策,一方面努力發(fā)展自主創(chuàng)新技術(shù),另一方面積極尋求國際合作和替代方案。對于中國的芯片廠商而言,即使當(dāng)下提供的替代方案并不盡如人意,但唯有政府和企業(yè)堅定地選擇和支持,才能有機(jī)會獲得市場實踐,通過不斷地技術(shù)迭代來實現(xiàn)追趕。


當(dāng)下國內(nèi)產(chǎn)業(yè)變局和未來端側(cè)推理發(fā)展,給中國AI芯片廠商帶來新機(jī)遇

國內(nèi)企業(yè)要在被封鎖的局面中構(gòu)建AI基礎(chǔ)設(shè)施,可能有三種不同的選擇。第一是選擇本土供應(yīng)商的替代方案。尤其是對于國內(nèi)大型云服務(wù)商、政府機(jī)構(gòu)和國有企業(yè)而言,長期受制的局面無法改變,必須尋找國產(chǎn)替代方案來保證國內(nèi)的基礎(chǔ)關(guān)鍵民生、政務(wù)業(yè)務(wù)不會受到影響。而選擇本土供應(yīng)商的替代方案,存在著訓(xùn)練效率、性能受限和生態(tài)不完備的難題,要讓當(dāng)前業(yè)務(wù)盡量平滑地遷移到新的國產(chǎn)替代平臺上,也有很多的額外工作量。

第二種選擇是選擇NVIDIA的降級方案,這對于互聯(lián)網(wǎng)公司、跨國公司和中小型企業(yè)可能是一個合適的選擇。優(yōu)點在于平臺成熟,缺點在于性能受限、價格較高。

第三種選擇是通過非官方渠道來使用NVIDIA的芯片。例如直接購買市場上的整機(jī)或直接進(jìn)行算力租賃等。這種方式只適用于中小型公司,缺點也很明顯,就是沒有官方保障和技術(shù)支持。

從長期來看,掌握AI底層芯片能力,構(gòu)建本土GenAI生態(tài)系統(tǒng),是我們不得不走的道路。長期的局勢倒逼著我們的應(yīng)用者必須要選擇國產(chǎn)的替代方案,來構(gòu)建本地化的場景和應(yīng)用;而對于本土芯片供應(yīng)商而言,就一定要抓住這一機(jī)遇,從芯片底層做好主流大模型的適配,為開發(fā)者提供高效的開發(fā)體驗。

“不管如何的原因、怎么樣的原因,現(xiàn)在已經(jīng)走到這一步上、大勢所趨吧?!笔⒖偪偨Y(jié)道。

在這種大變局的背景下,還有一個來自應(yīng)用推動的重大機(jī)遇,中國芯片廠商必須要抓住。那就是根據(jù)Gartner推測,從2025年開始,云端的推理芯片需求將超越訓(xùn)練芯片需求;而從2026年開始,隨著端側(cè)的AI能力也持續(xù)推動GenAI應(yīng)用增長,所以端側(cè)的推理芯片需求也會越來越大。

從2024年OpenAI的幾次服務(wù)崩潰我們可以感知到,人們對于生成式AI的使用量和頻率越來越高,而隨著越來越多的人會去用這個生成式AI,必然在云端上的推理訴求、對算力的需求會不斷地、極速級地增加。而為了提高能效,降低云端的負(fù)載,有一部分的推理算力會遷移到端側(cè)來運(yùn)行,那么端側(cè)AI能力將會被持續(xù)推高。

“就是設(shè)備端可以支持十億到一百億規(guī)模的模型,然后邊緣端它支持一百億到一千億的這個參數(shù)規(guī)模的大模型,它都可以實際來支持一定的企業(yè)或者個人的應(yīng)用。所以這個從技術(shù)上,它其實也是可行的?!笔⒖偪偨Y(jié)道,“邊緣側(cè)和端側(cè)的生成式人工智能應(yīng)用會從智能手機(jī)、電腦,不斷地擴(kuò)散、到消費(fèi)物聯(lián)網(wǎng)、智能家居,然后進(jìn)一步到汽車上?!?

當(dāng)前市場上主要的芯片制造商如高通、聯(lián)發(fā)科和英特爾等都在積極開發(fā)端側(cè)AI芯片,而我國的AI芯片廠商要如何抓住設(shè)備端和邊緣側(cè)的GenAI機(jī)遇?盛總強(qiáng)調(diào)了硬件標(biāo)準(zhǔn)化的重要性,為了更好地利用生成式AI的潛力,中國的芯片制造商應(yīng)該考慮合作建立一個統(tǒng)一的標(biāo)準(zhǔn),從而促進(jìn)AI芯片的兼容性和軟件生態(tài)的發(fā)展。這樣的標(biāo)準(zhǔn)化不僅有助于技術(shù)的推進(jìn),還能簡化后續(xù)的軟件開發(fā)和生態(tài)系統(tǒng)建設(shè)。

“其實對照過去的歷史來看,我們現(xiàn)在的情況其實并不是非常糟?!笔⒖偺寡缘?,“中國的大模型,其實現(xiàn)在也不會差到哪里去。我們還是要根據(jù)過去的這樣一個歷史借鑒,從‘一無所有’再到‘自主研發(fā)’,一定要有這個堅定的信心,我們才能把AI芯片這個事情、AI產(chǎn)業(yè)能夠搞起來?!?

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉