美女免费观看一区二区三区-美女免费黄-美女免费毛片-美女免费视频黄-5x性区m免费毛片视频看看-6080国产午夜精品

搜索
信網(wǎng)手機(jī)版移動繼續(xù)看新聞

AI推理芯片激發(fā)新一輪應(yīng)用創(chuàng)新 應(yīng)用開發(fā)走上新賽道

原標(biāo)題:AI推理芯片激發(fā)新一輪應(yīng)用創(chuàng)新

科技日報記者 劉霞

隨著ChatGPT橫空出世,人工智能(AI)領(lǐng)域的競爭進(jìn)入白熱化。英偉達(dá)公司的高端圖形處理單元(GPU)芯片“一飛沖天”,受到各大科技公司追捧。與此同時,也有一些初創(chuàng)公司另辟蹊徑,專注于研制另一種芯片——AI推理芯片,為AI產(chǎn)品的蓬勃發(fā)展和應(yīng)用注入全新動力。

據(jù)物理學(xué)家組織網(wǎng)近日報道,這些AI推理芯片旨在降低生成式AI所需的高昂計(jì)算成本,更貼合AI工具的日常運(yùn)行要求。此類芯片成本的不斷下探和性能的持續(xù)提升,有望掀起新一輪AI應(yīng)用創(chuàng)新浪潮,讓更多復(fù)雜且強(qiáng)大的AI應(yīng)用走進(jìn)千家萬戶。

推理計(jì)算需求水漲船高

訓(xùn)練與推理,是AI大語言模型兩大核心能力的堅(jiān)固基石。

在應(yīng)用過程中,經(jīng)過訓(xùn)練的ChatGPT等生成式AI工具會吸納新信息,從中進(jìn)行推理并生成回應(yīng),如撰寫文檔、生成圖像等。這類AI工具可應(yīng)用于醫(yī)療診斷、自動駕駛、自然語言理解等領(lǐng)域。

隨著AI模型的廣泛應(yīng)用,需要進(jìn)行推理計(jì)算的硬件日益增多,對推理芯片的需求也將“水漲船高”。國際數(shù)據(jù)公司(IDC)的報告顯示,未來幾年,推理端的AI服務(wù)器占比將持續(xù)攀升。預(yù)計(jì)到2027年,用于推理的工作負(fù)載將占據(jù)七成以上。

科技公司競推新產(chǎn)品

Cerebras、Groq和d-Matrix等初創(chuàng)公司,以及超威半導(dǎo)體公司(AMD)和英特爾等傳統(tǒng)巨頭,紛紛推出了AI推理芯片。這些公司敏銳捕捉到了AI推理芯片“大顯身手”的契機(jī)。

據(jù)Cerebras公司官網(wǎng)報道,2024年8月28日,該公司推出了同名AI推理芯片。這款芯片在Llama 3.1-8B模型上實(shí)現(xiàn)了1800token/秒的推理速度;在Llama 3.1 70B上實(shí)現(xiàn)了450token/秒的推理速度,約是英偉達(dá)GPU推理速度的20倍。Token指AI處理文本的最小單元或基本元素,如一個單詞、一個字符等。

Cerebras公司解釋說,這一卓越表現(xiàn)得益于其創(chuàng)新的AI芯片設(shè)計(jì)方案。其晶圓級引擎(WSE)宛如一座龐大的“計(jì)算工廠”,最大特點(diǎn)是尺寸驚人——單個芯片幾乎占據(jù)了一整塊晶圓的面積。在這個超大芯片上,計(jì)算單元和內(nèi)存單元高度集成,形成一個密集的網(wǎng)格結(jié)構(gòu)。這樣的設(shè)計(jì),讓數(shù)據(jù)能在極短距離內(nèi),于計(jì)算單元和存儲單元之間傳輸,從根本上降低了數(shù)據(jù)移動成本,解決了GPU推理無法避免的內(nèi)存帶寬瓶頸。此類大芯片能更快處理信息,從而在更短時間內(nèi)給出答案。

早在去年2月,Groq公司就發(fā)布了自己的AI推理芯片GroqCloud。它在Llama 3.1 70B模型上實(shí)現(xiàn)了250token/秒的推理服務(wù),速度比GPU幾乎提升了一個量級。

去年11月19日,硅谷初創(chuàng)公司d-Matrix宣布,其首款A(yù)I推理芯片Corsair已開始出貨,旨在提供聊天機(jī)器人和視頻生成等服務(wù)。Corsair在單服務(wù)器環(huán)境下,能讓Llama3 8B模型實(shí)現(xiàn)60000token/秒的處理能力,且每個token的延遲僅為1毫秒,充分彰顯了其在高速處理大規(guī)模數(shù)據(jù)方面的卓越性能。更值得一提的是,與GPU及其他方案相比,Corsair能在提供同等性能的同時,大幅降低能耗和成本。

應(yīng)用開發(fā)走上新賽道

亞馬遜、谷歌、元宇宙平臺、微軟等科技公司紛紛斥巨資,搶購昂貴的GPU,以期在AI開發(fā)賽道拔得頭籌。與此同時,AI推理芯片制造商則將目光瞄準(zhǔn)了更廣泛的客戶群體,希望能在這片新藍(lán)海中大顯身手。

這些潛在客戶不乏那些渴望利用新興的生成式AI技術(shù),卻又不想大費(fèi)周章自建AI基礎(chǔ)設(shè)施的財(cái)富500強(qiáng)企業(yè)。而且,購買AI推理芯片比從英偉達(dá)等公司購買GPU便宜。AI推理芯片旨在優(yōu)化推理計(jì)算的速度與效率,尤其擅長智能建議、語音識別、自然語言處理等領(lǐng)域。

業(yè)內(nèi)專家稱,一旦推理速度提升至每秒數(shù)千token,AI模型將能在眨眼之間完成復(fù)雜問題的思考與回答過程。這不僅能讓現(xiàn)有應(yīng)用的交互效率實(shí)現(xiàn)質(zhì)的飛躍,還將帶來一系列令人耳目一新的人機(jī)交互場景。例如,在語音對話領(lǐng)域,延時將被壓縮至毫秒級,能實(shí)現(xiàn)近乎自然的對話體驗(yàn);在虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)領(lǐng)域,AI將能實(shí)時生成和調(diào)整虛擬環(huán)境、角色對話以及交互邏輯,給用戶帶來個性化、沉浸式體驗(yàn)。

[來源:科技日報 編輯:孫寶震]
精彩美圖 更多 >>
2025 01/16 09:50
· 來源 ·
科技日報
· 責(zé)編 ·
孫寶震
閱讀量
掃描到手機(jī)
用手機(jī)或平板電腦的二維碼應(yīng)用拍下左側(cè)二維碼,可以在手機(jī)繼續(xù)閱讀。

青島話題 更多 >>

深度報道 更多 >>

大家愛看

信網(wǎng)手機(jī)版

信網(wǎng)小程序

青島網(wǎng)上辟謠平臺

AI調(diào)解員

Copyright ? 2014-2025 信網(wǎng) All rights reserved. 魯ICP備14028146號-1 互聯(lián)網(wǎng)新聞信息服務(wù)許可證:37120180021 增值電信:魯B2-20180061 魯公網(wǎng)安備:37020202000005號
手機(jī)版 | 媒體資源 | 信網(wǎng)傳播力 | 關(guān)于信網(wǎng) | 廣告服務(wù) | 人才招聘 | 聯(lián)系我們 | 版權(quán)聲明| 違法和不良信息舉報
主站蜘蛛池模板: 午夜欧美成人 | 性夜黄a爽爽免费视频国产 性夜黄 a 爽免费看 | 狠狠干干干| 一区二区三区波多野结衣 | 免费观看成人久久网免费观看 | 亚洲综合区小说区激情区噜噜 | 欧美成人性视频播放 | 国产人成午夜免费噼啪视频 | 星空影院免费观看韩国三集 | 国产色啪午夜免费视频 | 黑人与中国女一级毛片不卡 | 最近中文2019字幕在线观看 | 成人网中文字幕色 | 日本欧美国产 | 欧美日韩国产在线人 | 久久久久国产 | 中文在线日本免费永久18近 | 在线a人片免费观看高清 | 国产1区二区 | 欧美日韩网站 | 男女羞羞视频 | 欧美成年人网站 | 中文字幕亚洲综合久久202 | 国产真实乱偷人视频 | 黄色国产视频 | 中国国产一国产一级毛片视频 | 欧美高清xxxx性 | 宅男色影院 | 亚洲天堂va | 欧美久久综合九色综合 | 国产成人精品男人的天堂538 | 激情网站网址 | 日韩在线二区 | 国产手机在线αⅴ片无码观看 | 天天综合天天综合 | 黄短视频在线观看免费版 | 美女肥胖大bbbb | 污片在线观看 | 国产一级淫片视频免费看 | 国产骚熟 | 亚洲图片 中文字幕 |