【導(dǎo)讀】據(jù)IoT Analytics最新預(yù)測(cè),受自動(dòng)化升級(jí)、LPWAN普及及AI邊緣化遷移的多重驅(qū)動(dòng),全球物聯(lián)網(wǎng)MCU市場(chǎng)規(guī)模將于2030年突破73億美元,年復(fù)合增長(zhǎng)率達(dá)6.3%。這一增長(zhǎng)背后,是AI技術(shù)對(duì)MCU生存邏輯的徹底重構(gòu):通過(guò)集成NPU、擴(kuò)展專(zhuān)用指令集(如Arm Helium與RISC-V RVV),新一代AI MCU成功打破了功耗、實(shí)時(shí)性與算力之間的傳統(tǒng)博弈,讓端側(cè)本地智能推理成為現(xiàn)實(shí)。
AI MCU通過(guò)集成神經(jīng)網(wǎng)絡(luò)處理單元(NPU)、擴(kuò)展專(zhuān)用指令集等方式,實(shí)現(xiàn)了邊緣端的本地智能推理,精準(zhǔn)匹配了智能設(shè)備對(duì)低功耗、高實(shí)時(shí)性和高性?xún)r(jià)比的需求。這不僅推動(dòng)了MCU產(chǎn)品的升級(jí),更讓市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈,國(guó)內(nèi)外各大芯片廠(chǎng)商紛紛加大研發(fā)投入,推出各具技術(shù)特色的AI MCU產(chǎn)品,加速邊緣智能應(yīng)用的落地。
01 Arm:構(gòu)筑AI MCU核心技術(shù)底座
作為全球領(lǐng)先的處理器架構(gòu)設(shè)計(jì)公司,Arm的內(nèi)核產(chǎn)品線(xiàn)覆蓋了從高性能計(jì)算到低功耗嵌入式應(yīng)用的全場(chǎng)景,自1990年成立以來(lái),已形成Cortex-A、Cortex-M、Cortex-R三大系列產(chǎn)品,以及面向服務(wù)器/基礎(chǔ)設(shè)施的Neoverse系列,各系列基于ARMv7、ARMv8、ARMv9等不同架構(gòu)版本設(shè)計(jì),針對(duì)專(zhuān)屬應(yīng)用場(chǎng)景完成深度優(yōu)化。
其中,Cortex-M系列是微控制器(MCU)和嵌入式系統(tǒng)的核心處理器內(nèi)核,以低功耗、高實(shí)時(shí)性和高成本效益為核心特性,支持單周期指令執(zhí)行、納秒級(jí)快速中斷響應(yīng),最小內(nèi)核尺寸僅0.01mm2,搭配Thumb-2指令集,無(wú)MMU且可運(yùn)行RTOS,是目前絕大多數(shù)MCU產(chǎn)品的技術(shù)基石,也成為Arm布局AI MCU的核心切入點(diǎn)。
為了讓Cortex-M系列具備更強(qiáng)的AI計(jì)算能力,Arm推出了一系列專(zhuān)屬技術(shù)與內(nèi)核產(chǎn)品。2019年,Arm發(fā)布適用于Armv8M架構(gòu)的Cortex-M矢量擴(kuò)展技術(shù)(MVE)——Arm Helium技術(shù),作為Armv8.1-M架構(gòu)的擴(kuò)展,該技術(shù)通過(guò)高效的SIMD(單指令多數(shù)據(jù))操作,為機(jī)器學(xué)習(xí)(ML)和數(shù)字信號(hào)處理(DSP)應(yīng)用帶來(lái)顯著性能提升,在機(jī)器學(xué)習(xí)任務(wù)中可實(shí)現(xiàn)最高15倍的性能突破。而Arm Helium Utils作為CMSIS DSP庫(kù)的組成部分,還為該技術(shù)提供了一系列實(shí)用函數(shù),進(jìn)一步優(yōu)化DSP和ML任務(wù)的處理效率。
Cortex-M55和Cortex-M85是首批支持Helium技術(shù)的處理器,讓小型、低功耗的嵌入式系統(tǒng)能夠應(yīng)對(duì)音頻設(shè)備、傳感器集線(xiàn)器、關(guān)鍵詞識(shí)別、靜態(tài)圖像處理等場(chǎng)景的計(jì)算挑戰(zhàn),也讓基于Arm內(nèi)核的MCU具備更強(qiáng)的AI處理能力。2023年,Arm再度推出專(zhuān)為AI應(yīng)用設(shè)計(jì)的Cortex-M52處理器,不僅實(shí)現(xiàn)了能效的進(jìn)一步提升,成為Cortex-M3、Cortex-M33等主流MCU內(nèi)核的替代選擇,更借助Helium技術(shù)實(shí)現(xiàn)了DSP和ML處理能力的顯著升級(jí),將AI驅(qū)動(dòng)的創(chuàng)新引入更多低功耗嵌入式場(chǎng)景。
除了內(nèi)核本身的升級(jí),Arm還推出了面向Cortex-M系列的microNPU——Ethos-U55,專(zhuān)為面積受限的嵌入式和物聯(lián)網(wǎng)設(shè)備設(shè)計(jì),可大幅加速M(fèi)L推理性能。當(dāng)Ethos-U55與Cortex-M55協(xié)同部署時(shí),相較于傳統(tǒng)的Cortex-M系統(tǒng),機(jī)器學(xué)習(xí)性能可提升高達(dá)480倍,為低成本、高能效的AI MCU解決方案提供了支撐。
在國(guó)內(nèi),安謀科技也基于Arm架構(gòu)完成了本土化創(chuàng)新,其自主研發(fā)的第三代高能效嵌入式芯片IP“星辰”STAR-MC3,基于Arm v8.1-M架構(gòu)打造,向前兼容傳統(tǒng)MCU架構(gòu),同時(shí)集成Arm Helium 技術(shù),在顯著提升CPU AI計(jì)算性能的同時(shí),兼顧優(yōu)異的面效比與能效比,成為AIoT領(lǐng)域主控芯片及協(xié)處理器的核心架構(gòu),助力客戶(hù)高效部署端側(cè)AI應(yīng)用。
02 RISC-V:AI MCU的另一技術(shù)路線(xiàn)
除了Arm架構(gòu),RISC-V憑借開(kāi)源、靈活的特性,成為AI MCU的另一重要技術(shù)選擇,其矢量擴(kuò)展(RVV)技術(shù)可讓處理器內(nèi)核加速海量數(shù)據(jù)集的單指令流計(jì)算,完美適配機(jī)器學(xué)習(xí)、圖像壓縮處理、數(shù)據(jù)加密、音視頻多媒體處理、語(yǔ)音識(shí)別和自然語(yǔ)言處理等任務(wù)——而這些正是物聯(lián)網(wǎng)端側(cè)AI落地的核心計(jì)算需求,也吸引了眾多企業(yè)基于RISC-V架構(gòu)打造AI MCU產(chǎn)品,形成與Arm架構(gòu)互補(bǔ)的技術(shù)格局。
如今,谷歌已通過(guò)與合作方Synaptics共同將基于RISC-V的Coral NPU架構(gòu)推向市場(chǎng)。Coral NPU是基于RISC-V指令集架構(gòu),包含一個(gè)四階標(biāo)量CPU核心、一個(gè)32位RISC-V向量引擎以及一個(gè)專(zhuān)門(mén)為現(xiàn)代Transformer模型優(yōu)化的矩陣核心加速器。谷歌給 Coral NPU 的定位是“一個(gè)全棧、開(kāi)源的平臺(tái),旨在解決性能、碎片化和隱私這三大核心挑戰(zhàn),而這些挑戰(zhàn)限制了功能強(qiáng)大、始終在線(xiàn)的 AI 技術(shù)在低功耗邊緣設(shè)備和可穿戴設(shè)備上的應(yīng)用?!?/p>
國(guó)內(nèi)外廠(chǎng)商:AI MCU產(chǎn)品落地加速
依托Arm Helium、RISC-V RVV等技術(shù),國(guó)內(nèi)外芯片廠(chǎng)商紛紛推出自研AI MCU產(chǎn)品,從高端高算力到入門(mén)級(jí)解決方案,覆蓋不同應(yīng)用場(chǎng)景,推動(dòng)AI MCU的商業(yè)化落地。
國(guó)際大廠(chǎng):技術(shù)領(lǐng)先,布局全場(chǎng)景
瑞薩電子的RA8系列作為業(yè)界首個(gè)基于Arm Cortex-M85內(nèi)核的MCU系列,兼具M(jìn)PU的高性能與MCU的易用性、低功耗和低BOM成本,支持單核或雙核設(shè)計(jì),最高可實(shí)現(xiàn)1GHz的CPU主頻、0.25 TOPS NPU算力,還集成了包含EtherCAT在內(nèi)的多協(xié)議工業(yè)網(wǎng),可滿(mǎn)足AI、工業(yè)以太網(wǎng)、機(jī)器人、HMI等高算力應(yīng)用需求。在此基礎(chǔ)上,瑞薩推出的RA8P1微控制器產(chǎn)品群,采用Cortex-M85(1GHz)+Cortex-M33(250MHz)的雙核異構(gòu)設(shè)計(jì),并集成Arm EthosTM-U55 NPU,借助Arm Helium技術(shù)實(shí)現(xiàn)了DSP和AI/ML性能的大幅提升,樹(shù)立了MCU性能的新標(biāo)桿。
意法半導(dǎo)體的STM32N6則是首款內(nèi)嵌自研神經(jīng)處理單元(NPU)——ST Neural-ART accelerator的STM32 MCU,專(zhuān)為節(jié)能型邊緣AI應(yīng)用設(shè)計(jì),其搭載的Arm Cortex-M55內(nèi)核主頻高達(dá)800MHz,結(jié)合Arm Helium向量處理技術(shù)顯著增強(qiáng)DSP處理能力,芯片整體時(shí)鐘頻率可達(dá)1GHz,計(jì)算性能達(dá)600 GOPS,能為計(jì)算機(jī)視覺(jué)和音頻應(yīng)用提供實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)推理能力。
恩智浦的i.MX RT700系列則以多內(nèi)核架構(gòu)實(shí)現(xiàn)智能算力的分層部署,該系列擁有5個(gè)計(jì)算內(nèi)核,主計(jì)算子系統(tǒng)包含325MHz的Arm Cortex-M33核與Cadence Tensilica HiFi 4 DSP,超低功耗感知子系統(tǒng)則搭配第二款Cortex-M33核與Cadence Tensilica HiFi 1 DSP,無(wú)需外部傳感器集線(xiàn)器,有效降低系統(tǒng)設(shè)計(jì)復(fù)雜度與BOM成本。同時(shí),該系列集成恩智浦eIQ Neutron NPU,可將AI工作處理速度提高172倍,還內(nèi)置7.5MB板載SRAM,為可穿戴設(shè)備、醫(yī)療設(shè)備、智能家居等邊緣智能設(shè)備提供算力支撐。
英飛凌的PSoC Edge E81、E83、E84系列均基于Arm Cortex-M55內(nèi)核打造,支持Arm Helium DSP指令集,同時(shí)搭配不同的AI加速單元:E81搭載英飛凌自研超低功耗NNLite神經(jīng)網(wǎng)絡(luò)加速器,E83和E84則內(nèi)置Arm Ethos-U55微型NPU,與傳統(tǒng)Cortex-M系統(tǒng)相比機(jī)器學(xué)習(xí)性能提升480倍,且三款產(chǎn)品均集成豐富外設(shè)、片上存儲(chǔ)器和硬件安全功能,支持WiFi 6、BT/BLE、Matter協(xié)議等,適配低功耗計(jì)算領(lǐng)域的機(jī)器學(xué)習(xí)應(yīng)用。
德州儀器則依托DSP技術(shù)優(yōu)勢(shì)布局AI MCU,其C2000 MCU系列的TMS320F28P550 MCU,搭載150MHz C28x 32位DSP CPU,集成浮點(diǎn)單元(FPU32)與三角函數(shù)加速器(TMU),并內(nèi)置NPU實(shí)現(xiàn)邊緣AI計(jì)算,算力達(dá)600–1200 MOPS,支持本地運(yùn)行CNN模型,適配工業(yè)控制等場(chǎng)景的AI需求。
國(guó)內(nèi)企業(yè):緊跟趨勢(shì),本土化適配突出
國(guó)內(nèi)芯片廠(chǎng)商也在AI MCU領(lǐng)域快速突破,結(jié)合本土物聯(lián)網(wǎng)應(yīng)用場(chǎng)景完成產(chǎn)品優(yōu)化,同時(shí)實(shí)現(xiàn)了RISC-V架構(gòu)的落地應(yīng)用,形成差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。
新唐科技推出的NuMicro M55M1是定位入門(mén)級(jí)的AI MCU解決方案,專(zhuān)為AI數(shù)據(jù)識(shí)別、智能音頻等邊緣應(yīng)用打造,基于Arm Cortex-M55核心設(shè)計(jì),搭載Arm Ethos-U55 NPU與Helium向量處理器,AI運(yùn)算能力達(dá)110 GOPS,相較于傳統(tǒng)1GHz MCU,AI推理性能實(shí)現(xiàn)超100倍突破,還內(nèi)置1.5MB RAM、2MB Flash并支持外擴(kuò)存儲(chǔ)。同時(shí),新唐科技還推出自研NuML Tool Kit開(kāi)發(fā)工具,并提供人臉識(shí)別、物體識(shí)別等多款現(xiàn)成AI模型,大幅降低AI應(yīng)用開(kāi)發(fā)門(mén)檻,加速產(chǎn)品落地。
國(guó)芯科技則聚焦RISC-V架構(gòu)的AI MCU研發(fā),其端側(cè)AI MCU芯片CCR4001S已實(shí)現(xiàn)10萬(wàn)顆交貨,該芯片采用RISC-V內(nèi)核,主頻230MHz,集成0.3 TOPS @INT8算力的NPU,可高效運(yùn)行MobileNet、ResNet、Yolo等深度學(xué)習(xí)算法,實(shí)現(xiàn)物體識(shí)別、目標(biāo)檢測(cè)等復(fù)雜任務(wù),同時(shí)兼具低功耗特性,尤其適配空調(diào)智能控制等家電智能化場(chǎng)景,支持客戶(hù)自主導(dǎo)入算法模型并完成迭代優(yōu)化。此外,國(guó)芯科技還與賽昉科技聯(lián)合推出CCR7002芯片,通過(guò)多芯片封裝技術(shù)集成高性能SoC與低功耗AI芯片子系統(tǒng),同樣提供0.3TOPS的NPU算力,實(shí)現(xiàn)RISC-V架構(gòu)與AI的深度融合。
樂(lè)鑫科技的ESP32-S3則在通用MCU基礎(chǔ)上增加了AI算力支持,這款集成2.4GHz Wi-Fi和Bluetooth 5 (LE)的MCU,搭載Xtensa 32位LX7雙核處理器,主頻240MHz,新增的向量指令可加速神經(jīng)網(wǎng)絡(luò)計(jì)算和信號(hào)處理,開(kāi)發(fā)者通過(guò)ESP-DSP、ESP-NN等庫(kù)即可實(shí)現(xiàn)圖像識(shí)別、語(yǔ)音喚醒等AI應(yīng)用,適配智能家居等輕量級(jí)邊緣智能場(chǎng)景。
華為海思則針對(duì)家電端側(cè)智能化推出Hi3066M,這款微算力嵌入式AI MCU采用海思自有RISC-V內(nèi)核,內(nèi)置eAI引擎,主頻200MHz,搭配64KB SRAM和512KB內(nèi)置Flash,可適配空調(diào)、冰箱、洗衣機(jī)等白電的AI節(jié)能、智能檢測(cè)等場(chǎng)景,同時(shí)預(yù)留了足夠的存儲(chǔ)空間,滿(mǎn)足未來(lái)5~10年的產(chǎn)品升級(jí)需求,是華為首款端側(cè)eAI芯片。
總結(jié)
AI MCU已不再是單純的技術(shù)概念,而是推動(dòng)物聯(lián)網(wǎng)智能化落地的核心載體與市場(chǎng)新引擎。隨著Arm Helium、Ethos-U NPU以及RISC-V矢量擴(kuò)展等關(guān)鍵技術(shù)的成熟,MCU產(chǎn)品正加速向“低功耗、高實(shí)時(shí)、強(qiáng)推理”的三元平衡點(diǎn)演進(jìn)。國(guó)際大廠(chǎng)憑借深厚的技術(shù)積累構(gòu)建了全場(chǎng)景的高性能產(chǎn)品矩陣,而中國(guó)廠(chǎng)商則依托本土化創(chuàng)新與RISC-V架構(gòu)的靈活優(yōu)勢(shì),在細(xì)分場(chǎng)景中實(shí)現(xiàn)了差異化突圍。





