AI 在邊緣領域的優(yōu)勢現(xiàn)在是顯而易見的。在這些領域中,實時響應起到?jīng)Q定性的作用。比如說,在安全敏感型應用中,既要將原始數(shù)據(jù)傳輸到云的通信成本降至最低,又要降低功耗、保護隱私并提高對多個邊緣節(jié)點的可擴展性。對于以上這些要求,我們建議通過邊緣設備內(nèi)的人工智能而不是遠程云服務來滿足。然而,一個 AI 引擎無法服務我們現(xiàn)在所知的邊緣應用范圍。家用電器可能只需要識別一組簡單的語音命令或食品容器上的圖片。更復雜的監(jiān)控系統(tǒng)或工業(yè)機器人系統(tǒng)則可能需要融合圖像傳感器、麥克風、運動傳感器等的多方輸入。就高端領域而言,自動或半自動駕駛識別系統(tǒng)需要用到非常復雜的深度神經(jīng)網(wǎng)絡 (DNN)。CEVA SensPro2 和 NeuPro-M 平臺恰能滿足這些需求。
邊緣 AI 市場
自現(xiàn)在起至本世紀末,邊緣 AI 處理器芯片市場的年復合增長率預計將達到 20% 左右。這一增長是由智能設備采用率/發(fā)展程度不斷提高推動的,具體涉及:攝像頭、可穿戴設備和家庭自動化領域消費者;安全和自動化程度日益提高的汽車行業(yè);行業(yè)監(jiān)控、機器人、機器/工廠控制和預測性維護。
最有可能在這些領域取得成功的產(chǎn)品自然必須功能十足、性能強大,如此才能滿足應用這些產(chǎn)品的認可需求。此類產(chǎn)品必須根據(jù)消費者定價和/或在大規(guī)模部署時具有成本效益,同時還應該最大限度地減少現(xiàn)有無線基礎設施的增量負載。此類產(chǎn)品的軟件還必須可以升級,如此才能適應快速發(fā)展的 AI 技術(shù)領域的新興解決方案。
傳感器融合和 SensPro2
除了最簡單的智能邊緣設備之外,其他所有設備現(xiàn)在都使用多個傳感器。兩個或更多傳感器的融合信息通??勺屩悄芟到y(tǒng)提供準確性度更高的信息或補充信息。例如,在自動平行泊車或自動代客泊車系統(tǒng)中,可結(jié)合使用探測可用空間的視覺傳感技術(shù)/雷達與超聲波測距技術(shù),另外也可以結(jié)合使用 IMU 輸入,進一步細化定位估計結(jié)果。SLAM 算法可以對這些功能形成補充,在停車場內(nèi)導航以便自動代客泊車。
CEVA SensPro2 傳感器中樞 DSP 是傳感器中樞/融合應用的完美答案。SensPro2 是第二代 CEVA 傳感器中樞 DSP,允許圖像傳感器、麥克風、雷達、飛行時間、IMU 等的多個傳感器輸入?;谏窠?jīng)網(wǎng)絡的軟件可在這種 DSP 架構(gòu)上快速運行。因為這種架構(gòu)提供整套豐富的硬件支持功能,包括:具有靈活 MAC 操作范圍的矢量單元、整數(shù)和浮點運算支持、針對應用的 ISA 擴展和全面的非線性指令集。SensPro2 可利用這些功能提供 2 倍的 AI 速度、6 倍的 SLAM 速度、8 倍的雷達速度、10 倍的音頻速度(相較于上一代 SensPro 而言)。
在各種消費者應用中,邊緣人工智能已通過 SensPro2 部署到 SoC,最近發(fā)布的新 Novatek 監(jiān)控 SoC 版本就是一個示例。
DNN 智能和 NeuPro-M
高端邊緣智能需要深度神經(jīng)網(wǎng)絡 (DNN) 支持、高水平的并行性能和帶寬優(yōu)化,以及擁有最新 AI 算法的異構(gòu)加速器。對于第一種需求而言,自動/半自動駕駛時的可用空間檢測是一個不錯的應用示例。此檢測目的在于沿著公路/高速公路的安全駕駛區(qū)域行駛,避開障礙物,避免駛上對向車道、未鋪砌的路肩和隔離帶。在這種情況下必須迅速響應,因此會將前方道路圖像分解為 4 個子幀,對其進行并行處理。之后再在每個子圖像上運行可用空間檢測,并重新組合以提供完整的結(jié)果。對于邊緣應用中的此類人工智能而言,NeuPro-M 可支持多達 8 個并行運行的引擎。
大家對精度和性能的期望遠不止并行這么簡單。如今的網(wǎng)絡開發(fā)人員希望利用現(xiàn)在 NeuPro-M 中采用硬件加速的專用功能,如矩陣分解、稀疏、Winograd 及混合精度的神經(jīng)操作,且以上所有功能都可以在每個并行引擎中使用。
NeuPro-M 于 2022 年發(fā)布,榮獲了“亞洲金選獎”之“金選潛力標桿獎”及“2022 年邊緣人工智能與視覺聯(lián)盟產(chǎn)品獎”之“年度最佳邊緣 AI 處理器榮譽獎”。目前已部署在設計中的多個 SoC 中,并預計會在未來幾年出現(xiàn)在最終產(chǎn)品中。
面向未來的解決方案
在標準 CPU 或 GPU 上運行的純軟件 AI 解決方案效率過低,功耗又大,不太實用,但在理論上來說又具有一定的吸引力,因為您可以隨時更改軟件,而無需更改硬件。隨著 AI 技術(shù)和網(wǎng)絡層的發(fā)展,能否在獲得硬件加速帶來的所有性能和功耗優(yōu)勢的同時,保持靈活升級?SensPro2 和 NeuPro-M 能夠做到這一點。這些 AI 解決方案的矢量 DSP 基礎確保您能夠隨著市場需求和網(wǎng)絡的發(fā)展,在軟件中對產(chǎn)品實施進行升級。CEVA 的深度神經(jīng)網(wǎng)絡 (CDNN) AI 編譯器簡化了從標準網(wǎng)絡(TensorFlow、PyTorch 等)實施到在特定 SoC 中實施時映射到處理器 IP 的一應事宜。您也可以在此步驟中控制優(yōu)化,以充分利用特殊加速器(如 NeuPro-M 中的加速器),或添加您在設計中可能需要的、自己的加速器。CEVA CDNN-Invite API 為此類擴展提供支持。
作者:Moshe Sheier, Vice President of Marketing, CEVA