Please ensure Javascript is enabled for purposes of website accessibility 投資速覽:詞元(Tokens)即收入—NVIDIA論證AI回報具擴展空間 - 駿利亨德森投資 - 香港零售投資者(中文)
香港投資者專用

投資速覽:詞元(Tokens)即收入—NVIDIA論證AI回報具擴展空間

投資組合經理Richard Clode總結NVIDIA GTC 2026的主要亮點。推高可持續AI回報的代理式AI、詞元(Tokens)導向的商業模式,連同機架級協同設計,正在重塑AI基礎設施的技術和經濟格局。

18 Mar 2026
4 分鐘閱讀

焦點分析:

  • 代理式AI迎來拐點:OpenClaw並非單純的對話式AI工具,而是可以大幅提升代理式AI的使用強度及運算需求。
  • 詞元(Tokens)驅動收入上升:NVIDIA認為,分級詞元商業模式可為AI資本開支帶來具吸引力、具擴展空間的回報;Vera Rubin有望顯著提升每吉瓦的收入潛力。
  • 通過極致協同設計擴闊競爭護城河:NVIDIA通過緊密整合CPU、GPU、LPU、網絡和軟件,力求在AI推理轉向低延遲、高吞吐量工作負載的過程中鞏固其競爭地位。

AI的多樣性正正體現其韌性,其廣泛的應用範圍正是AI持久發展的關鍵。毫無疑問,這不是單一應用程式的技術,而是具有根本性質,這絕對是一次新的運算平台變革。

 

NVIDIA行政總裁黃仁勳

NVIDIA年度盛事GTC(GPU技術大會)雖然以開發者為核心受眾,對象並非投資界,但實際上是AI界重要的「國情咨文」,聚焦於該產業的重大發展。行政總裁黃仁勳就開源自主AI代理OpenClaw的深遠影響提供最新簡介,指出該平台是代理式AI普及的催化因素。他亦提供一個詞元商業模式能推動收入增長的有力理據,證明AI資本開支有可能獲得可觀回報,且回報具有可持續性和韌性。

黃仁勳的主題演講亦針對近期市場對競爭對手的關注點,深入闡述NVIDIA的競爭護城河。他概述公司機架級產品創新的驕人規模與速度,包括以類似收購的方式將Groq納入公司今年稍後的產品路線圖(NVIDIA與Groq簽署非獨家推理技術授權協議,旨在加快全球層面的AI推理技術發展),配合專為代理式AI及推理運算而建的機架級AI超級電腦Vera Rubin之「極致協同設計」。面對供電受限的「空殼式」數據中心(為應對AI、雲端運算等需求的爆發式增長而建,但面臨電力限制),能夠以每吉瓦電力產生最多詞元、從而創造最高收入的AI基礎設施供應商,將成為市場王者。

我們認為,GTC 2026有四大亮點值得投資者留意:

1. OpenClaw開啟代理式AI的「Windows 時刻」

[OpenClaw]是人類歷史上最受歡迎的開源項目,在短短數週內,下載量就超越了Linux,而Linux累積大約30年才取得如此成果,其重要性不言而喻。

 

黃仁勳

OpenClaw在短短數週內達成Linux 30年來的成果,正如同Windows令個人電腦普及,OpenClaw亦等同代理式電腦的操作系統。此免費開源自主AI代理讓用戶突破傳統AI聊天功能,透過連接WhatsApp、WeChat、Microsoft Teams、Telegram及瀏覽器等應用程式,實現日曆管理、收發電郵、航班查詢等「實務工作」。

如今人人皆可創建個人代理,全球每一家公司亦應制定OpenClaw策略。運算需求短短兩年內增長一百萬倍,但黃仁勳認為以代理式AI的運算強度與技術用量爆炸性增長來說,我們正處於下一次指數級飛躍的臨界點。

2. 詞元即收入

因應市場對AI資本開支可持續性與商業化/投資回報率(ROI)潛力的爭論,黃仁勳詳細闡述其商業模型。他認為AI企業應該分級對詞元收費。企業會設置免費級別來吸引用戶,但隨著AI互動增加,詞元帶來的收益將迅速規模化。以新一代Vera Rubin基礎設施為例,一家企業每座斥資1,000億美元興建的吉瓦級數據中心,有潛力帶來高達1,500億美元的收入,如此投資回報頗具吸引力。

3. 極致協同設計構築競爭護城河

NVIDIA行政總裁黃仁勳表示,AI乃全棧問題,需要全棧解決方案。今年即將推出的Vera Rubin包含七款全新協同設計以大幅提升性能的晶片,其中包括最近對 Groq 的準收購,這將帶來低延遲(快速)詞元生成的新功能。他詳细說明如何整合Groq加速LLM推理的技術:透過拆分式推理架構,發揮GPU在吞吐量方面的優勢,專責處理注意力解碼(提問),而Groq LPU則發揮頻寬優勢,從而處理解碼生成(回答)。除了設計全新CPU、GPU、DPU與儲存架構外,Vera Rubin詞元生成量可達短短兩年前發佈的前代產品Hopper (GPU)之350倍。值得一提的是,鑑於近期市場追捧光學網絡股(AI數據中心高速光學鏈路供應商),黃仁勳重申,銅導線在NVIDIA路線圖中仍有長遠發展空間,將逐步分階段推出結合光學及共同封裝光學技術的架構。

4. 預計2025至2027年銷售額達1萬億美元

所有SaaS公司將進化成AaaS公司,即代理人即服務公司。

 

黃仁勳

NVIDIA預計2025至2027年Blackwell及Rubin的收入將超過1萬億美元,此數字尚未計入Hopper、獨立CPU或Groq LPU的銷售額。供應短缺預計將持續至2026年,而且該估算日後大有可能進一步上調。

除非另有説明,NVIDIA GTC資訊均來自Investing.com;NVIDIA GTC主題演講稿;2026年3月16日和NVIDIA.com

AaaS:代理人即服務,一種訂閱型的雲端服務模式,用於部署有限度監督下可自主決策及執行任務的AI代理,通常由大型語言模型(LLM)驅動。

代理式AI:使用複雜的推理和迭代規劃自主解決複雜、多步驟問題的人工智能系統。來自多個數據來源和第三方應用程式的大量數據應用於獨立分析問題、制定策略和執行任務。

資本開支:企業為推動業務增長及擴充而促成新項目或投資,從而對重大長期資產投放的支出,此類資產包括物業及設備等有形資產,或技術、軟件、商標、專利等無形資產。

供電受限的「空殼式」數據中心:數據中心設施的實體建築(「外殼」)已落成,但協助資訊科技設備運行的電力供應有限或不足。

CPU:中央處理器是透過解釋、處理和執行硬件及軟件程式的指令,來運行機器的作業系統和應用程式的控制中心。

DPU:數據處理單元,一種專門的處理器,用於從CPU卸載網絡、儲存及安全任務,在現代數據中心用於加速數據傳輸及基建服務,提升效率及可擴展性,對運行現代AI工作負載至關重要。 

全機架解決方案:在數據中心租用或購買一整套伺服器設備及服務。

全棧解決方案:指一種全面的軟件開發方法,涵蓋應用程式或項目的所有層面,包括前端及後端組件,以及應用程式完全運行所需的任何其他層面。

GPU:執行圖形渲染(graphics rendering)所需的複雜數學和幾何計算的圖形處理器,亦被用於遊戲、內容創作及機器學習。

低延遲詞元生成:生成式AI模型(大型語言模型)接收提示後生成每個連續輸出單位(「詞元(Tokens)」)的速度。

LPU或語言處理器:Groq的專有及專用晶片,專為處理大型語言模型(LLM)獨特的速度及記憶體需求而設計。

開源軟件:在檢閱、修改和分發方面可公開存取的代碼。

ROI(投資回報率):用作衡量投資表現的財務比率,計算方法是將淨利潤或虧損除以投資的最初成本。

SaaS:一種基於雲端的軟件交付模式。在該模式下,應用程式透過互聯網存取,雲端服務供應商負責基礎設施、保安及更新。應用程式存儲於軟件供應商的伺服器。

任何對個別公司的參考,僅供說明用途,並不構成買入或賣出投資建議,法律或稅務事項的忠告。