Please ensure Javascript is enabled for purposes of website accessibility 人工智能的發展及潛力:Google問答集 - 駿利亨德森投資
香港投資者專用

人工智能的演變及潛力:Google問答集

一場聚焦人工智能的研討會於近期舉行,研討會由投資組合經理Richard Clode主持,Google亞洲區高級管理層參與討論,內容摘要如下。

Richard Clode, CFA

Richard Clode, CFA

投資組合經理


2023年11月1日
8 分鐘閱讀

焦點分析:

  • 使用轉換器的大型語言模型不斷推出生成式人工智能服務,激發起客戶濃厚的興趣。
  • 科技巨企(hyperscalers)正受惠於對雲端基礎設施的需要,而雲端基礎設施是生成式人工智能服務的交付機制。
  • 負責任的顛覆日益成為焦點,這非常有利於科技行業的長遠前景。

問:人工智能已問世幾十年,為何到現在能再掀熱潮?

包括Google在內的許多公司,在多年來一直使用人工智能來改進其產品及服務,例如獲取更準確的搜尋結果,或在地圖中建議更便捷的路線。人工智能的另一個常見用途是預測文本,例如用於Gmail。Google率先提出Transformer模型的概念,並把這項技術的源始碼公開。ChatGPT中的GPT是generative pre-trained transformer的縮寫,中文意為生成式預訓練轉換器。

目前,為人工智能創造機遇已萬事俱備。處理速度大幅提高。訓練具有數千億參數的大型語言模型,需要進行大量的工作。其次,數據大爆炸就像燃料,使這些模型能夠產生更理想的結果和成果。

同時,這些大型語言模型正快速發展,變得越來越聰明,學習速度持續提升。生成式人工智能的應用領域可能非常廣泛。大型語言模型推動著生成式人工智能的發展。如果現在你向Google Search提問2+2等於多少,它會回答答案是4,它之所以這樣回答,並不是因為它具有智能,而是因為該答案曾出現在Google的大型語言模型所使用的培訓文件中。

正是預測能力讓人工智能變得如此有趣。企業和組織通常會問三個重要問題:我們如何利用人工智能節省成本?如何提高我的員工的工作效率?如何改善客戶體驗?數碼支援助理(digital support assistant)是生成式人工智能的真實用例之一,隨著這項技術更普遍地與流程相結合,它變得更加實用。

數據已經開始得到變現,這一點也非常重要。我們通常可使用免費的應用程式界面,使兩個軟件部件(如應用程式和手機)能夠相互溝通。最近,Twitter和Reddit等熱門社交平台向開發人員收取查閱其應用程式數據的費用。企業尋求將他們掌握的數據變現,最重要的是,此舉可防止任何人在互聯網進行網頁抓取(web scraping)以創建大型語言模型。

問:哪些領域的人工智能應用潛力最大?

對消費者而言,焦點是能夠令他們的生活變得更美好的工具和服務。 受惠於人工智能,大量的消費者互動將會變得更加便捷、更加身臨其境。同時,企業客戶正在利用人工智能來大力推動業務增長。

第三個方面是責任,有甚麼機會可使整個社會變得更加完善?我們需要透過保障措施和監管來保護人們,避免人工智能的潛在危險。我們如何使人們的生活更美好,人工智能如何更高效地做到這一點?人工智能已在一些領域提供協助,包括大規模診斷疾病、協助預測水災,美國上市的新藥創歷史新高,而人工智能為提升生產力助一臂之力。

問:如今生成式人工智能應用於哪些領域?

Google的每款產品都內置了人工智能。Google發現,消費者確實有興趣與人工智能互動,並以有趣的方式使用這項技術。在人工智能的幫助下,許多領域的發展讓人振奮,並呈現巨大潛力。人類熱愛搜尋相關且具語義性質的資訊,這種根本欲望是非常強烈。企業運用人工智能提供服務的例子廣泛,包括人力資源服務台軟件、銀行服務台軟件、旅遊服務台軟件或任何其他面向客戶需要的應用程式。人工智能有助於查找資料。使用大型語言模型的生成式人工智能,能夠以自然方式查詢任何資料來源,並且可以用特定方式對其進行訓練使其適應。

身兼Google和Alphabet行政總裁的Sundar Pichai表示,他們對人工智能的應用必須敢於冒險,但也要以負責任的態度行事。人工智能的開發和部署方式可為社會帶來裨益,例如改變提供健康護理的方式、減慢氣候變化,以及最終使我們生活得更加美好的其他方式。Google的「綠燈計劃」(Green Light project)利用生成式人工智能和駕駛趨勢,透過規劃最高效的交通模式和路徑來幫助減少汽車的廢氣排放。

在提升員工工作效率方面,軟件開發人員平均每天最少要用30分鐘尋找解決方案。人工智能技術可透過加快流程,在幾秒鐘內提供解決方案並編寫部署解決方案的代碼。這類人工智能應用個案已經非常普遍,並且擴展至各行各業,包括金融服務,電訊,零售,健康護理,電子商貿及政府等。

問:為甚麼雲端是人工智能的重要交付機制?是甚麼促使科技巨企需要擁有研發成本高昂的專用微晶片?

生成式人工智能不僅是一項技術,而是一組技術,而架構中最基本的是基礎設施。丹福大學教授吳恩達表示,「人工智能是新的電能。」由此可以得出,數據就是為電網提供動力的燃料,而電網實際上就是雲端。雲端數據和人工智能緊密相連;雲端科技巨企日漸成為所有人工智能的核心和中心。雲端是管理、處理和儲存大規模數據集所需的底層基礎設施。Uber Eats使用Google API和基礎設施為整個對話式人工智能介面提供支援。重要的是,大數據是雲端催化因素,因為若要重新建設架構和運用生成式人工智能,並提供數據存取權限,你就需要雲端基礎設施。

業界需要定制晶片的理由有三個:性價比、可持續性和滿足客戶複雜和定制需要的大型語言模型極為複雜。Google在GPU(圖形處理的專用晶片)方面與輝達(NVIDA)合作,但以往在張量處理器(Tensor Processing Units,簡稱TPU)方面也有創新發展。TPU是Google專門開發、用於特定應用項目的集成電路(ASIC),其目的是加快機器學習的工作負載。

現有的一般用途晶片僅執行標準乘法,但複雜的大型數據集(以澤字節(zettabytes)計算的資訊)需要矩陣乘法,這是標準CPU(用於運行電腦作業系統和應用程式)無法做到的。這就是業界提出加速器這個整體概念的因由,NVIDIA和Marvell Technology等公司開始設計這類加速器。目前,Google最大的大型語言模型擁有大約5,400億個參數。下一個更大的大型語言模型將會擁有大約一萬億個參數。

就成本和可持續性因素而言,效率越高,應對查詢的成本就越低。大型語言模型的訓練和推理成本涉及的碳排放密集度極高,因此科技巨企渴望和需要設計自身的專用晶片。

問:人工智能具備強大功能,那麼它有甚麼主要問題?

負責任的顛覆極為重要,因為它影響民生、就業、政府及經濟。一般而言,科技公司目前在這方面採取的做法,比過去更為深思熟慮,這對該行業非常正面。

資料私隱和網絡罪行是任何新開發技術固有的安全問題。人工智能帶來的是可解釋性的挑戰。當聊天機器人╱對話式人工智能被問到一個問題並提供答案時,它如何解釋自己如何得出這個答案?這個問題尤其會影響客戶最終依賴信任的組織,例如政府和銀行。

在大型語言模型中,可解釋性是一個棘手問題。當兩個人互動時,難以預測對方將如何回應,因為這取決於上文下理、見面的地點和時間等。對於生成式人工智能和大型語言模型,情況也是如此。當生成式人工智能提出一些完全自行發明的東西時,就會聯繫到所謂的「幻覺」。

Google的Bard加入了一項檢查功能,借助Google Search的優勢來核查事實,旨在幫助人工智能成為一種更令人放心、更正面的體驗。識別和剔除錯誤資訊是重點關注領域。

至於專有數據和抓取問題,Google的觀點是,大型語言模型的存取使用,將會對公眾開放,實現民主化,例如Google、OpenAI、Meta等的大型語言模型。大型語言模型通常會利用免費提供的通用數據進行訓練。當企業將其專有數據與大型語言模型的強大功能結合時,前者就會獲得真正價值。此時他們開始從中受惠,可將專屬數據庫中的客戶資料與前端平台和後端系統結合。

附註:Google 高級管理層 – Google Cloud亞太區科技總監Mitesh Agarwal和Google亞太區市場推廣總監Simon Kahn。

人工智能推理:機器學習的第一階段是訓練階段,透過記錄、儲存和標記資訊來開發智能。在第二階段,推理引擎在知識庫中運用邏輯規則來評估和分析新資訊,這些資訊可用於增強人類決策。

運算:涉及晶片處理能力、記憶體、網絡、儲存,以及任何程式運算成功所需的其他資源。

CPU:中央處理器是透過解釋、處理和執行硬件及軟件程式的指令,來運行機器的作業系統和應用程式的控制中心。

生成式人工智能:指利用大量原始數據進行訓練,以生成包括文字、圖像、音訊及視訊等「新內容」的深度學習模型。

GPU:執行圖形渲染(graphics rendering)所需的複雜數學和幾何計算的圖形處理器。

科技巨企(Hyperscalers):為大規模雲端、網絡及互聯網服務提供基礎設施的公司。例如Google Cloud、Microsoft Azure、Meta Platforms、阿里雲和Amazon Web Services (AWS)。

LLM(大型語言模型):一類專門的人工智能,利用大量文本進行訓練,以了解現有內容並生成原始內容。

開源軟件:在檢閱、修改和分發方面可公開存取的代碼。

TPU:張量處理器的主要任務是結合乘積和累加運算的矩陣處理。張量處理器包含數千個直接相互連接的乘法累加器(multiply-accumulators),形成一個大型物理矩陣。

轉換器模型:一種神經網絡,追蹤序列數據中的關係,學習上文下理之間的脈絡及意義。

重要資料

科技產業或會受到現有科技過時、產品週期短、價格和利潤下跌、市場新對手帶來競爭以及整體經濟環境的重大影響。集中投資單一產業的波幅或會高於集中程度較低的投資和市場的表現。

任何對個別公司的參考,僅供說明用途,並不構成買入或賣出投資建議,法律或稅務事項的忠告。

主要投資風險:

  • 本基金投資於股票,須承受證券價值波動的股本證券風險 。
  • 投資本基金涉及一般投資、貨幣、人民幣貨幣及兌換、流動性、對沖、市場、經濟、政治、監管、稅務、有關證券借出、有關反向回購交易、金融及利率風險。在極端的市場環境下,閣下可能會損失全部投資。
  • 本基金可使用金融衍生工具降低風險及更有效率地管理基金,並涉及對手方、流動性、槓桿、波動性、估值及場外交易風險,可能蒙受重大損失。
  • 本基金的投資集中於科技行業,或會具較高波動性,並承受科技相關公司風險。
  • 本基金可能投資於歐元區, 或會蒙受歐元區風險。
  • 本基金可能徵收業績表現費。即使投資資本虧損,投資者也可能需要支付此費用。
  • 投資者不應只根據此文件而作出投資決定,並應細閱有關基金銷售文件,了解風險因素資料。