生成式AI現已成為創投界的明日之星,以往流向元宇宙的大量資金,如今迅速掉頭湧進AI產業,各大創投基金都四出尋覓下一家OpenAI。在芸芸AI初創中,由OpenAI前員工創立的「Anthropic」最受看好,被外界視為OpenAI最強對手;另一黑馬是獲AI晶片龍頭NVIDIA注資的「Cohere」,乃僅次於OpenAI與Anthropic的第三大AI獨角獸;再加上近日科技狂人馬斯克突然宣布成立的AI初創「xAI」,令競爭更趨白熱化。究竟這些後起之秀是否有足夠實力挑戰OpenAI的王者寶座呢?

生成式AI融資總額將暴升數倍

根據金融數據機構PitchBook的統計,2018年OpenAI發表初代GPT大型語言模型時,整個生成式AI產業的融資額僅為4.08億美元(約31.82億港元)。2022年OpenAI推出基於GPT-3.5模型的ChatGPT,全年融資額大幅成長至45億美元(約351億港元)。

當生成式AI爆紅後,單計2023年第一季,各家AI初創公布的交易額合計為116億美元(約904.8億港元),相等於2022年融資總額的2.5倍以上。觀乎此趨勢,2023全年AI投資總額將可輕鬆超越2022年的數倍、甚至十幾倍。在當下的創投寒冬中,生成式AI已成為逆勢爆發的熱門融資對象。

商業分析機構CB Insights的數據顯示,當今13家最大的獨角獸級AI初創,當中大半是在過去一年間成立;單計2023年,包括Cohere在內的5家初創已進入獨角獸俱樂部(意指公司估值達到10億美元或以上)。這13家初創從開業到晉身為獨角獸,平均時間為3.6年,比起整個初創產業的平均時間(7年)縮短近半。

OpenAI前員工創立Anthropic

在AI獨角獸排行上,OpenAI以高達290億美元(約2,262億港元)的市值遙遙領先。緊隨其後的是美國初創Anthropic,估值達到44億美元(約343.2億港元)。名列第三的則是加拿大初創Cohere,估值約為22億美元(約171.6億港元)。後兩者可說是當今最有潛力跟OpenAI一較高下的AI初創。

Anthropic創辦人為OpenAI研究副總裁達里奧·阿莫代(Dario Amodei)。2020年12月,他與其姐姐、OpenAI前安全及政策副總裁丹妮拉·阿莫代(Daniela Amodei),以及近10位資深員工一起離開OpenAI,在2021年另起爐灶,創辦AI初創企業Anthropic。

OpenAI前研究副總裁Dario Amodei(左)與其姐Daniela Amodei(右),因不滿OpenAI漸偏商業化的經營路線,於是帶領一批志同道合的員工出走,創辦AI初創Anthropic。(圖片來源:Salesforce Ventures官網)

當日Amodei與其他員工之所以決定辭職,主要原因是擔心OpenAI接受微軟(Microsoft)投資後,其營運會變得趨向商業化,而不是AI民主化,甚至背離維護AI安全性的初衷。為免Anthropic重蹈覆轍,阿莫代將該公司註冊為一間公益公司(Public Benefit Corporation),希望在商業營利與社會公益之間取得平衡。

原本寂寂無名的Anthropic,首次走在新聞鎂光燈之下,是2023年2月Google Cloud宣布跟Anthropic建立合作夥伴關係。根據《金融時報》報道,Google已於2022年底向Anthropic投資3億美元(約23.4億港元),取得後者10%股份。Anthropic同意將Google Cloud列為首選的雲端供應商,而且兩家公司也會攜手開發AI運算系統。

Claude藉合憲AI挑戰ChatGPT

市場認為,這次合作是微軟向OpenAI投資100億美元(約780億港元)後,Google對此作出抗衡的部署,同時亦為Anthropic與OpenAI之間的競爭揭開序幕。2023年3月,Anthropic推出功能類似ChatGPT的AI模型「Claude」,同樣可以提供一問一答的聊天體驗,又可以根據用戶輸入的提示詞產生文案或程式碼。作為後來者,Anthropic如何為Claude營造出產品差異性呢?

一直以來,ChatGPT因不時會輸出一些帶有偏見、令人反感的回覆,所以經常遭外界批評。有鑑於此,Anthropic發表了以保障人類福祉為最高宗旨的「AI憲法」,並基於此憲法對Claude進行訓練,務求向AI模型灌輸正確的價值觀,以訓練出負責任的AI系統。Anthropic稱呼這種方法為「合憲AI」(Constitutional AI)訓練法。

合憲AI在第一階段中運用監督式學習(Supervised Learning)模式,要求AI模型自我批判並不斷微調回覆內容;在第二階段中則使用強化學習(Reinforcement Learning)模式,以微調過的模型來評估另一模型輸出答案的好壞,藉此減少人類偏見的影響。(圖片來源:Anthropic官網)

在合憲AI訓練法之下,Anthropic把Claude的訓練過程分為2個階段執行:在首階段中,要求AI模型根據AI憲法作出自我批判,並不斷修正其輸出答案,藉此微調AI模型;進入第二階段,利用微調過的AI模型跟Claude不停地重複互動,例如由前者評估後者產出的2個回覆答案,哪一種比較好。

面向企業客戶的即時通訊軟件《Slack》,已整合Anthropic的AI模型,可讓用戶獲得來自Claude的各式建議和技術支援見解。(圖片來源:Slack官網)

由於Claude不是根據人類給予的意見作價值判斷,而是藉由另一模型按AI憲法輸出的回饋為評審標準,所以能夠選出較無害和合乎倫理的答案。Anthropic認為,這種訓練方式可以消除人為介入AI訓練過程中所滲入的人類偏見和誤判,使到AI行為更容易受到控制,並大幅降低Claude產出有害內容的可能性。

Anthropic擬兩年融資50億美元

Anthropic指出,用於訓練Claude的AI憲法以多套典範性法則為基礎,包括:《聯合國人權宣言》、Google DeepMind公司的Sparrow Principles,以及蘋果(Apple)的服務條款等,足以將AI模型輸出引導至更安全、更有幫助的方向。

2023年5月,Anthropic宣布完成4.5億美元(約35.1億港元)的C輪融資,由創投公司Spark Capital 領投,參投方則有Google、Salesforce、以及Zoom等。有消息指,Anthropic希望在兩年內再融資50億美元(約390億港元),用於強化Claude來跟ChatGPT競爭。

事實上,研發大型語言模型本就是非常燒錢的玩意。當日OpenAI斥資10億美元(約78億港元)向輝達(NVIDIA)購入10,000顆圖像處理器(GPU),作為ChatGPT數據訓練的硬件基礎。Anthropic亦曾暗示,為求提升AI運算力,18個月內便燒掉了10億美元。

雖然50億美元看似不少,惟考慮到Google需要外部強援來對抗微軟與OpenAI陣營,相信Anthropic要募集到這筆資金應該不會太難。PitchBook分析指,對AI業界來說,Anthropic的誕生絕對是一件大事,因為這證明OpenAI不再是生成式AI賽道上的唯一玩家,此領域依然是一個極具競爭性的市場。

Anthropic現已在人力資源、教育、以及醫療等行業建立客戶基礎。(圖片來源:Anthropic官網)

Anthropic剛於2023年7月11日發布全新的「Claude 2」,不僅程式碼、數學、推理表現都有所提升,而且文字輸入和輸出長度也大幅增加﹕每次容許用戶輸入最多100k token的提示詞,即是可以一次過讀取幾百頁的文件!(圖片來源:Anthropic官網)

Cohere助企業創建自家AI模型

至於被視為生成式AI初創第三強的Cohere,剛於2023年6月宣布取得2.7億美元(約21.06億港元)的融資,投資方包括NVIDIA、甲骨文(Oracle)、以及Salesforce。這家由Google前AI研究人員艾丹·戈麥斯(Aidan Gomez)、尼克·弗羅斯特(Nick Frosst)和Ivan Zhang聯合創辦的初創,目標是成為獨立企業,不接受單一公司的大額投資,因為這樣既會限制業務發展,又難以為客戶做正確的事。

Cohere聯合創辦人兼執行長Aidan Gomez(右)作為Transformer框架論文的作者之一,認識到Transformer可發展出極具商業價值的大型語言模型,於是決定下海創業。(圖片來源:Twitter@cohere帳戶)

甲骨文於2023年6月宣布,與Cohere合作提供生成式AI服務,協助企業實現業務流程自動化、改進決策並強化客戶體驗。(圖片來源:Cohere官網)

2017年,仍然在學的Aidan Gomez參與Google Brain研究項目,並與其他研究人員聯名發表AI界經典研究論文《Attention is All You Need》,提出機器學習框架「Transformer」,這正是日後奠定ChatGPT發展基礎的AI架構。同年,戈麥斯跟多倫多大學同學Ivan Zhang合作創立非牟利AI研究社群For.ai,藉此連繫世界各地的獨立AI研究人員。

2018年,戈麥斯加入「AI教父」、圖靈獎得主謝菲·辛頓(Geoffrey Hinton)領導的Google Brain研究團隊,不但加深對Transformer框架的了解,更結識了專門研究機器學習的弗羅斯特。2019年,戈麥斯深切體會到Transformer處理自然語言的出色表現,認為極具商業化的潛力,於是拉攏弗羅斯特與Ivan Zhang共同成立Cohere,聚焦於企業用戶市場,按照企業的數據特性和業務需要,量身訂製專屬的大型語言模型。

Cohere在企業市場單挑OpenAI

近期愈來愈多企業禁止員工在公司內使用ChatGPT等AI工具,除有避免商業機密外洩的考量外,也是不敢將公司的數據命脈交付給別家公司的AI手上。因此,Cohere所走的業務路線,正好迎合這些企業的需求。

Cohere創建了大型Transformer神經網絡系統,讓企業客戶透過API連接使用,按照使用方式付費;企業數據將儲存於私有雲端空間,由客戶完全掌控。如此一來,企業不用負擔大型語言模型的高昂建構成本,就可在Cohere平台上用公司數據來訓練自家模型,還可以掌握數據控制權,降低洩漏風險。目前Cohere正跟OpenAI在企業用戶市場展開激烈競爭,更迫使OpenAI要大幅減價來吸客。Cohere現有客戶包括全球最大音樂串流平台Spotify、以及文案生成AI平台Jasper等。

本來,OpenAI、Anthropic、Cohere三強鼎立的局面業已成形,但科技狂人伊隆·馬斯克(Elon Musk)無預警宣告進軍AI領域,勢必衝擊未來AI市場秩序。2023年7月12日,他在Twitter上留言:「宣布成立 xAI,以了解現實。」(Announcing formation of @xAI to understand reality.)。

Cohere的文本生成產品「Command Model」,是可以接受用戶個人化命令訓練的文本產生模型,換言之,企業把本身數據與Command結合後,即可創建自家語言模型,直接套用至實際業務流程。(圖片來源:Cohere官網)

馬斯克成立xAI劍指OpenAI

馬斯克揚言,xAI要創建一個「好的」通用型人工智能(Artificial General Intelligence),以取代OpenAI、微軟、以及Google的產品。其實,研發造福全人類的通用型AI,本是OpenAI的成立宗旨,但近期似乎已很少被該公司提起了。

作為OpenAI的聯合創辦人之一,馬斯克因與執行長山姆·奧特曼(Sam Altman)為首的管理層意見不合,被迫離開OpenAI。如今他創立xAI,又強調要研發通用型AI,著實有點「復仇者回歸」的味道。

馬斯克早於2023年3月註冊一家名為「X.AI」的新公司,自此市場流傳他有意跨入生成式AI領域。想不到他於7月12日突然宣布xAI正式成立,震撼整個AI業界。圖左為意大利總理佐治亞·梅洛尼(Giorgia Meloni)。(圖片來源:Twitter@GiorgiaMeloni帳戶)

此外,馬斯克又指出,xAI將會跟他旗下其他公司,包括Twitter與Tesla等緊密合作。Twitter本身已是一個蘊藏大量文字、圖像和影片的內容數據庫,而且2023年4月已購買10,000萬顆GPU,對AI模型至關重要的訓練數據與運算力經已齊備。Tesla為研發自動駕駛技術,已累積多年訓練超級電腦叢集的經驗,加上儲存了龐大而高質量的AI數據,對xAI來說更是如虎添翼。

xAI官網上所述的公司目標只有一句話:「了解宇宙的真正本質。」(Understand the true nature of the universe.)(圖片來源:翻攝xAI官網)

相比起OpenAI要想盡辦法解決其訓練數據的版權問題,xAI先天上已沒有此煩惱。由是觀之,Twitter與Tesla為xAI帶來的有利條件,將會成為該公司的獨特競爭優勢。不管怎樣,由馬斯克帶領的xAI進入生成式AI產業後,定必將AI技術競賽推向另一個新高度;尤其是xAI與OpenAI之間如何角力,更是未來關注焦點所在。