AI再進化！GPT-4智商更勝ChatGPT！輸入圖片即可生成內容，律師資格考試擊敗9成考生！-方展策

20/03/2023

AI再進化！GPT-4智商更勝ChatGPT！輸入圖片即可生成內容，律師資格考試擊敗9成考生！

#Smart Living #AI #GPT-4 #ChatGPT #OpenAI #聊天機械人 #推理能力 #律師資格考試 #MMLU #Sam Altman

　　背靠GPT-3.5大型語言模型的ChatGPT，2022年11月底面世後有如一石激起千層浪，令生成式AI熱潮席捲全球。想不到短短4個月後，AI研究實驗室OpenAI便釋出第四代模型「GPT-4」，技術上進一步拋離其他大型語言模型。微軟亦隨即宣布，Bing搜尋引擎已同步採用GPT-4，讓Google在AI搜尋賽道上瞠乎其後。到底GPT-4比起GPT-3.5有何改進之處？功能更強大的GPT-4又是否一個已臻完美的AI模型呢？

第一代GPT模型2018年誕生

　　ChatGPT名字中的「GPT」，是「Generative Pre-trained Transformer」的縮寫，中譯為「生成式預訓練變換模型」。這是由Google Brain研發出來的深度學習模型架構，專用來處理自然語言；OpenAI正以此為基礎，創造了GPT模型，迄今已經歷四代演進。

　　第一代GPT模型於2018年6月橫空降世，能夠判斷兩個句子之間的語意和關係、對文本資料進行分類、並能夠解答一般常識和推理問題，但當時模型接受訓練的數據參數僅有1.17億項，相對較少，所以不算是好的對話式AI模型。

　　第二代GPT-2模型是基於初代模型直接擴展而成，可說是GPT-1的加強版。它在2019年2月發表，被定位為「通用型AI」，不針對單一知識領域進行專門訓練，而是學習各式各樣的常識，訓練參數達到15億項，是上一代的10倍以上。GPT-2已能夠回答問題、翻譯文字，並生成文本輸出。它輸出的文字開始近似人類語氣，惟生成較長段落時卻可能出現重複或無意義的內容。

GPT-3.5搭ChatGPT掀熱潮

　　來到第三代的GPT-3，訓練參數較GPT-2暴增117倍，超過1750億項，技術上也有飛躍進步，2020年６月釋出給開發者試用。它能夠辨識資料中隱藏的含義，並運用從數據訓練中獲得的知識來執行任務；換言之，就算要處理從未接觸過的事物，它也能夠理解並作出適當的回應。

　　GPT模型發展至第三代，終於展現出商業應用上的實用性。可是，2020年正值新冠疫情高峰期，此AI技術突破並沒有引起社會的太大關注。再者，GPT-3不像ChatGPT般能夠輸出自然對話，所以只有部分開發者和廠商對它感興趣。同年9月，微軟（Microsoft）宣布取得GPT-3的獨家授權。

　　2022年11月底，OpenAI發表GPT-3的優化版本「GPT-3.5」，並搭配聊天機械人「ChatGPT」一併推出，憑著其接近人類對話與思考方式的特點，瞬即吸引全球目光，掀起生成式AI熱潮。GPT-3與GPT-3.5的主要分別在於，前者只是蒐集和使用互聯網上的資料進行訓練，後者則會利用人類的回應和反饋，執行強化學習來自我訓練。

GPT-4可處理2.5萬字長內容

　　距離ChatGPT爆紅還不到4個月的時間，Open AI於2023年3月14日突然發布更具突破性的GPT-4，開放給ChatGPT Plus付費訂戶和軟件開發者使用。OpenAI沒有披露GPT-4模型受訓參數的數量，只表示2022年8月已經完成訓練，之後便不斷進行微調改進，務求令其數據處理與理解能力大幅提升。

　　GPT-4能夠處理多達25,000字的內容，足足是GPT-3.5+ChatGPT的8倍以上。它容許用戶輸入更長內容，進行長篇文章翻譯或編寫摘要。更重要的是，這樣意味著GPT-4擁有更強的記憶力。

GPT-4最實用的改進之處是，把文字輸入限制提高至2.5萬字，所以能夠理解更長的上下文，作出更準確的回應。（圖片來源：翻攝OpenAI官方YouTube影片）

　　其實，ChatGPT有時表現不佳的主要原因是，用戶最初提出的訴求，在一定長度的談話後，便會被後來的對話內容所覆蓋，讓AI無法把握完整的上下文來作出分析，致使回覆偏離討論主題。因此，當GPT-4能夠記住25,000字的內容，AI就能夠長時間監看與用戶的對話內容，給出更精確的答案。

GPT-4能解讀圖像再作出回覆

　　更教人驚喜的是，GPT-4已升級為多模態（Multimodal）的AI模型，同時支援圖像與文字輸入來生成內容，打破ChatGPT只能鍵入文本提示的限制。它能夠在理解圖像內容後，給予用戶建議，達到「看圖說故事」的效果。

用戶可以向GPT-4輸入圖片，要求回應。例如以下圖片顯示了雞蛋、麵粉、牛奶等食材，它在分析圖片後，便會告訴用戶利用這些食材可以製作甚麼甜品。（圖片來源：OpenAI官網）

GPT-4被問到假如剪掉以下圖片中的繩子，將會發生甚麼事？它懂得回答圖中的氣球將會飛走。由此可見，GPT-4在理解圖片內容後，已能作出邏輯推理。（圖片來源：翻攝OpenAI官方YouTube影片）

　　在GPT-4上輸入的圖像可以是相片、圖表、屏幕截圖、甚至是手繪草圖。OpenAI共同創辦人格雷格．布羅克曼（Greg Brockman）在GPT-4的直播演示中，拍攝其筆記簿上一幅手繪的網頁設計草圖，然後上傳至GPT-4，AI隨即生成對應的網頁程式碼。他認為，這將會大幅改變網站設計模式。

OpenAI共同創辦人Greg Brockman輸入一張手繪的網站設計草圖，GPT-4即能自動生成網頁程式碼，網站介面布局幾乎跟手繪草圖一模一樣。（圖片來源：翻攝OpenAI官方YouTube影片）

　　此外，GPT-4甚至連迷因惡搞圖也能夠解讀。例如，一幅來自Reddit討論區的惡搞圖，顯示iPhone插著VGA連接器，GPT-4能夠辨識並描述圖片的幽默之處：將舊款VGA連接器插進新型智能手機是很滑稽的。目前GPT-4圖像輸入功能仍處於開發者預覽版本，暫不對外開放，OpenAI未有透露開放時間表。

GPT-4能夠解讀以下惡搞圖的內容，準確地指出過時的VGA連接器插入新型智能手機的充電端口，是滑稽之舉。（圖片來源：OpenAI官網）

GPT-4律師資格考試名列前茅

　　除超凡的理解能力外，GPT-4更擁有優秀的推理能力。OpenAI聲稱，GPT-4在很多專業考試的表現已直逼「人類水平」（Human-level Performance）。為求證明此事，OpenAI安排GPT-4參加多項人類考試，包括律師資格考試（Bar examination）、美國大學入學的SAT測驗、以及國際生物奧林匹克（International Biology Olympiad）等，結果統統交出驕人的成績單。

　　OpenAI表示，GPT-4在律師資格考試中的答題表現位列前10%，即是可以勝過90%的考生；GPT-3.5的成績則落在後10%。GPT-4在SAT閱讀考試中成績位居前7%，在SAT數學考試中則排名前11%。至於在生物奧林匹亞競賽中，GPT-4的成績排名更高踞前1%，擊敗99%的參與者。

　　為測試GPT-4的語言水平，OpenAI利用Azure Translate把評核AI理解能力的「MMLU」基準測試繙譯成不同語言，讓GPT-4作答。結果發現，GPT-4英文答題的正確率高達80.5%，中文答題正確率亦達到80.1%，日語和韓語答題正確率則為70%至80％，可見GPT-4展現出極高的多國語言能力。

MMLU（Multi-task Language Understanding）基準考試包含14,000條試題，涵蓋 STEM、人文、社會科學等57個學科。結果GPT-4幾乎以10%以上差距擊敗其他大型語言模型，包括Google旗下的PaLM。（圖片來源：OpenAI官網）

GPT-4仍有幻覺，不完全可靠

　　縱然GPT-4在技術上已有長足進步，但OpenAI執行長山姆．奧特曼（Sam Altman）卻坦承，「它仍然是有缺陷的。」GPT-4依舊有GPT-3.5的「幻覺」（Hallucination）問題，有時會捏造資訊，生成與事實不符的回覆；即使有用戶指出其答案出錯，GPT-4會傾向堅持自己是對的。

在SAT、GRE、AP等公開考試中，GPT-4大部分的成績（綠色部分）均優於GPT-3.5（藍色部分）。（圖片來源：OpenAI官網）

　　不過，OpenAI強調，他們額外花了6個月時間來調整模型，並在數據訓練過程中納入更多人工回饋訓練，以減輕GPT-4的幻覺問題。在OpenAI的對抗性測試評估中，GPT-4陳述事實回應（Factual Responses）的可能性提高40%，回答不允許內容請求的可能性則降低82%。因此，GPT-4比起GPT-3.5算是較為可靠，但OpenAI仍警告不宜盡信GPT-4給出的答案。

　　GPT-4的另一缺憾是，其受訓數據也像GPT-3.5般只更新至2021年，對於這個時間點以後的事情，它就無法作出回應。幸好，OpenAI發表GPT-4後不久，微軟便宣布Bing AI搜尋引擎已同步升級使用GPT-4模型。大家只要透過Bing向GPT-4提問，它也能夠回答2022年或以後發生的事情。

AI市場規模超過3000億美元

　　OpenAI在短時間內推出功能更強大的GPT-4模型，代表著其開發團隊正以極高速度引領AI技術變革，迫使Google等競爭對手要投放更多資源來奮起直追。這樣有助加快AI的研發進程，並造就市場百花齊放的局面，實現AI全面普及。

現有ChatGPT用戶如想體驗GPT-4的強大功能，只要升級為ChatGPT Plus訂戶，乖乖付上20美元（約156港元）的月費便可以了。（圖片來源：OpenAI官網）

　　根據OpenAI提供的資料，美國投行摩根士丹利（Morgan Stanley）現已運用GPT-4來整理金融數據，電子支付方案商Stripe亦嘗試用GPT-4協助打擊詐騙；同時，網上教育機構可汗學院（Khan Academy）、網上語言學習平台Duolingo、以及冰島政府也有使用GPT-4 來輔助營運。由此可見，生成式AI已開始在企業和政府逐步落地應用。

投資顧問經常要瀏覽大量金融資料，以回覆客戶提問，但這樣做卻相當費時失事。因此，摩根士丹利現正探索如何利用GPT-4來整理金融資料，以提高分析效率。（圖片來源：OpenAI官網）

　　國際市調機構IDC分析指，引進AI速度較慢的企業，無可避免地會落後於競爭對手。IDC預估，2023年全球對AI系統的支出將增加27%，達至1540億美元（約1.2兆港元）；之後每年增長率將維持27%，及至2026年總支出可望超過3000億美元（約2.3兆港元）。

26/04/2024

AI人工智能 | 不用點擊連結爬文！AI搜尋引擎Perplexity直接給你答案！Google Search霸主地位岌岌可危？

#Smart Living #Perplexity #Google搜尋引擎 #AI #ChatGPT #互聯網 #生成式AI #Jeff Bezos #黃仁勳 #智慧生活 #Google Search ##Smart Living

　　生成式AI熱潮席捲全球，各式各樣的AI工具如雨後春筍般湧現，要數對Google搜尋引擎構成最大威脅者，可能不是名滿天下的ChatGPT，而是寂寂無名的Perplexity。其優勢是即時從互聯網篩選資料，再經AI整合成完整答案回覆用戶，而不是提供網站連結讓用戶自行查詢，完全顛覆過去20年的搜尋體驗，吸引黃仁勳、Jeff Bezos等科技界大佬爭相投資。究竟Perplexity是否有足夠實力取代Google Search，躍居為新一代的搜尋霸主呢？

搜尋結果直接提供文本答案

　　Perplexity成立於2022年8月，隨後推出同名產品「Perplexity」解答引擎。其創辦人阿拉文德·斯里尼瓦斯（Aravind Srinivas）曾先後任職於DeepMind、Google Brain、以及OpenAI。他希望透過大型語言模型，打破過去逾20年由Google壟斷的關鍵字搜尋模式，讓用戶直接提問就能獲取準確、可信賴的答案。

　　AI搜尋引擎Perplexity與Google Search的主要分野，在於呈現答案的方式。閣下在Google上輸入關鍵字進行搜尋，系統只會給出一排排的藍色連結，你要點開多條連結，查閱多個網頁，方能拼湊出你想找尋的答案。

　　來到Perplexity，閣下輸入的不再是一組關鍵字，而是一條問題。系統先會理解和重新建構這條問題，然後即時從互聯網索引提取相關連結。跟著系統會要求大型語言模型閱讀這些連結，再從每條連結提取相關資訊來整合內容，最終建構出完整的文本答案。

Perplexity的回覆內容分為上、中、下3個部分：上方列出資料來源的連結，中間提供一個總結式的答案，下方顯示你可能感興趣的相關問題。（圖片來源：翻攝Perplexity官網）

附資料來源連結、相關問題

　　答案上方附有資料來源的連結，閣下可以點選這些連結，進一步探究答案的內容細節；答案下方則提供你可能感興趣的相關問題，閣下可以點選這些問題繼續追問。如果閣下沒興趣溯源或追問，問答就到此為止。

　　這種直接給出答案的搜尋引擎，贏得不少網民擁戴，當中更包括前GitHub執行長納特·弗里德曼（Nat Friedman）、以及輝達（NVIDIA）執行長黃仁勳。弗里德曼與NVIDIA現已成為Perplexity的投資者，同時亞馬遜（Amazon）創辦人傑夫·貝佐斯（Jeff Bezos）、知名億萬富翁史丹利·德魯肯米勒（Stanley Druckenmiller）亦已加入投資行列。

黃仁勳（左）表示，很喜歡斯里尼瓦斯（右）所研發的Perplexity，幾乎每天都在使用。（圖片來源：X.com@AravSrinivas）

　　2024年4月，Perplexity宣布成功獲得6,270萬美元（約4.89億港元）的融資，累計募資額已達到1.65億美元（約12.87億港元），令公司估值攀升至10億美元（約78億港元）以上，成為初創「獨角獸」。目前Perplexity每個月處理的搜尋次數高達1.69億次，月均活躍用戶數已達1,000萬人。

擬相關問題旁插入廣告圖利

　　Google的主要收入來自搜尋廣告，Perplexity對這塊大餅當然感興趣，現正準備在自家平台上賣廣告。Perplexity在提供答案之餘，也會列出用戶可能感興趣的相關問題，引導用戶作進一步的知識探索；「相關問題」所衍生的查詢量，約佔平台總查詢量4成，可說是非常受歡迎的功能。

　　如今Perplexity有意在「相關問題」旁邊加入廣告商贊助的問題，用戶點選問題後會繼續顯示相關廣告連結。此做法跟Google在搜尋結果上方插入搜尋廣告非常相似。該公司表示，這項廣告功能將在未來幾季推出，惟未有披露更多細節。

　　儘管Perplexity看似形勢大好，但以往曾有多家公司試圖挑戰Google 搜尋霸主的地位，卻始終未能成功。究其原委，Google的競爭優勢在於，全球大部分網民已被吸進Google的生態圈內——大家瀏覽網頁用Chrome瀏覽器、收發電郵用Gmail、尋路前往目的地用Google Maps……我們的日常生活幾乎已離不開Google，因此亦很難完全擺脫Google Search。

為求增加收入來源，Perplexity宣布推出企業版方案「Perplexity Enterprise Pro」，向企業客戶提供更安全、可控的AI搜尋引擎。（圖片來源：翻攝Perplexity官網）

Google藉生態圈隔絕對手

　　更何況，Google生態圈內已有足以跟Perplexity、甚至ChatGPT匹敵的AI工具Gemini。日後Google可以輕鬆地將Gemini融入到旗下其他產品，為用戶提供無縫接軌的體驗。例如用戶詢問Gemini怎樣前往某個地方，它可以把用戶連結到Google Maps，在地圖上顯示行走路徑。如此看來，即使Perplexity可以提供更直接、方便的搜尋體驗，也未必能夠抗衡整個Google家族。

　　不過，Google搜尋部門負責人普拉巴卡爾·拉格萬（Prabhakar Raghavan）在2024年3月的內部會議上提醒員工，搜尋引擎市場已不像15至20年前那樣，「生活不會永遠一帆風順」，故此Google必須像運動員般作出迅速反應，以應對不同的市場變化。他特地讚揚Gemini研發團隊，將每週工時從100小時增加到120小時，結果只花了短短10天就解決80%影像辨識問題。

　　由此可見，面對AI初創群雄並起的變局，Google絕不敢掉以輕心，所以積極提高內部危機意識，並高度重視AI模型研發，幫助公司走得更遠。另一邊廂，在高昂研發成本和投資者的壓力下，Perplexity要想盡辦法開拓收入來源，務求繼續活下去，才有機會可以挑戰Google。

延伸閱讀：

微軟100億重押OpenAI！Bing整合ChatGPT強化搜尋能力，劍指Google龍頭位置！

Apple自建搜尋引擎？傳蘋果開發「Pegasus」挑戰Google Search，搶攻百億搜尋廣告市場！

Google最強AI模型來襲！Gemini搶攻企業、消費者、手機3大領域，建立完整AI生態圈碾壓ChatGPT！

數碼新秩序

AI再進化！GPT-4智商更勝ChatGPT！輸入圖片即可生成內容，律師資格考試擊敗9成考生！

AI人工智能 | 不用點擊連結爬文！AI搜尋引擎Perplexity直接給你答案！Google Search霸主地位岌岌可危？