Humane Ai Pin｜iPhone殺手來了！AI Pin重新定義AI操作體驗，將是智能手機終結者、還是短命潮流玩意？-方展策

09/02/2024

Humane Ai Pin｜iPhone殺手來了！AI Pin重新定義AI操作體驗，將是智能手機終結者、還是短命潮流玩意？

#Smart Living #AI Pin #時代雜誌 #OpenA #微軟 #Salesforc #AI #iPhone #產品 #潮流玩物 #家電潮物 #智慧生活

　　AI Pin作為一款尚未正式發售的新產品，不但被《時代雜誌》選為「2023年度發明」，還獲OpenAI、微軟、Salesforce等科技巨頭的投資。一個宛如胸針般的小巧裝置，可以串聯AI模型，讓用戶透過語音下達指示，控制撥打電話、搜尋資料、甚至即時翻譯，就像是隨身使用的ChatGPT，更被外界譽為iPhone殺手！究竟AI Pin是足以顛覆智能手機時代的革命性產品，還是曇花一現的潮流玩物？

可以掛在領襟上穿戴式AI裝置

　　AI Pin是一個簡約小巧的穿戴式裝置，體積只有44.5×47.5×14.98毫米，機身重量為34.2克，電池重量則為20.5克，兩者以磁吸方式結合，可以像胸針般掛在領襟上。裝置本身沒有任何按鍵與屏幕，操作全靠語音和手勢，輸出畫面則會投影在用戶手掌上。

　　這款AI裝置自帶手機網絡功能，不像智能手錶般必需搭配手機方可連線上網。機身上方設有1,300萬像素攝影鏡頭，可以拍照錄影和掃描任何事物；裝置配備收音咪，可以接收用戶的語音指示，並內建揚聲器，可以輸出語音回覆和播放音樂。

小巧如胸針的AI Pin，內建高通Snapdragon處理器作AI運算核心，並配備1,300萬像素攝影鏡頭、觸控板、投影器、揚聲器和收音咪。（圖片來源：翻攝Humane官方YouTube 影片）

　　為免裝置被濫用，當AI Pin進行收音或錄影時，機身上方邊緣的「信任指示燈」（Trust Light）會亮出相應的燈號：綠色表示拍攝或錄影中、橙色是收音中、紫色是通話中、白色是啟動掃描功能、彩色則顯示開機狀態，藉此提醒其他人AI Pin處於運作狀態。

畫面投影掌上，全靠手勢操控

　　用戶要喚醒手機的AI助理執行任務時，必須說出特定的喚醒詞，譬如向iPhone說出「Hi Siri」，故此手機需要一直監聽用戶，等待喚醒詞。用戶想喚醒AI Pin，只要輕輕一點機身，即可啟動AI對話功能；換言之，AI Pin無需長時期聆聽環境，減少私隱疑慮。

　　當用戶跟AI Pin對話時，不用叫它先開啟某個App，跟著再執行甚麼功能，因為它根本沒有App！例如用戶想聽歌，可以直接要求AI Pin播放某種風格的音樂；假如選歌不合心意，只要將手掌舉至AI Pin前方，裝置便會在手掌上投影出音樂播放器的資訊介面，手部向左微翻可回放前一首歌曲，向右則可跳至下一首，拇指與食指一揑即可暫停播放。

AI Pin可以將歌曲資訊介面投影到手掌，然後讓用戶透過手勢操控揀選曲目。（圖片來源：Humane官網）

串聯GPT-4模型即時翻譯外語

　　Ai Pin背後的AI系統正是ChatGPT所用的大型語言模型GPT-4，同樣擁有上知天文、下知地理的豐富知識。譬如說，閣下詢問AI Pin：「下一次日蝕在何時發生？在哪裏可以看得最清楚？」它能夠在幾秒內以語音方式向你說出答案。

　　又例如，閣下逛超市時，拿起一個火龍果舉到AI Pin的前方，接著詢問它：「這個生果含有多少糖份？」裝置隨即透過攝影鏡頭辨識生果種類，跟著說出完整答案。倘若有外國遊客以西班牙語向閣下問路，AI Pin能夠自動將對方說話翻譯成英語並說出來；然後你以英語回答對方，裝置又會翻譯成西班牙語，模仿你的聲音說出來。

AI Pin具備電腦視覺技術，可透過攝影鏡頭辨識食物，並判斷其營養成分。（圖片來源：翻攝Humane官方YouTube 影片）

Humane共同創辦人Chaudhri（左）親身落場示範，當同事對他說起西班牙語，AI Pin便會自動之將翻譯成英語並說出來。（圖片來源：翻攝Humane官方YouTube 影片）

公司創辦人是Apple設計總監

　　初創企業Humane於2023年11月9日發表AI Pin，16日在美國接受預購，預計2024年3月開始發貨。裝置本身定價為 699 美元（約5,452港元），每月要支付24美元（約187港元）的Humane訂閱服務費。訂戶可獲得一組新的電話號碼、語音電話和短訊、數據流量、無限次使用GPT-4模型、音樂串流與雲端儲存等服務。

　　AI Pin甫發表，即受到全球科技業者注目，不僅因為它帶來了無屏幕、純對話的創新操作方式，更因為Humane創辦人與公司股東均來頭不少。該公司共同創辦人為伊姆蘭·喬杜里（Imran Chaudhri）與貝瑟尼·邦吉奧諾（Bethany Bongiorno），兩人曾在蘋果（Apple）任職多年，而公司裏逾200名員工中，差不多有一半都是前Apple僱員。

　　喬杜里在 Apple 擔任了21年的設計師，最高職位為設計總監，是第一代iPhone設計的原始團隊成員，以創建iPhone操作介面和互動設計而馳名。其太太邦吉奧諾則在蘋果位居軟件工程總監，負責《iOS》和《macOS》的所有軟件項目管理。

OpenAI奧特曼是公司大股東

　　Humane的最大股東是ChatGPT之父山姆·奧特曼（Sam Altman），而Salesforce執行長馬克·貝尼奧夫（Marc Benioff）亦是另一主要股東。除此以外，該公司的投資者還包括微軟、高通風險投資、Volvo Cars科技基金等機構。2023年3月，Humane總集資額已達2.3億美元（約17.94億港元）。

　　縱然市場認為AI Pin將是科技界的明日之星，甚至被譽為是iPhone殺手，然而產品要邁向普及，前路卻是挑戰重重。首先，AI Pin暫時仍欠缺殺手級應用。根據目前釋出的示範影片，AI Pin能做到的，手機也能做得到，既然如此，用戶只要用回手機就好了，何必花錢、花時間去學習AI Pin操作？如果Humane不能為AI Pin開發出殺手級應用，當新鮮感退卻，消費者可能會完全喪失興趣。

手勢操控難以長時間連續使用

　　其次，AI Pin的亮點之一是將資訊介面投影到手掌上，再藉由手勢操控。此操作方式要維持數分鐘還可以，一旦要連續操作1小時，手部必定痠軟不已。如改用語音操控，當用戶身處噪雜環境時，可能會令語音指示接收不清；若用戶說出的指示內容含有個人私隱，更不想讓旁人聽到對話內容。如此一來，用戶使用語音操控的意願將大幅降低。

　　再者，市場上穿戴式裝置平均售價為399美元，中階智能手機平均售價則為600美元，而AI Pin定價高達699美元，每月還要繳付24美元的AI服務費。由此視之，AI Pin的整體購買成本比用途相近的裝置還要高，惟功能性和便利性卻相差不遠，可能難以引起消費者的購買意慾。

　　在生成式AI熱潮下，AI PC、AI手機、以及AI Pin先後橫空出世，究竟誰可成為主流的AI裝置？這將是2024年科技界的關注焦點，值得大家密切留意。

AI假照片 | 有圖未必有真相？AI生成假圖觸發不實資訊傳播危機，以數碼浮水印作防偽標記是否最佳解決方法？

#創科

#Smart Living

#Google

#AI

#OpenAI

#不實資訊

#假圖片

#假圖

#數碼浮水印

#生成式AI

#智慧生活

　　俗語說：「有圖有真相」，但隨著生成式AI愈來愈流行，用戶可以輕鬆地利用AI工具產製以假亂真的圖片後，此說法已開始站不住腳了！為降低假圖片、假消息等不良資訊的傳播風險，Google、OpenAI等科技巨頭已先後替AI生成內容加入數碼浮水印，幫助用戶確認圖片是否為AI產製。數碼浮水印是甚麼呢？它是否真的可以有效地幫助人們辨識圖片真偽？

建立內容憑證緩解AI假圖亂象

　　2023年3月，網上瘋傳天主教教宗方濟各身穿白色羽絨外套、戴上墨鏡的圖片，讓人誤以為教宗想改變形象，但這其實是網民使用AI製圖工具Midjourney生成的影像，外界稱之為全球首宗大規模AI假消息傳播事件。2024年1月，詐騙集團利用深偽（Deepfake）技術冒充一家跨國企業的財務長，透過視訊會議要求香港員工將錢轉入指定的銀行帳戶，騙取約2億港元（2,600萬美元），這是香港首起深偽詐騙案件。

網民Pablo Xavier利用Midjourney產生教宗方濟各身穿白色羽絨外套的照片，一度在社交媒體上瘋傳。（相片來源：Facebook@Guerrero Art）

　　為遏制上述亂象，AI科技巨頭與影像產業公司遂著手制定內容憑證標準，藉由數碼浮水印技術，在AI生成作品中加入一些人眼不可見的資訊，惟用戶可以透過特殊工具識別該作品是否由AI產製。這種AI內容識別技術可以分為3大陣營，分別為Google的SynthID技術、C2PA聯盟的內容憑證、以及IPTC的中繼資料。

添加SynthID浮水印無損畫質

　　由Google DeepMind開發的SynthID技術，依靠兩個深度學習AI模型來運行：第一個為浮水印產生模型，使用嵌入式浮水印技術，將數碼浮水印直接添加到AI產生的內容，過程中會將浮水印與原始內容對齊，以提高浮水印的不可察覺性；第二個為識別模型，能夠掃描影像或音訊中的浮水印，藉此辨識數碼作品是否由AI生成。

　　添加SynthID浮水印後，影像畫質不會受損。就算影像曾被裁切、加入濾鏡、更改顏色、甚至使用有損壓縮方案來儲存檔案，浮水印依然會存在。目前可被加上SynthID的影像只限由Google製圖工具Imagen所產生的作品，同時該公司亦表示這項技術「並非萬無一失」且「並不完美」。

影像被添加肉眼不可見的SynthID浮水印後，畫質不會受到絲毫損害。（相片來源：Google官方網誌）

即使圖片被加入多重濾鏡，影像中暗藏的SynthID浮水印依然無法去除。（相片來源：Google官方網誌）

點擊CR憑證圖示查看影像來源

　　另一AI內容識別技術是來自C2PA，其全名是「Coalition for Content Provenance and Authenticity」（內容來源和真實性聯盟）。這是由Adobe發起的技術聯盟，成員包括：Nikon、Leica、Microsoft、Intel、ARM等。

　　這個聯盟建立一個名為「內容憑證」（Content cRedentials，CR）的開放性標準，任何廠商均可以遵循標準替圖片、影片或文件檔案嵌入數碼內容標記。當支援CR憑證的網站發現影像中含有憑證標記，即會在影像右上方加入「cr」圖示；用戶點擊圖示，即可以查看影像的來源資訊，確認作品是否由AI產生。

由Adobe Firefly生成的影像作品，右上方均會嵌入「cr」圖示，可供用戶查看影像的來源資訊。（相片來源：Adobe官網）

　　即使刊登圖片的網站不支援CR憑證識別，用戶也可以把圖片拿到C2PA提供的驗證網站進行辨識，讀取內裏的憑證資訊。再者，CR憑證亦會記下影像的編輯歷史，讓用戶可以追蹤圖片的詳細變化記錄。OpenAI表示，2024年初已替AI繪圖工具DALL·E 3加入CR憑證功能，未來更會把這項識別技術整合到影片生成模型Sora。此外，Adobe影像生成模型Firefly產製的作品，也會自動加插入CR憑證。

IPTC中繼資料支援性最為廣泛

　　最後要介紹的是一項較古舊、但支援性卻更廣泛的內容識別技術——IPTC中繼資料（Metadata）。國際新聞及通訊組織IPTC（International Press Telecommunications Council）在1990年訂定一項描述多媒體狀況的資訊標準，裏面定義了照片標題、照片描述、分類標籤、攝影師與版權等資訊欄目。

　　IPTC在影像業界已成為廣泛採用的標準，譬如《Photoshop》就可以直接編輯相片中的IPTC資訊。Google I／O 2023開發者大會上，該公司表示計劃在Google圖片搜尋結果中參考IPTC資料來標記圖片。Midjourney、Stability AI、Shutterstock亦已宣布採用IPTC中繼資料來標記其AI生成內容。

互聯網一切事物不再是眼見為實

　　雖然業界已研發出各種AI識別浮水印，但美國馬利蘭大學計算機科學教授蘇希爾·費茲（Soheil Feizi）卻指出，目前沒有任何一款浮水印是完全可靠的，有心人仍可以想方設法繞過浮水印，這情況就好比資訊安全公司與黑客之間長年累月的網絡攻防戰。

　　此外，當AI生成內容被插入到人類創作的作品中，浮水印應該如何標註將是一大挑戰。假如有人將真實錄製的錄音檔放入經過AI處理的照片或影片上，那麼平台就要弄清楚如何標記那個部分是AI產生的、那個部分是人類製作的，這將是一項非常繁瑣、易犯錯、兼且具爭議性的任務。盡管如此，有浮水印總比沒有好，至少可以讓公眾意識到，在AI時代下網上一切事物不再是眼見為實！

數碼新秩序

Humane Ai Pin｜iPhone殺手來了！AI Pin重新定義AI操作體驗，將是智能手機終結者、還是短命潮流玩意？

AI假照片 | 有圖未必有真相？AI生成假圖觸發不實資訊傳播危機，以數碼浮水印作防偽標記是否最佳解決方法？