數碼新秩序

智城物語
09/02/2024

Humane Ai Pin|iPhone殺手來了!AI Pin重新定義AI操作體驗,將是智能手機終結者、還是短命潮流玩意?

#Smart Living #AI Pin #時代雜誌 #OpenA #微軟 #Salesforc #AI #iPhone #產品 #潮流玩物 #家電潮物 #智慧生活

  AI Pin作為一款尚未正式發售的新產品,不但被《時代雜誌》選為「2023年度發明」,還獲OpenAI、微軟、Salesforce等科技巨頭的投資。一個宛如胸針般的小巧裝置,可以串聯AI模型,讓用戶透過語音下達指示,控制撥打電話、搜尋資料、甚至即時翻譯,就像是隨身使用的ChatGPT,更被外界譽為iPhone殺手!究竟AI Pin是足以顛覆智能手機時代的革命性產品,還是曇花一現的潮流玩物?

 

可以掛在領襟上穿戴式AI裝置

 

  AI Pin是一個簡約小巧的穿戴式裝置,體積只有44.5×47.5×14.98毫米,機身重量為34.2克,電池重量則為20.5克,兩者以磁吸方式結合,可以像胸針般掛在領襟上。裝置本身沒有任何按鍵與屏幕,操作全靠語音和手勢,輸出畫面則會投影在用戶手掌上。

 

  這款AI裝置自帶手機網絡功能,不像智能手錶般必需搭配手機方可連線上網。機身上方設有1,300萬像素攝影鏡頭,可以拍照錄影和掃描任何事物;裝置配備收音咪,可以接收用戶的語音指示,並內建揚聲器,可以輸出語音回覆和播放音樂。

 

小巧如胸針的AI Pin,內建高通Snapdragon處理器作AI運算核心,並配備1,300萬像素攝影鏡頭、觸控板、投影器、揚聲器和收音咪。(圖片來源:翻攝Humane官方YouTube 影片)

 

  為免裝置被濫用,當AI Pin進行收音或錄影時,機身上方邊緣的「信任指示燈」(Trust Light)會亮出相應的燈號:綠色表示拍攝或錄影中、橙色是收音中、紫色是通話中、白色是啟動掃描功能、彩色則顯示開機狀態,藉此提醒其他人AI Pin處於運作狀態。

 

畫面投影掌上,全靠手勢操控

 

  用戶要喚醒手機的AI助理執行任務時,必須說出特定的喚醒詞,譬如向iPhone說出「Hi Siri」,故此手機需要一直監聽用戶,等待喚醒詞。用戶想喚醒AI Pin,只要輕輕一點機身,即可啟動AI對話功能;換言之,AI Pin無需長時期聆聽環境,減少私隱疑慮。

 

  當用戶跟AI Pin對話時,不用叫它先開啟某個App,跟著再執行甚麼功能,因為它根本沒有App!例如用戶想聽歌,可以直接要求AI Pin播放某種風格的音樂;假如選歌不合心意,只要將手掌舉至AI Pin前方,裝置便會在手掌上投影出音樂播放器的資訊介面,手部向左微翻可回放前一首歌曲,向右則可跳至下一首,拇指與食指一揑即可暫停播放。

 

AI Pin可以將歌曲資訊介面投影到手掌,然後讓用戶透過手勢操控揀選曲目。(圖片來源:Humane官網)

 

 

串聯GPT-4模型即時翻譯外語

 

  Ai Pin背後的AI系統正是ChatGPT所用的大型語言模型GPT-4,同樣擁有上知天文、下知地理的豐富知識。譬如說,閣下詢問AI Pin:「下一次日蝕在何時發生?在哪裏可以看得最清楚?」它能夠在幾秒內以語音方式向你說出答案。

 

  又例如,閣下逛超市時,拿起一個火龍果舉到AI Pin的前方,接著詢問它:「這個生果含有多少糖份?」裝置隨即透過攝影鏡頭辨識生果種類,跟著說出完整答案。倘若有外國遊客以西班牙語向閣下問路,AI Pin能夠自動將對方說話翻譯成英語並說出來;然後你以英語回答對方,裝置又會翻譯成西班牙語,模仿你的聲音說出來。

 

AI Pin具備電腦視覺技術,可透過攝影鏡頭辨識食物,並判斷其營養成分。(圖片來源:翻攝Humane官方YouTube 影片)

Humane共同創辦人Chaudhri(左)親身落場示範,當同事對他說起西班牙語,AI Pin便會自動之將翻譯成英語並說出來。(圖片來源:翻攝Humane官方YouTube 影片)

 

公司創辦人是Apple設計總監

 

  初創企業Humane於2023年11月9日發表AI Pin,16日在美國接受預購,預計2024年3月開始發貨。裝置本身定價為 699 美元(約5,452港元),每月要支付24美元(約187港元)的Humane訂閱服務費。訂戶可獲得一組新的電話號碼、語音電話和短訊、數據流量、無限次使用GPT-4模型、音樂串流與雲端儲存等服務。

 

  AI Pin甫發表,即受到全球科技業者注目,不僅因為它帶來了無屏幕、純對話的創新操作方式,更因為Humane創辦人與公司股東均來頭不少。該公司共同創辦人為伊姆蘭·喬杜里(Imran Chaudhri)與貝瑟尼·邦吉奧諾(Bethany Bongiorno),兩人曾在蘋果(Apple)任職多年,而公司裏逾200名員工中,差不多有一半都是前Apple僱員。

 

  喬杜里在 Apple 擔任了21年的設計師,最高職位為設計總監,是第一代iPhone設計的原始團隊成員,以創建iPhone操作介面和互動設計而馳名。其太太邦吉奧諾則在蘋果位居軟件工程總監,負責《iOS》和《macOS》的所有軟件項目管理。

 

OpenAI奧特曼是公司大股東

 

  Humane的最大股東是ChatGPT之父山姆·奧特曼(Sam Altman),而Salesforce執行長馬克·貝尼奧夫(Marc Benioff)亦是另一主要股東。除此以外,該公司的投資者還包括微軟、高通風險投資、Volvo Cars科技基金等機構。2023年3月,Humane總集資額已達2.3億美元(約17.94億港元)。

 

  縱然市場認為AI Pin將是科技界的明日之星,甚至被譽為是iPhone殺手,然而產品要邁向普及,前路卻是挑戰重重。首先,AI Pin暫時仍欠缺殺手級應用。根據目前釋出的示範影片,AI Pin能做到的,手機也能做得到,既然如此,用戶只要用回手機就好了,何必花錢、花時間去學習AI Pin操作?如果Humane不能為AI Pin開發出殺手級應用,當新鮮感退卻,消費者可能會完全喪失興趣。

 

手勢操控難以長時間連續使用

 

  其次,AI Pin的亮點之一是將資訊介面投影到手掌上,再藉由手勢操控。此操作方式要維持數分鐘還可以,一旦要連續操作1小時,手部必定痠軟不已。如改用語音操控,當用戶身處噪雜環境時,可能會令語音指示接收不清;若用戶說出的指示內容含有個人私隱,更不想讓旁人聽到對話內容。如此一來,用戶使用語音操控的意願將大幅降低。

 

  再者,市場上穿戴式裝置平均售價為399美元,中階智能手機平均售價則為600美元,而AI Pin定價高達699美元,每月還要繳付24美元的AI服務費。由此視之,AI Pin的整體購買成本比用途相近的裝置還要高,惟功能性和便利性卻相差不遠,可能難以引起消費者的購買意慾。

 

  在生成式AI熱潮下,AI PC、AI手機、以及AI Pin先後橫空出世,究竟誰可成為主流的AI裝置?這將是2024年科技界的關注焦點,值得大家密切留意。

 

13/05/2024

AI假照片 | 有圖未必有真相?AI生成假圖觸發不實資訊傳播危機,以數碼浮水印作防偽標記是否最佳解決方法?

#創科 #Smart Living #Google #AI #OpenAI #不實資訊 #假圖片 #假圖 #數碼浮水印 #生成式AI #智慧生活

  俗語說:「有圖有真相」,但隨著生成式AI愈來愈流行,用戶可以輕鬆地利用AI工具產製以假亂真的圖片後,此說法已開始站不住腳了!為降低假圖片、假消息等不良資訊的傳播風險,Google、OpenAI等科技巨頭已先後替AI生成內容加入數碼浮水印,幫助用戶確認圖片是否為AI產製。數碼浮水印是甚麼呢?它是否真的可以有效地幫助人們辨識圖片真偽?

 

建立內容憑證緩解AI假圖亂象

 

  2023年3月,網上瘋傳天主教教宗方濟各身穿白色羽絨外套、戴上墨鏡的圖片,讓人誤以為教宗想改變形象,但這其實是網民使用AI製圖工具Midjourney生成的影像,外界稱之為全球首宗大規模AI假消息傳播事件。2024年1月,詐騙集團利用深偽(Deepfake)技術冒充一家跨國企業的財務長,透過視訊會議要求香港員工將錢轉入指定的銀行帳戶,騙取約2億港元(2,600萬美元),這是香港首起深偽詐騙案件。

 

網民Pablo Xavier利用Midjourney產生教宗方濟各身穿白色羽絨外套的照片,一度在社交媒體上瘋傳。(相片來源:Facebook@Guerrero Art)

 

  為遏制上述亂象,AI科技巨頭與影像產業公司遂著手制定內容憑證標準,藉由數碼浮水印技術,在AI生成作品中加入一些人眼不可見的資訊,惟用戶可以透過特殊工具識別該作品是否由AI產製。這種AI內容識別技術可以分為3大陣營,分別為Google的SynthID技術、C2PA聯盟的內容憑證、以及IPTC的中繼資料。

 

添加SynthID浮水印無損畫質

 

  由Google DeepMind開發的SynthID技術,依靠兩個深度學習AI模型來運行:第一個為浮水印產生模型,使用嵌入式浮水印技術,將數碼浮水印直接添加到AI產生的內容,過程中會將浮水印與原始內容對齊,以提高浮水印的不可察覺性;第二個為識別模型,能夠掃描影像或音訊中的浮水印,藉此辨識數碼作品是否由AI生成。

 

  添加SynthID浮水印後,影像畫質不會受損。就算影像曾被裁切、加入濾鏡、更改顏色、甚至使用有損壓縮方案來儲存檔案,浮水印依然會存在。目前可被加上SynthID的影像只限由Google製圖工具Imagen所產生的作品,同時該公司亦表示這項技術「並非萬無一失」且「並不完美」。

 

影像被添加肉眼不可見的SynthID浮水印後,畫質不會受到絲毫損害。(相片來源:Google官方網誌)

即使圖片被加入多重濾鏡,影像中暗藏的SynthID浮水印依然無法去除。(相片來源:Google官方網誌)

 

點擊CR憑證圖示查看影像來源

 

  另一AI內容識別技術是來自C2PA,其全名是「Coalition for Content Provenance and Authenticity」(內容來源和真實性聯盟)。這是由Adobe發起的技術聯盟,成員包括:Nikon、Leica、Microsoft、Intel、ARM等。

 

  這個聯盟建立一個名為「內容憑證」(Content cRedentials,CR)的開放性標準,任何廠商均可以遵循標準替圖片、影片或文件檔案嵌入數碼內容標記。當支援CR憑證的網站發現影像中含有憑證標記,即會在影像右上方加入「cr」圖示;用戶點擊圖示,即可以查看影像的來源資訊,確認作品是否由AI產生。

 

由Adobe Firefly生成的影像作品,右上方均會嵌入「cr」圖示,可供用戶查看影像的來源資訊。(相片來源:Adobe官網)

 

  即使刊登圖片的網站不支援CR憑證識別,用戶也可以把圖片拿到C2PA提供的驗證網站進行辨識,讀取內裏的憑證資訊。再者,CR憑證亦會記下影像的編輯歷史,讓用戶可以追蹤圖片的詳細變化記錄。OpenAI表示,2024年初已替AI繪圖工具DALL·E 3加入CR憑證功能,未來更會把這項識別技術整合到影片生成模型Sora。此外,Adobe影像生成模型Firefly產製的作品,也會自動加插入CR憑證。

 

IPTC中繼資料支援性最為廣泛

 

  最後要介紹的是一項較古舊、但支援性卻更廣泛的內容識別技術——IPTC中繼資料(Metadata)。國際新聞及通訊組織IPTC(International Press Telecommunications Council)在1990年訂定一項描述多媒體狀況的資訊標準,裏面定義了照片標題、照片描述、分類標籤、攝影師與版權等資訊欄目。

 

  IPTC在影像業界已成為廣泛採用的標準,譬如《Photoshop》就可以直接編輯相片中的IPTC資訊。Google I/O 2023開發者大會上,該公司表示計劃在Google圖片搜尋結果中參考IPTC資料來標記圖片。Midjourney、Stability AI、Shutterstock亦已宣布採用IPTC中繼資料來標記其AI生成內容。

 

互聯網一切事物不再是眼見為實

 

  雖然業界已研發出各種AI識別浮水印,但美國馬利蘭大學計算機科學教授蘇希爾·費茲(Soheil Feizi)卻指出,目前沒有任何一款浮水印是完全可靠的,有心人仍可以想方設法繞過浮水印,這情況就好比資訊安全公司與黑客之間長年累月的網絡攻防戰。

 

  此外,當AI生成內容被插入到人類創作的作品中,浮水印應該如何標註將是一大挑戰。假如有人將真實錄製的錄音檔放入經過AI處理的照片或影片上,那麼平台就要弄清楚如何標記那個部分是AI產生的、那個部分是人類製作的,這將是一項非常繁瑣、易犯錯、兼且具爭議性的任務。盡管如此,有浮水印總比沒有好,至少可以讓公眾意識到,在AI時代下網上一切事物不再是眼見為實!

 

#食譜 #素食 #數碼營銷 #電影 #移民 #減肥 #創科 #Netflix #外賣 #辦公室貼士 #疫情 #在家運動 #WFH #抗疫不悶 #限聚令 #辦公室求生術
more on etnet.com.hk