AI 創作的雙面刃:Have You Been Trained?

人類是否可能被機器取代,已是工業革命以來的經典辯題。然而,在人工智慧創作蓬勃發展的當今,許多創作者正積極練習與機器共舞,並發現創作過程中,人類的意志仍是箇中基石。

日前討論度最高的案例,便是今年五月在 Discord 走紅的繪圖伺服器 Midjourney AI :只要輸入文字描述就能產圖,風格多樣且易於優化,大幅節省了時間及成本。設計者的功夫,在於找出精準的關鍵字與 AI 對話。(本文的首圖正是使用 Midjourney AI 繪成,猜猜看這張圖使用了哪些關鍵字?答案將在文末揭曉!)

與機器共舞:人人都能玩的 AI 創作

除了 Midjourney AI,橫跨各種媒材的 AI 創作工具也正蓬勃發展。Google 行之有年的 AI experiments 平台上,即彙整一系列寫作、學習、繪圖與音樂製作的專案:其中包括能將 2D 塗鴉建模、偵測人體動作製成動畫的 Scroobly ;讓使用者自由彈奏旋律的開源鋼琴即興軟體 AI Duet。 這些創作工具除了解放技術,也形塑機器與人類協作的溝通型態,以科技加速腦力激盪,讓創作者能專注在細節與創思。

近日,落日飛車也發表了使用 Midjourney AI 算出的專場主視覺。操刀設計的影像創作者林毛,在一篇專訪中形容 AI 為「自我的延伸」、一位能將想法具象化的「靈魂好友」,卻同時提醒,擁有社會訓練與道德圭準的人類,必須小心與這位有問必答的朋友交談。

人類訓練機器,還是反被機器抄襲?

美國音樂人 Holly Herdon 收錄了自己的聲音,發布聲音設計工具 Holly+,開放所有人自由上傳音檔,使用她的聲音合成朗讀及演唱片段。然而 Herdon 是基於 DAO 治理精神,主動開放自己的錄音著作權,相對而言,許多 AI 工具則取用大量網路資料進行訓練,缺乏個人自主同意的過程,埋藏隱私及著作權侵害的諸多隱憂。

Google Imagen 及 Stable Diffusion 等熱門算圖工具,皆取用 LAION 開放資料集訓練 AI。然而 LAION 資料集數十億張圖像收藏中,除了已證實的不當影像,更包含散佈於網路各處的人像照。加上 LAION 僅負責從各網站搜尋圖像、並不擁有資料的著作權,故在缺乏篩選與取用限制的情況下,諸多 AI 算圖工具無法有效管理圖像的使用方法。

更甚者,一篇 VICE 報導更點出了目前開放資料集的肖像權問題:根據 LAION 官方,若資料集的圖片描述中未註明姓名住址,即便出現清晰五官的圖像,也不屬於個人資料。在不清楚圖片具體出處、且難以驗證資料的情況下,許多人即便發現自己的作品與照片被納入 LAION 資料集,卻難以有效撤除。

為在 AI 發展進程中保障著作權,非營利組織 Spawning 開啟了專案 Have I Been Trained? ,輸入姓名關鍵字或以圖片搜尋,即能查看相關影像被納入了哪一個 AI 的訓練資料集,並且透過 “Opt in / Opt out” 功能決定是否要申訴撤除資料。然而 Have I Been Trained? 專案僅能檢查開源的 AI 算圖工具,閉源的 Midjourney AI 及 DALL-E 查證又更加困難。因此除了透過類似專案查看資料庫來源,學者也呼籲 AI 創作工具採用 CreativeML、OpenRAIL-M 授權條款規範資料取用。

(在 Have I Been Trained? 輸入「周杰倫」所配對到的 LAION-5B 資料 )

人類的詮釋與機器的表達相輔相成,我們的判斷將引導 AI 的行為方向,故在探索 AI 應用的同時,創作者仍應主動確認資料來源、遵循使用條款,在技術解放的前提下,維繫包容安全的創作空間。

回到本文首圖的 Midjourney AI 作品,讀者們是否已猜出這張圖片的描述文字呢?答案是—— “Open Culture Foundation, a space corporation located inside a comphor tree in the middle a night jungle, cables spread across the land, creating a cyberpunk atmosphere.” OCF 年度成果報告的主視覺也可以這樣玩!

留言