4/15 UXTW 筆記: AI 生成圖像與視覺創意
Apr.16.2023
謝謝 UXTW 台灣使用者經驗設計協會所舉辦的活動。
本次參加的主題是: AI 生成圖像與視覺創意 - 以 Midjourney 為例,李怡志老師整理相當多的案例,讓我們更加了解圖像藝術的應用。透過實際操作和示範、學習到 Midjourney 不同的技巧,幫助我們提高圖像處理的效率和精準度、創造出更有創意的圖像,也啟發我對圖像藝術的理解和創作能力 ❤️
根據演講內容簡單做一些記錄,撰寫筆記的主要目的是透過整理講者的內容,讓自己重新學習和內化知識。同時、我也希望這些筆記可以幫助到對活動有興趣的朋友、提供一些參考。
如果有理解錯誤的內容需要修正,可以到 FB 私訊跟我說喔!
- Midjourney AI 已經停止免費試用,單月訂閱費用為 10 美金
- 也有其他 收費方案,如果你目前沒有訂閱 Midjourney,想要體驗 AI 生成圖像,也可以試試看以下服務
Generative Art
- 距今有 60 年 的歷史
- 1962 ~ 1965 電腦科學的博士開始研究 Generative Computergraphik
- 在網際網路不是這麼普及的年代,科學家不約而同、在不同地方產出類似的藝術作品
- 在 1964 年,Michael Noll 致敬蒙德里安的作品,創作生成圖像
- Generative Art 要當作什麼?是工具或媒材還是 partner?
- 比較像是媒材,因為具有抗性,你叫他做什麼,但不一定會做什麼
美學歷程
- Ideation (構思)
- 腦中有一個想法,要做出來
- Execution (執行)
- Execution 是 non-designer 所面對的困境
- Appreciation (鑑賞)
- 自己覺得好不好不重要,別人認為好才重要
- 設計師因為有設計美學、所以做出來的東西,更容易被大家喜歡
生成藝術結果
- 修改 prompt 可以大量生成,會產生以下結果
- see you next time
- 畫出來的東西,連自己都不喜歡
- self expression
- 自己喜歡,但別人可能不喜歡
- serendipity
- 產出你想要,社會也喜歡的東西,可以貼到臉書上,朋友也會喜歡
- surprise
- 產出原本沒想到的結果,prompt 做出來了,大家也喜歡的結果
- see you next time
生成藝術特點
- algorithms
- 受到演算法驅動
- 音樂和文字早於圖像
- randomness / unpredictable
- 創作者無法預期結果
- randomness
- 例如:同樣一張圖,生成不同八張圖,裡面做性別置換
- evolutional / iterative
- 可以做第二次或第三次的修改
- 每做一個版本,改一個參數,往更理想的方向演進
- uncontrollable
- chaotic
- 能不能比我原本的想法更遠一點去做創造
- 在更大的範圍內,讓電腦去探索更多的可能性
- selection
- 做了這麼多東西,在這個範圍裡面,自己或電腦覺得好的地方挑選起來
- curation
- 最後產出最佳結果
技術演變的過程
- 巫術
- 書寫一開始是巫術
- 蘇格拉底認為書寫會妨礙思想,覺得不寫出來才會記憶
- 技術
- 書寫漸漸變成技術
- 書寫變成文官的必要條件
- 藝術
- 現代需要這種技術的人變少了
- 書寫成為個人藝術
- 電腦字型取代書寫
- 標楷體加粗
- 但字體也成為藝術,可以做成海報等
- personal generative art
- 創作是專業的,演化歷程沒有太大的改變,大部分的人是為了錢
Annotation
- 老師給我們看一張海報,讓我們嘗試使用自然語言去描述型態
- 海報/廣告/食物攝影/紅色背景
- 美式食物/漢堡/牛肉漢堡/麥當勞
- 運用 Elements & Principles of art 藝術元素與原則,生成各種圖像範例
- 顏色
- 暖色
- 寒色
- 大地色
- vivid colors
- vibrant color
- psychedelic color
- jewel color
- pastel colors
- 姿態
- touching face
- 不容易看到的東西(一個字不會只影響一個層次的表現)
- 季節會影響背景和人
- 🌸 春天的東京就有櫻花
- 🍁 秋天的東京就有楓葉
- 時間
- 節日
- 風格
- 材料
- 算圖引擎
- 季節會影響背景和人
- exact instruction
- 需要給予確切的指示,不然會像 EXACT INSTRUCTIONS CHALLENGE 的影片結果
- 顏色
✨ 推薦這本書:藝術顧問寫給職場工作者的「邏輯式藝術鑑賞法」
- 用「3P」即人物+背景+時代三個角度,概略掌握作品
- 時代
- 創作年份 1882 年
- 世紀的時代區分 19 世紀近代
- 人物
- 愛德華馬內
- 地點
- 創作地點 法國巴黎
- 收藏地點 科陶德美術館
- 時代
- 用「作品鑑賞檢核表」深入觀察及盤點,解讀作品各個面相
- 用「3K」以革新、顧客、競爭與共創三個面向,理解藝術圈的變化
- 用「A-PEST」從政治、經濟、社會、科技等觀點,綜觀作品全貌
✨ Levels of Prompts
- 本體論
- 這是什麼
- 如果被拿到藝廊賣掉,會被歸類在哪一個區域?是油畫嗎?海報嗎?
- 『抽象,水彩畫』
- 認識論
- 這個特色是什麼
- 『可愛的女孩』
- 方法論
- 如何被產生出來,有更多描述的細節
- 『白紙,渲染』
- every keyword is a universe
- 順序會影響
- 重要的東西放前面
- shopping cart as segway
- segway as shopping cart
- 越後面接受力越差
- 重要的東西放前面
✨ Learn from Prompt
- Midjourney gallery
- Midjourney 像社群,可以看到別人畫的東西,也可以看到別人的 Prompt
- 可以透過模仿 Prompt 進一步學習使用 Prompt 的技巧
- prompt build
- felt toy, lotus blossom, goddess
- 一組關鍵字,再加上其他關鍵字排列組合
- product photograph 商業攝影
- japanese anime style 動漫風
- cute adorable 可愛風格
- 關鍵字技巧
- 強固法
- 為了這個屬性去下一個詞,都不會如願,所以同義詞給兩次三次
- 把類似的東西都下關鍵字,效果會很好
- 上下法
- 本來想要畫皮卡丘漢堡,改成皮卡丘作為一種美國食物
- 於是有了皮卡丘鬆餅、皮卡丘三明治
- 同義法
- 黑白線稿 = coloring page = black and white line draft
- 明示法
- leg and foot = full body
- 魔幻法
- whimsical
- 隨著不同引擎不同版本有變化
- ethereal 空靈
- mininalism 極簡風格
- 繁複風格
- 強固法
✨ Learning Process
/describe
- 在 Midjourney 輸入
/describe
上傳圖片,就會產生文字,再重新生成
- 在 Midjourney 輸入
- 得到四個提示
- 透過提示產生新圖
- 請 ChatGPT 幫忙提供 annotations,corpus analysis 語料庫分析,再產生新的 technique prompt
✨ 善用分隔符號
- chinese evening dress
chinese:: evening:: dress
chinese2:: evening:: dress5
chinese3:: evening:: dress2
✨ Parameter List
- https://docs.midjourney.com/docs/parameter-list
- --no
Life --no future
- 把 future 過濾掉
car --no technology
- 理解成玩具車
- --seed
/imagine prompt
celadon owl pitcher --seed 123
- 使用一樣的 seed 提示,理論上可以完全還原
- 同樣的 seed 再新增關鍵字,通常都有改變
- --chaos
imagine/ prompt
watermelon owl hybrid --c 50
- --c 1 變化較少
- --c 50 變化更多
- --c 100 變化到認不出來
- --stylize
/imagine prompt
illustrated figs --s 100
- --s 0
- -s 750
- 數值越大,變化越多
- 太多會有畫蛇添足感
- 在一定的範圍,擴大細節的程度
- 可以用 /seeting 設定
- 可以用 /prefer suffix 清除
- --iw
/imagine prompt
flowers.jpg birthday cake --iw .5
- 圖片佔的比重,讓生成的圖像偏向圖片提示或文字提示
- --iw 0.5
- --iw 1.5
- 數值越大,圖片提示佔比越重
Ontology
- 本體字
- product photography
- woodcut 版畫
- 浮世繪
- editorial cartoon
- expression sheet
- 攝影風格
- 做成產品/玩具/樂高
- tip: subject depicting motive
Imagination
✨ Imagination process
- 創造力是一個很大的學問
- 有三個評估標準
- 能不能做出很多不一樣的東西
- 能不能做出很新的東西
- 這個人這輩子沒做過是新的,很容易達到
- 對於人類而言,沒做過的東西,所以是新的
- 能不能改進原來的想法
- 什麼是想像力?
- known concept
- 已經存在
- combinational
- 組合起來,沒人這樣組過就是新的
- exploratory
- 探索,完全沒有人做過,但是合理
- transformational
- 不合理或者困難的,沒人想到
- known concept
✨ Improvisational Creativity
- 通往異次元空間的門口
- 那個游泳池+游泳的人
- 貼上游泳池圖片網址 + 文字
- 我有一個魔術方塊,可不可以創造一個新的
- 3x3 Rubik's cube + steampunk style, metallic, vivid color, volumetric lighting, made out of gears
- Destination
- tong lau 唐樓
- beautiful young woman, black hair, gong lau, taiwan street style
- toy design, product photography
- Improvement Prompt
- 圖加字
- 兩張圖,例如:愛麗絲與小豬
Ethics and Bias
✨ bias in generative art 生成藝術的偏見
- gender
- age
- body type
例如:實際測試以下關鍵字後,觀察到對應的圖像生成結果,帶有刻板印象
- doctor
- 有一點年紀的白人男性
- professor
- 全部都是老人
- 幼稚園老師
- 全部都是女性
- engineer
- 都有鬍子
- family portrait
- 都是白人,沒有兩個媽媽或兩個爸爸的 family
- Generative AI
- UXTW
- Speech Notes