4/15 UXTW 筆記： AI 生成圖像與視覺創意

Apr.16.2023

謝謝 UXTW 台灣使用者經驗設計協會所舉辦的活動。

本次參加的主題是： AI 生成圖像與視覺創意 - 以 Midjourney 為例，李怡志老師整理相當多的案例，讓我們更加了解圖像藝術的應用。透過實際操作和示範、學習到 Midjourney 不同的技巧，幫助我們提高圖像處理的效率和精準度、創造出更有創意的圖像，也啟發我對圖像藝術的理解和創作能力 ❤️

根據演講內容簡單做一些記錄，撰寫筆記的主要目的是透過整理講者的內容，讓自己重新學習和內化知識。同時、我也希望這些筆記可以幫助到對活動有興趣的朋友、提供一些參考。

如果有理解錯誤的內容需要修正，可以到 FB 私訊跟我說喔！

Midjourney AI 已經停止免費試用，單月訂閱費用為 10 美金
- 也有其他收費方案，如果你目前沒有訂閱 Midjourney，想要體驗 AI 生成圖像，也可以試試看以下服務
  - Playground AI
  - Image Creator

Generative Art

距今有 60 年的歷史
1962 ~ 1965 電腦科學的博士開始研究 Generative Computergraphik
- 在網際網路不是這麼普及的年代，科學家不約而同、在不同地方產出類似的藝術作品
- 在 1964 年，Michael Noll 致敬蒙德里安的作品，創作生成圖像
Generative Art 要當作什麼？是工具或媒材還是 partner?
- 比較像是媒材，因為具有抗性，你叫他做什麼，但不一定會做什麼

美學歷程

Ideation (構思)
- 腦中有一個想法，要做出來
Execution (執行)
- Execution 是 non-designer 所面對的困境
Appreciation (鑑賞)
- 自己覺得好不好不重要，別人認為好才重要
- 設計師因為有設計美學、所以做出來的東西，更容易被大家喜歡

生成藝術結果

修改 prompt 可以大量生成，會產生以下結果
- see you next time
  - 畫出來的東西，連自己都不喜歡
- self expression
  - 自己喜歡，但別人可能不喜歡
- serendipity
  - 產出你想要，社會也喜歡的東西，可以貼到臉書上，朋友也會喜歡
- surprise
  - 產出原本沒想到的結果，prompt 做出來了，大家也喜歡的結果

生成藝術特點

algorithms
- 受到演算法驅動
- 音樂和文字早於圖像
randomness / unpredictable
- 創作者無法預期結果
- randomness
  - 例如：同樣一張圖，生成不同八張圖，裡面做性別置換
evolutional / iterative
- 可以做第二次或第三次的修改
- 每做一個版本，改一個參數，往更理想的方向演進
uncontrollable
chaotic
- 能不能比我原本的想法更遠一點去做創造
- 在更大的範圍內，讓電腦去探索更多的可能性
selection
- 做了這麼多東西，在這個範圍裡面，自己或電腦覺得好的地方挑選起來
curation
- 最後產出最佳結果

技術演變的過程

巫術
- 書寫一開始是巫術
- 蘇格拉底認為書寫會妨礙思想，覺得不寫出來才會記憶
技術
- 書寫漸漸變成技術
- 書寫變成文官的必要條件
藝術
- 現代需要這種技術的人變少了
- 書寫成為個人藝術
電腦字型取代書寫
- 標楷體加粗
- 但字體也成為藝術，可以做成海報等
personal generative art
- 創作是專業的，演化歷程沒有太大的改變，大部分的人是為了錢

Annotation

老師給我們看一張海報，讓我們嘗試使用自然語言去描述型態
- 海報/廣告/食物攝影/紅色背景
- 美式食物/漢堡/牛肉漢堡/麥當勞
運用 Elements & Principles of art 藝術元素與原則，生成各種圖像範例
- 顏色
  - 暖色
  - 寒色
  - 大地色
  - vivid colors
  - vibrant color
  - psychedelic color
  - jewel color
  - pastel colors
- 姿態
  - touching face
- 不容易看到的東西（一個字不會只影響一個層次的表現）
  - 季節會影響背景和人
    - 🌸 春天的東京就有櫻花
    - 🍁 秋天的東京就有楓葉
  - 時間
  - 節日
  - 風格
  - 材料
  - 算圖引擎
- exact instruction
  - 需要給予確切的指示，不然會像 EXACT INSTRUCTIONS CHALLENGE 的影片結果

✨ 推薦這本書：藝術顧問寫給職場工作者的「邏輯式藝術鑑賞法」

用「3P」即人物＋背景＋時代三個角度，概略掌握作品
- 時代
  - 創作年份 1882 年
  - 世紀的時代區分 19 世紀近代
- 人物
  - 愛德華馬內
- 地點
  - 創作地點法國巴黎
  - 收藏地點科陶德美術館
用「作品鑑賞檢核表」深入觀察及盤點，解讀作品各個面相
用「3K」以革新、顧客、競爭與共創三個面向，理解藝術圈的變化
用「A－PEST」從政治、經濟、社會、科技等觀點，綜觀作品全貌

✨ Levels of Prompts

本體論
- 這是什麼
- 如果被拿到藝廊賣掉，會被歸類在哪一個區域？是油畫嗎？海報嗎？
- 『抽象，水彩畫』
認識論
- 這個特色是什麼
- 『可愛的女孩』
方法論
- 如何被產生出來，有更多描述的細節
- 『白紙，渲染』
every keyword is a universe
順序會影響
- 重要的東西放前面
  - shopping cart as segway
  - segway as shopping cart
- 越後面接受力越差

✨ Learn from Prompt

Midjourney gallery
- Midjourney 像社群，可以看到別人畫的東西，也可以看到別人的 Prompt
- 可以透過模仿 Prompt 進一步學習使用 Prompt 的技巧
prompt build
- felt toy, lotus blossom, goddess
- 一組關鍵字，再加上其他關鍵字排列組合
  - product photograph 商業攝影
  - japanese anime style 動漫風
  - cute adorable 可愛風格
關鍵字技巧
- 強固法
  - 為了這個屬性去下一個詞，都不會如願，所以同義詞給兩次三次
  - 把類似的東西都下關鍵字，效果會很好
- 上下法
  - 本來想要畫皮卡丘漢堡，改成皮卡丘作為一種美國食物
  - 於是有了皮卡丘鬆餅、皮卡丘三明治
- 同義法
  - 黑白線稿 = coloring page = black and white line draft
- 明示法
  - leg and foot = full body
- 魔幻法
  - whimsical
  - 隨著不同引擎不同版本有變化
  - ethereal 空靈
  - mininalism 極簡風格
  - 繁複風格

✨ Learning Process

/describe
- 在 Midjourney 輸入 /describe 上傳圖片，就會產生文字，再重新生成
得到四個提示
透過提示產生新圖
請 ChatGPT 幫忙提供 annotations，corpus analysis 語料庫分析，再產生新的 technique prompt

✨ 善用分隔符號

chinese evening dress
chinese:: evening:: dress
chinese2:: evening:: dress5
chinese3:: evening:: dress2

✨ Parameter List

https://docs.midjourney.com/docs/parameter-list
--no
- Life --no future
  - 把 future 過濾掉
- car --no technology
  - 理解成玩具車
--seed
- /imagine prompt celadon owl pitcher --seed 123
  - 使用一樣的 seed 提示，理論上可以完全還原
  - 同樣的 seed 再新增關鍵字，通常都有改變
--chaos
- imagine/ prompt watermelon owl hybrid --c 50
  - --c 1 變化較少
  - --c 50 變化更多
  - --c 100 變化到認不出來
--stylize
- /imagine prompt illustrated figs --s 100
  - --s 0
  - -s 750
  - 數值越大，變化越多
  - 太多會有畫蛇添足感
  - 在一定的範圍，擴大細節的程度
  - 可以用 /seeting 設定
  - 可以用 /prefer suffix 清除
--iw
- /imagine prompt flowers.jpg birthday cake --iw .5
  - 圖片佔的比重，讓生成的圖像偏向圖片提示或文字提示
  - --iw 0.5
  - --iw 1.5
  - 數值越大，圖片提示佔比越重

Ontology

本體字
product photography
woodcut 版畫
浮世繪
editorial cartoon
expression sheet
攝影風格
做成產品/玩具/樂高
tip: subject depicting motive

Imagination

✨ Imagination process

創造力是一個很大的學問
有三個評估標準
- 能不能做出很多不一樣的東西
- 能不能做出很新的東西
  - 這個人這輩子沒做過是新的，很容易達到
  - 對於人類而言，沒做過的東西，所以是新的
- 能不能改進原來的想法
什麼是想像力？
- known concept
  - 已經存在
- combinational
  - 組合起來，沒人這樣組過就是新的
- exploratory
  - 探索，完全沒有人做過，但是合理
- transformational
  - 不合理或者困難的，沒人想到

✨ Improvisational Creativity

通往異次元空間的門口
那個游泳池＋游泳的人
- 貼上游泳池圖片網址 + 文字
我有一個魔術方塊，可不可以創造一個新的
- 3x3 Rubik's cube + steampunk style, metallic, vivid color, volumetric lighting, made out of gears
Destination
- tong lau 唐樓
- beautiful young woman, black hair, gong lau, taiwan street style
- toy design, product photography
Improvement Prompt
- 圖加字
- 兩張圖，例如：愛麗絲與小豬

Ethics and Bias

✨ bias in generative art 生成藝術的偏見

gender
age
body type

例如：實際測試以下關鍵字後，觀察到對應的圖像生成結果，帶有刻板印象

doctor
- 有一點年紀的白人男性
professor
- 全部都是老人
幼稚園老師
- 全部都是女性
engineer
- 都有鬍子
family portrait
- 都是白人，沒有兩個媽媽或兩個爸爸的 family

Generative AI
UXTW
Speech Notes