4/15 UXTW 筆記: AI 生成圖像與視覺創意

Apr.16.2023

謝謝 UXTW 台灣使用者經驗設計協會所舉辦的活動。

本次參加的主題是: AI 生成圖像與視覺創意 - 以 Midjourney 為例,李怡志老師整理相當多的案例,讓我們更加了解圖像藝術的應用。透過實際操作和示範、學習到 Midjourney 不同的技巧,幫助我們提高圖像處理的效率和精準度、創造出更有創意的圖像,也啟發我對圖像藝術的理解和創作能力 ❤️

根據演講內容簡單做一些記錄,撰寫筆記的主要目的是透過整理講者的內容,讓自己重新學習和內化知識。同時、我也希望這些筆記可以幫助到對活動有興趣的朋友、提供一些參考。

如果有理解錯誤的內容需要修正,可以到 FB 私訊跟我說喔!


  • Midjourney AI 已經停止免費試用,單月訂閱費用為 10 美金

Generative Art

  • 距今有 60 年 的歷史
  • 1962 ~ 1965 電腦科學的博士開始研究 Generative Computergraphik
    • 在網際網路不是這麼普及的年代,科學家不約而同、在不同地方產出類似的藝術作品
    • 在 1964 年,Michael Noll 致敬蒙德里安的作品,創作生成圖像
  • Generative Art 要當作什麼?是工具或媒材還是 partner?
    • 比較像是媒材,因為具有抗性,你叫他做什麼,但不一定會做什麼

美學歷程

  • Ideation (構思)
    • 腦中有一個想法,要做出來
  • Execution (執行)
    • Execution 是 non-designer 所面對的困境
  • Appreciation (鑑賞)
    • 自己覺得好不好不重要,別人認為好才重要
    • 設計師因為有設計美學、所以做出來的東西,更容易被大家喜歡

生成藝術結果

  • 修改 prompt 可以大量生成,會產生以下結果
    • see you next time
      • 畫出來的東西,連自己都不喜歡
    • self expression
      • 自己喜歡,但別人可能不喜歡
    • serendipity
      • 產出你想要,社會也喜歡的東西,可以貼到臉書上,朋友也會喜歡
    • surprise
      • 產出原本沒想到的結果,prompt 做出來了,大家也喜歡的結果

生成藝術特點

  • algorithms
    • 受到演算法驅動
    • 音樂和文字早於圖像
  • randomness / unpredictable
    • 創作者無法預期結果
    • randomness
      • 例如:同樣一張圖,生成不同八張圖,裡面做性別置換
  • evolutional / iterative
    • 可以做第二次或第三次的修改
    • 每做一個版本,改一個參數,往更理想的方向演進
  • uncontrollable
  • chaotic
    • 能不能比我原本的想法更遠一點去做創造
    • 在更大的範圍內,讓電腦去探索更多的可能性
  • selection
    • 做了這麼多東西,在這個範圍裡面,自己或電腦覺得好的地方挑選起來
  • curation
    • 最後產出最佳結果

技術演變的過程

  • 巫術
    • 書寫一開始是巫術
    • 蘇格拉底認為書寫會妨礙思想,覺得不寫出來才會記憶
  • 技術
    • 書寫漸漸變成技術
    • 書寫變成文官的必要條件
  • 藝術
    • 現代需要這種技術的人變少了
    • 書寫成為個人藝術
  • 電腦字型取代書寫
    • 標楷體加粗
    • 但字體也成為藝術,可以做成海報等
  • personal generative art
    • 創作是專業的,演化歷程沒有太大的改變,大部分的人是為了錢

Annotation

  • 老師給我們看一張海報,讓我們嘗試使用自然語言去描述型態
    • 海報/廣告/食物攝影/紅色背景
    • 美式食物/漢堡/牛肉漢堡/麥當勞
  • 運用 Elements & Principles of art 藝術元素與原則,生成各種圖像範例
    • 顏色
      • 暖色
      • 寒色
      • 大地色
      • vivid colors
      • vibrant color
      • psychedelic color
      • jewel color
      • pastel colors
    • 姿態
      • touching face
    • 不容易看到的東西(一個字不會只影響一個層次的表現)
      • 季節會影響背景和人
        • 🌸 春天的東京就有櫻花
        • 🍁 秋天的東京就有楓葉
      • 時間
      • 節日
      • 風格
      • 材料
      • 算圖引擎
    • exact instruction

✨ 推薦這本書:藝術顧問寫給職場工作者的「邏輯式藝術鑑賞法」

  • 用「3P」即人物+背景+時代三個角度,概略掌握作品
    • 時代
      • 創作年份 1882 年
      • 世紀的時代區分 19 世紀近代
    • 人物
      • 愛德華馬內
    • 地點
      • 創作地點 法國巴黎
      • 收藏地點 科陶德美術館
  • 用「作品鑑賞檢核表」深入觀察及盤點,解讀作品各個面相
  • 用「3K」以革新、顧客、競爭與共創三個面向,理解藝術圈的變化
  • 用「A-PEST」從政治、經濟、社會、科技等觀點,綜觀作品全貌

✨ Levels of Prompts

  • 本體論
    • 這是什麼
    • 如果被拿到藝廊賣掉,會被歸類在哪一個區域?是油畫嗎?海報嗎?
    • 『抽象,水彩畫』
  • 認識論
    • 這個特色是什麼
    • 『可愛的女孩』
  • 方法論
    • 如何被產生出來,有更多描述的細節
    • 『白紙,渲染』
  • every keyword is a universe
  • 順序會影響
    • 重要的東西放前面
      • shopping cart as segway
      • segway as shopping cart
    • 越後面接受力越差

✨ Learn from Prompt

  • Midjourney gallery
    • Midjourney 像社群,可以看到別人畫的東西,也可以看到別人的 Prompt
    • 可以透過模仿 Prompt 進一步學習使用 Prompt 的技巧
  • prompt build
    • felt toy, lotus blossom, goddess
    • 一組關鍵字,再加上其他關鍵字排列組合
      • product photograph 商業攝影
      • japanese anime style 動漫風
      • cute adorable 可愛風格
  • 關鍵字技巧
    • 強固法
      • 為了這個屬性去下一個詞,都不會如願,所以同義詞給兩次三次
      • 把類似的東西都下關鍵字,效果會很好
    • 上下法
      • 本來想要畫皮卡丘漢堡,改成皮卡丘作為一種美國食物
      • 於是有了皮卡丘鬆餅、皮卡丘三明治
    • 同義法
      • 黑白線稿 = coloring page = black and white line draft
    • 明示法
      • leg and foot = full body
    • 魔幻法
      • whimsical
      • 隨著不同引擎不同版本有變化
      • ethereal 空靈
      • mininalism 極簡風格
      • 繁複風格

✨ Learning Process

  • /describe
    • 在 Midjourney 輸入 /describe 上傳圖片,就會產生文字,再重新生成
  • 得到四個提示
  • 透過提示產生新圖
  • 請 ChatGPT 幫忙提供 annotations,corpus analysis 語料庫分析,再產生新的 technique prompt

✨ 善用分隔符號

  • chinese evening dress
  • chinese:: evening:: dress
  • chinese2:: evening:: dress5
  • chinese3:: evening:: dress2

✨ Parameter List

  • https://docs.midjourney.com/docs/parameter-list
  • --no
    • Life --no future
      • 把 future 過濾掉
    • car --no technology
      • 理解成玩具車
  • --seed
    • /imagine prompt celadon owl pitcher --seed 123
      • 使用一樣的 seed 提示,理論上可以完全還原
      • 同樣的 seed 再新增關鍵字,通常都有改變
  • --chaos
    • imagine/ prompt watermelon owl hybrid --c 50
      • --c 1 變化較少
      • --c 50 變化更多
      • --c 100 變化到認不出來
  • --stylize
    • /imagine prompt illustrated figs --s 100
      • --s 0
      • -s 750
      • 數值越大,變化越多
      • 太多會有畫蛇添足感
      • 在一定的範圍,擴大細節的程度
      • 可以用 /seeting 設定
      • 可以用 /prefer suffix 清除
  • --iw
    • /imagine prompt flowers.jpg birthday cake --iw .5
      • 圖片佔的比重,讓生成的圖像偏向圖片提示或文字提示
      • --iw 0.5
      • --iw 1.5
      • 數值越大,圖片提示佔比越重

Ontology

  • 本體字
  • product photography
  • woodcut 版畫
  • 浮世繪
  • editorial cartoon
  • expression sheet
  • 攝影風格
  • 做成產品/玩具/樂高
  • tip: subject depicting motive

Imagination

✨ Imagination process

  • 創造力是一個很大的學問
  • 有三個評估標準
    • 能不能做出很多不一樣的東西
    • 能不能做出很新的東西
      • 這個人這輩子沒做過是新的,很容易達到
      • 對於人類而言,沒做過的東西,所以是新的
    • 能不能改進原來的想法
  • 什麼是想像力?
    • known concept
      • 已經存在
    • combinational
      • 組合起來,沒人這樣組過就是新的
    • exploratory
      • 探索,完全沒有人做過,但是合理
    • transformational
      • 不合理或者困難的,沒人想到

✨ Improvisational Creativity

  • 通往異次元空間的門口
  • 那個游泳池+游泳的人
    • 貼上游泳池圖片網址 + 文字
  • 我有一個魔術方塊,可不可以創造一個新的
    • 3x3 Rubik's cube + steampunk style, metallic, vivid color, volumetric lighting, made out of gears
  • Destination
    • tong lau 唐樓
    • beautiful young woman, black hair, gong lau, taiwan street style
    • toy design, product photography
  • Improvement Prompt
    • 圖加字
    • 兩張圖,例如:愛麗絲與小豬

Ethics and Bias

✨ bias in generative art 生成藝術的偏見

  • gender
  • age
  • body type

例如:實際測試以下關鍵字後,觀察到對應的圖像生成結果,帶有刻板印象

  • doctor
    • 有一點年紀的白人男性
  • professor
    • 全部都是老人
  • 幼稚園老師
    • 全部都是女性
  • engineer
    • 都有鬍子
  • family portrait
    • 都是白人,沒有兩個媽媽或兩個爸爸的 family
  • Generative AI
  • UXTW
  • Speech Notes