主題:AIGC初體驗
教材講義:http://gg.gg/0502fxm
時間:2024/05/02(四) 09:00~11:00
地點:鳳西國中(俊華老師邀請)
講師:黃文玉老師
AIGC:生成式AI(Generative AI)泛指所有能產生新資料的技術,常見的包括文字、圖片、音樂、語音、影片等,近來也延伸出可以生成像是程式碼、網頁內容、設計圖或3D模型等不同類型的應用。而這些透過AI所產生的資料統稱為AIGC(AI Generated Content)。
一、近期AI的發展簡介 (各聊天機器人的說明 )
Open AI的chatGPT
2022年11月30日是聊天機器人ChatGPT推出的日子
打響第一砲的AI聊天機器人,因為它的強大導致AI盛行,並稱2023年為AI元年
ChatGPT上線2個月用戶增加到1億,史上最快
到2023年10月,ChatGPT全球造訪量大約是17億次
網址:https://chat.openai.com/ ( https://openai.com/blog/chatgpt )
有分GPT-3.5和GPT-4
GPT-3.5:免費、但知識截止於2021年9月
GPT-4:每月20元美金
有很多外掛的功能
2023年11月底【OpenAI五天經營權風暴 如Netflix連續劇】
有名的AI繪圖(Dall-E3) 也是他們公司的 https://openai.com/dall-e-3
2024年2月15日又推出跨時代的巨作Sora https://openai.com/sora ,它能根據使用者輸入的文字描述,產生最長1分鐘的高畫質影片。
2024年4月1日起開放用戶不需註冊(僅限GPT3.5),而可直接使用ChatGPT人工智慧聊天平台
微軟的Copilot (舊名為Bing AI (必應), 2023年11月15日,微軟宣布 Bing Chat 本身將更名為 Microsoft Copilot,Bing是微軟的搜尋引擎)
OpenAI憑ChatGPT一砲而紅前,微軟斥巨資陪Open AI度過沒有營收但不斷燒錢的漫漫長夜。2019年7月微軟投資OpenAI戰略10億美元,並提供大模型研發的伺服器,OpenAI所有技術都在Azure雲端伺服器運行。天下沒有白吃的午餐,OpenAI需為10億美元付出的代價是,微軟雲端Azure 可直接使用OpenAI模型,包括ChatGPT、Codex及DALL.E,微軟雲端客戶無需經過OpenAI就能在聊天機器人、搜尋引擎等產品置入AI大模型。
微軟是Open AI的最大金主,也是最大受益者之一,被Google打趴許久的微軟,不知這次可否藉由Copilot來翻身呢?
網址已改為:https://copilot.microsoft.com/ (舊的):https://www.bing.com/new
也用gmail帳號也可以註冊
沒有時限、可連網找資料
發現:
不用登入也可以使用,但可連續對談的次數好像比較少,也無法【生圖】(將文字轉換為影像,因為畫圖會用到點數)
以前只能用新版的Edge瀏覽器,我發現現在新版的Chrome瀏覽器也可以用,但可連續對談的次數會比較少,所以建議還是使用新版的Edge瀏覽器來玩Bing AI,使用Edge瀏覽器還有【撰寫】(可以幫你寫文章)及【頁面摘要】(取得網頁重點)的功能!2023.10.20後,右上角的bing圖示改為Copilot圖示(副駕駛),就是有輔助的意思!!
產生頁面摘要 ,可隨便找一篇網頁或文章,就可以很快得到這篇文章的摘要
功能
有將文字生圖片的功能,利用【Bing 影像建立工具(由DALL·E提供) 】:https://www.bing.com/images/create/ (需先登入,待會再教如何註冊)
本身也可直接上傳圖片,並分析圖片內容
可以利用【麥克風】來輸入prompt
Google 的Gemini (2024.02.08 Bard 改名 Gemini )
Google因chatGPT的出現,傳出內部為此拉起「紅色警戒」(code red)
用任一Google帳號註冊及登入
目前已經可以使用中文(2023 年 7 月 13 日,更新內容:Bard 現在支援超過 40 種新語言,包括阿拉伯文、中文 (簡體/繁體)...
這時已經輸了openAI及Bing一大截了!!
可以利用【麥克風】來輸入prompt
也可以利用【朗讀】來讀出回應的內容
2023/09/19中文版已支援上傳圖片的功能,而且功能強大
它目前沒有畫圖的功能
Google於12/6 推出該公司迄今強大的人工智慧 (AI) 模型「Gemini」,與 OpenAI 的 GPT-4 正面較勁。Gemini 大型語言模型 (LLMs) 將包括三種處理能力不同的套件:Gemini Ultra 是最大、最強的類別,可用於資料中心;Gemini Pro 可擴充多種任務;Gemini Nano 可用於特別任務和行動裝置。
2024/02/08 Bard 改名 Gemini
依據新北市政府教育局112年10月25日新北教研資字第1122109814號函辦理。
Chat Everywhere
總部在加拿大,台灣是它最大的使用族群
免註冊,方便學生的使用
使用chatGPT的資源
Free版
連網模式
語音輸入
Pro版每月台幣$249.99元
二、常見的AI生圖平台介紹
教學網站:STEAM 教育學習網
裡面有非常多AI生圖平台的使用教學
現在有名的AI繪圖平台
DALL·E :OpenAI公司所出的 (最新已到DALL-E3)
由於微軟是Open AI的最大金主 ,反而微軟的【Copilot】( 使用GPT-4模型)及【Copilot設計工具 (Bing 影像建立工具)】 (使用DALL-E3,用點數控管,幾乎免費,所以我們會以此做為第一個算圖平台)
MidJourney (先在Discord註冊)
(2023年3月31日) Midjourney 停止提供免費的 AI 圖片產生服務
Stable Diffusion
可以安裝在自己的電腦(要有較高的硬體配置)或安裝在Google Colab
沒自己安裝也沒有關係,現在很多根據Stable Diffusion所架設的Web介面,供大家來使用,有的近似免費
最早使用時,免費帳號每天可生1000張圖,現在只剩50張
這套李奧納多也有很多人在使用
https://app.prodia.com/#/art-ai
這套免註冊可用
Canva
找到【魔法媒體工具】
也是使用自然語言來下prompt,中文字也可以
Adobe Firefly
三、基本型AI生圖介紹
Copilot設計工具 (Bing 影像建立工具(由DALL·E提供))
網址:https://www.bing.com/images/create/ (來自 Microsoft Designer 的影像建立工具)
使用Copilot (Bing AI)的帳號登入(如果沒有帳號,請先註冊)
每一個帳號每天給15個點數,用完後,生圖的速度會變慢
如果在電腦教室,同時多人註冊,可能會再要求手機驗證
怕自己的MAIL註冊,一下子就用完點數。可以採用10分鐘的電子郵件來註冊
https://etempmail.com/ (20240429測試,沒問題,可用)
學習如何下Prompt
可利用【給我驚喜】來學習如何下prompt
可利用【提示】來學習如何下prompt
可從【探索構想】,找到喜歡的圖來學習如何下prompt
也可以使用中文的prompt
一次會產生4張圖
產生的圖片大小為1024X1024
越簡單的prompt,AI的空間就越廣;越複雜的prompt,AI的空間就較窄
官方提示詞的建議:
形容詞+名詞+動詞,照片樣式(圖片風格)
怎樣的人(或物)在哪裡做什麼事 (很像寫作文的造句) ,如
【戴著帽子的紅色長頭髮女生】【在海邊】【看夕陽】
【美麗的女孩】【背景是台灣的街道】【生活照片】
貓
貓和狗在玩耍
黑貓和白狗在海灘上玩耍,梵谷風格
黑貓和白狗在台北101前看煙花,真實相片
最後再加上圖片風格,如
日系風格
浮世繪風格
柯南風格
宮崎駿風格
藝術家的風格
梵谷風格
莫內風格
彩畫風格
水墨畫
水彩畫
鉛筆畫
攝影鏡頭
廣角鏡頭
魚眼鏡頭
微距鏡頭
畫面角度
正面照
側面照
低角度鏡頭
高角度鏡頭
數位藝術
高清相片
動畫卡通
印象派
...
動手試試看吧!!
自己的作品都會存在【創作】裡面
2. Prodia
結合類似 Stable Diffusion 繪圖功能
如果想產生比較細緻逼真的人像圖片,Prodia 就比較不適合,主要是模組不夠精細,沒辦法產生複雜比真的人物圖片
免註冊可算圖,免費的只有小圖,一次只能產生一張,只能夠產生 512 X 512 像素 AI 圖片
如果覺得圖太小,可以利用以下軟體 來免費把圖擴大一倍
https://clipdrop.co/image-upscaler (要先註冊登入)
https://snapedit.app/art-enhance (不需註冊登入)
內容:
最快方法直接點下方六種不同範例風格,包含有手繪、寫實、擬真人物、CG動漫風格和電繪等風格
模型說明:
SD 1.4 模型:素描、手繪、3D風格
Anything V3 模型:CG風格(日系)CG畫風是一種透過電腦圖學所繪製成的獨特的繪畫風格
Anything V4.5 模型:CG風格(歐美)
Analog V1 模型:真人樣貌
TheAlly’s Mix II 電繪畫像(柔美):3D 電繪風格人物圖片
Elldreth’s Vivid 模型:電玩CG風格畫像(陰影),韓國電玩 CG 風格
Dreamlike Diffusion:真人樣貌
進階說明
CFG Scale 是一個創意指數,如果數值越低就會越自由發揮,數值越高就會按你的文字來執行。
步數越多畫出來的照片越細緻
參考別人的咒語(prompt)
練習:
正向prompt
Closeup of cute little girl holding cute Pomeranian, ultra realistic, intricate, highly detailed, cinematic lighting, best quality, 8k high resolution(可愛的小女孩抱著可愛的博美犬的特寫,超現實,複雜,高度詳細,電影燈光,最佳質量,8k 高分辨率)
為求畫面品質,上面紅字部份要一直放在每一張圖上
負向prompt
text, logo, wordmark, writing, heading, signature, two heads, two faces, cropped image, out of frame, deformed hands, twisted fingers, double image, malformed hands, multiple heads, extra limb, ugly, poorly drawn hands, missing limb, disfigured, cut off, ugly, grain, low res, deformed, blurry, bad anatomy, disfigured, poorly drawn face, mutation, mutated, floating limbs, disconnected limbs, disgusting, poorly drawn, mutilated, mangled, extra fingers, duplicate artifacts, missing arms, mutated hands, mutilated hands, cloned face, malformed,(文本、徽標、字標、寫作、標題、簽名、兩個頭、兩張臉、裁剪圖像、出框、變形的手、扭曲的手指、雙圖像、畸形的手、多個頭、額外的肢體、醜陋、畫得不好的手、缺失 肢體、毀容、切斷、醜陋、顆粒、低分辨率、變形、模糊、解剖結構不良、毀容、畫得不好的臉、突變、突變、浮動肢體、斷開的肢體、噁心、畫得不好、殘缺不全、損壞、多餘的手指、重複 文物,失踪的手臂,變異的手,殘缺的手,克隆的臉,畸形的,)
上面紅字部份要一直放在每一張圖上
繪本建議使用的Model(模型)及Filter(濾鏡)
Model:Stable Diffusion 1.5
Filter:ReVAnimated 或 Playtoon