與Gemini的對話:(使用Canvas功能)
你是一位英文教學大師,我的小孩在學習英文上有些文法部分經常錯誤
第一個部分,第三人稱單數的句子,在現在式句子中動詞經常忘了加上s,可以怎樣加強訓練,或者可以幫忙我產出練習的題目
例如It rains a lot. 動詞忘記加上 s
第二個部分,一個單字可以做為動詞、名詞,或變化為形容詞,孩子經常搞不清楚,所以常弄錯。
例如 It snows a lot. There is a lot of snow. 搞不清楚什麼時候要用動詞,什麼時候要做名詞用,會有範例練習題,在答題後做說明嗎?
為了解決這兩個問題,這些可以有機會變成一個練習的應用程式嗎?
後來發現,只有第一人稱單數的題目,所以增加prompt做修改:
第一部分動詞的話,主詞與動詞的搭配也會需要有第一人稱I,第二人稱You或第三人稱單數的題型出現
所以產出第二個版本!!!
這是一個網友分享的程式,直接問Gemini
上傳圖片給Gemini,直接與他對談,提出問題與需求
這是一個使用Gemini的canvas生成的程式,如果我想要創作類似的程式,我應該在gemini使用canva生成,或者到Google AI studio裡用build生成呢?
那我應該要下什麼prompt
要創建一個類似於您提供的AI Line 貼圖製造機的程式,您需要使用 Google AI Studio,而不是直接在 Gemini 的對話框中生成。
Google AI Studio 是一個專門為開發人員設計的工具,讓您可以直接使用 Google 的 Gemini 模型進行原型設計和開發。它提供了更精確的控制和設定,讓您可以串聯多個步驟來完成複雜的任務,例如:
接收使用者上傳的圖片。
分析圖片中的人物和姿勢。
根據選定的風格(如:維持原圖、動漫、水墨畫)和情緒(如:開心大笑、傷心哭泣)來修改或生成新的圖片。
將多個圖片處理後合併成一個新的圖像。
最後,輸出結果。
這類程式需要一個完整的流程,因此您需要使用 "Build" 功能來建立一個 "Multi-turn chat" 或 "Structured prompt"。以下是您可以使用的 Prompt 範例和步驟:
在 Google AI Studio 中,您可以將任務分解為多個部分。您需要一個能夠接收圖片並根據多個變數(風格、情緒、文字)進行處理的 Prompt。
您可以參考以下 Prompt 範例,並根據您的需求進行調整和擴充:
你是一位專門創作 AI 貼圖的專家。
使用者會提供一張或多張人物照片,以及多個設定選項。
**你的任務:**
1. **分析輸入:** 接收使用者上傳的 1-3 張圖片。
2. **辨識人物:** 辨識圖片中的人物。
3. **理解設定:**
* **風格:** [維持原圖, 動漫, 3D渲染, 水墨畫, 迪士尼, 像素藝術, 賽博龐克, 逼真影像]
* **情緒/動作:** [開心大笑, 傷心哭泣, 生氣大喊, 驚訝錯愕, 比讚微笑, 揮手致意, 托腮思考, 呼呼大睡]
* **自訂文字:** 使用者可以輸入自訂文字。
4. **生成圖片:** 根據上述所有輸入,生成一張完美的 AI 貼圖。貼圖應將人物從原始背景中移除,並根據所選的風格、情緒和動作進行創作。
5. **輸出:** 輸出生成的貼圖圖片。
**範例輸入格式:**
- **圖片:** [使用者上傳的圖片]
- **選擇風格:** 維持原圖
- **選擇情緒/動作:** 開心大笑
**範例輸出格式:**
- [生成符合要求的圖片]
**請注意:**
- 如果選擇「維持原圖」風格,請專注於改變人物的情緒和動作。
- 確保生成的人物與原始圖片中的人物臉部特徵、髮型、服裝等細節保持一致。
- 最終輸出圖片應為無背景的貼圖樣式。
這個 Prompt 是一個起點,您可以根據您希望程式實現的複雜程度來增加更多的細節和規則,例如處理多個人物的互動、增加更多樣化的背景設定等等。
希望這個資訊對您有所幫助!
中間測試遇到了幾個問題:
沒辦法正確出現中文字
一次只生成一張圖片
所以在與gemini溝通:以下是文字內容
可以輸入多組文字,支援繁體中文,輸入中文字時,你出現的是亂碼字,如果不支援繁體中文字,就轉換成英文字
一次生成多張圖片,輸入幾組文字就生成幾張圖片,每組文字都可以選擇情緒/動作
例如:第一組:輸入開心,選擇開心,就生成開心的圖片,文字為開心或對應的英文字。第二組文字輸入不開心,就生成不開心圖片,文字為不開心或對應的英文字。
其他問題的對話:
卡通或其他圖形類別膚色的部分,需要加強一下,如果上傳的照片膚色偏黑,生成的圖片人物也要膚色偏黑一點,就是需要根據圖像的膚色做調整
圖片生成模型目前無法直接在圖片中生成穩定的中文字。這是因為它們主要是為英文等拉丁語系訓練的,對於中文字的複雜筆畫、結構和組合方式難以精確掌握,即使嘗試生成,也常常會出現以下問題:
字形扭曲:筆畫錯亂、字體模糊或不完整。
亂碼:生成沒有意義的符號或完全錯誤的字。
位置不準確:文字會浮在空中或與背景不協調。
雖然目前技術尚未成熟,但未來可能會有所改善。同時,若您需要將中文文字加入圖片中,目前建議您:
分兩步完成:
首先,使用生成模型生成您想要的無文字圖片。
然後,使用圖像編輯軟體(例如:Photoshop, Photopea, Canva, Midjourney 或 Stable Diffusion)將您需要的中文文字手動加上去。
使用專門的文字生成工具:
有一些專門為文字設計的生成工具正在開發中,可以更精確地生成文字圖片。
簡而言之,現階段您無法直接讓模型生成中文文字。最好的方法是先生成圖片,然後再自行添加文字。