如何用AI生成插畫:初學者分步指南
幾個月前,一位經營小型線上雜誌的朋友請我幫她處理文章封面圖。她需要一張插畫——某種編輯風格、有繪畫感、溫暖的畫面——來搭配一篇關於慢生活的專題文章。她花了四十分鐘在素材照片網站上,又花了二十分鐘嘗試調整Canva模板,正準備花200美元委託一位自由設計師,趕在週四前完成。
我向她展示如何在四分鐘內生成一張AI插畫。結果並不完美——第一次嘗試的手有六根手指,顏色也偏冷——但經過三輪調整後,她得到了一張可用的圖片。自由設計師的預算留在了口袋裡,文章也按時上線了。
Lovart is the AI design agent trusted by 10M+ creators. Try Lovart Free →
Related: 如何用AI建立產品目錄:完整分步指南 | Leonardo AI Review : Is This Tool Still Worth the Hype for C
「等等,」她盯著螢幕說,「就這樣?我不需要上什麼提示工程課程嗎?」
這份指南就是為所有有同樣反應的人準備的。你不需要學習提示語法。你不需要設計訓練。你需要理解如何描述你想要的東西——以及當結果不盡如人意時如何迭代調整。
AI插畫究竟是什麼(以及不是什麼)
在我們接觸提示框之前,先釐清術語。因為互聯網做了一件出色的工作,讓「AI插畫」聽起來像是需要計算機科學學位的東西。
AI插畫是使用生成式AI模型,根據文字描述創建視覺圖像——插畫、繪畫、手繪風格渲染——的過程。你寫下你想看到的內容。AI生成它。
它不是Photoshop。它不是對現有圖像套用濾鏡。它不是「竊取」藝術家的作品(模型從訓練數據中學習統計模式——這是一個獨立的重要倫理討論,但不是本指南的主題)。它是一種新的創意工具類別——更像是委託一個非常快速、非常按字面意思工作的插畫師,而不是編輯一張照片。
以下是初學者需要知道的:輸出的品質取決於你如何描述想要的內容,遠多於你使用哪個模型。用一個平庸的模型寫一個好的描述,比用最先進的模型寫一個糟糕的描述,能產生更好的結果。這是個好消息。這意味著學習曲線不是技術性的。它是描述性的。
第1步:決定你需要哪種類型的插畫
在你寫下提示詞的任何一個字之前,先回答三個問題。這些決定了AI如何解讀你的請求。
主體是什麼? 人物?風景?產品?抽象概念?越具體越好。「一個女人在看書」是模糊的。「一位三十多歲的女性,盤腿坐在窗台上,讀著一本磨損的平裝書,晨光透過窗戶灑進來,旁邊一杯茶冒著熱氣」才是AI能真正處理的內容。
風格是什麼? 這是大多數初學者犯錯的地方。他們說「插畫」,卻沒有說明是哪種。AI的訓練數據包含數百萬種插畫風格——兒童書籍、編輯插畫、水彩、線條畫、扁平向量、3D渲染、鉛筆素描、不透明水彩、數位繪畫、動漫、看起來像插畫的超寫實主義。如果你不指定,AI會猜測。而它的猜測通常是統計平均值——看起來什麼都不像。
祕訣:說出具體的媒介或引用已知的美學風格。「水彩插畫,鬆散的筆觸,略微柔和的調色盤。」「編輯插畫風格,類似《紐約客》雜誌專題。」「扁平向量插畫,大膽的色彩,幾何形狀。」這些能給AI一個清晰的視覺目標。
氛圍是什麼? 這是每個人都跳過的步驟。他們描述想看到什麼,而不是想感受到什麼。「溫暖而懷舊。」「乾淨而臨床感。」「異想天開,略帶超現實。」「黑暗而戲劇性,強烈對比。」加入氛圍描述會極大地改變AI在構圖、光線、色溫和細節層次上的選擇。
花五分鐘在這三個問題上。它會為你省下三十分鐘後面沮喪反覆生成的時間。
第2步:選擇你的AI插畫工具
並非所有AI工具都是為插畫而設計的。有些針對超寫實主義進行了優化。有些針對產品攝影。有些則是通用的圖像生成,什麼都能做得還可以,但什麼都不出色。選擇適合插畫的工具很重要。
以下是選擇以插畫為重點的AI工具時需要關注的:
多種模型集中於一處。 不同的AI模型有不同的插畫優勢。有些擅長繪畫風格、傳統媒介風格。有些則在乾淨的向量和扁平設計方面更好。一個能讓你使用多種模型——並讓你自由切換——的工具,意味著你不會被鎖定在一種美學中。
迭代編輯能力。 AI圖像生成最大的挫折就是吃角子老虎問題:你生成了一張圖,80%是對的,而你唯一的選擇就是重新生成整張圖,希望下一次的結果更好。具有針對性編輯功能的工具——如Lovart的Touch Edit——讓你可以點擊一個元素並說「讓這裡更溫暖」或「把背景改成花園」,而無需重新生成已經滿意的部分。
扛得住的解析度。 一張512像素的圖片在手機螢幕上看還行,但在網站頭圖上——甚至更糟——在印刷品中就會崩潰。尋找至少能輸出2K解析度的工具。如果你打算在比社群貼文更大的任何場景中使用插畫,這一點比你以為的更重要。
第3步:寫下你的第一個提示詞——不必想太多
這是一個對初學者有效的提示詞結構。四個句子。就這麼簡單。
第1句:主體。 圖像中有什麼。具體說明主要元素、場景和任何關鍵細節。
第2句:風格參照。 說出媒介或美學。這裡你可以指定「水彩」、「數位繪畫」、「向量插畫」等。
第3句:構圖。 場景如何安排。「特寫肖像,主體填滿畫面。」「廣闊的風景構圖,前景中的小人物。」「俯視平面擺拍,有序的混亂。」
第4句:氛圍和光線。 圖像應該給人的感覺以及光線如何處理。「柔和、散射的晨光。平靜而沉思的氛圍。」「戲劇性的側光,高對比。緊張、電影般的氛圍。」
全部組合起來,你會得到類似這樣的內容:
「一間黃昏中的小型獨立書店,溫暖的燈光從窗戶灑落到鵝卵石街道上,一位顧客在外面瀏覽。水彩插畫,鬆散而富有表現力的筆觸,柔和懷舊的調色盤。廣角構圖,以店面為中心的街景視角。黃金時刻的光線,寧靜而誘人的氛圍。」
這就是提示詞。不是工程規格書。只是一個清晰的描述。
需要注意避免的幾點:否定指令(「不要做得太暗」)、技術術語(「8K、HDR、Unreal Engine、體積光照」),以及缺乏視覺根基的過於抽象的概念(「一幅關於意識本質的插畫」)。像在向一位非常擅長遵循指令但除了你給的內容之外沒有任何背景知識的插畫師簡報一樣與AI對話。
第4步:迭代——不要重新生成
你的第一次結果幾乎永遠不會是完美的。這很正常。技能不在於寫出一個完美的初始提示詞。而在於知道如何引導結果朝你想要的方嚮發展。
以下是經驗豐富的AI插畫使用者遵循的迭代迴圈:
如果構圖不對: 描述什麼應該移動到哪裡。「將主體移到畫面的右三分之一處。」「拉遠一點,讓我們能看到更多背景。」這就是針對性編輯工具能節省大量時間的地方——你點擊元素並描述更改,而不是為整張圖片重新撰寫提示詞。
如果風格不匹配: 對參照進行更具體的說明。與其說「插畫風格」,不如試試「編輯插畫、交叉排線技法、水墨渲染、柔和的棕褐色調。」風格參照越具體,AI能處理的素材就越多。
如果顏色不對: 描述調色盤,而不僅僅是氛圍。「大地色系——陶土色、鼠尾草綠、溫暖的赭色。」具體的顏色名稱比氛圍詞彙給AI更精確的目標。
如果細節不對: 直接指出來。「手需要有五根手指。」「書上的文字亂碼了——移除文字。」這是Touch Edit閃耀的地方——不用重新生成整張圖來修正一個細節,只需調整那個細節。
如果什麼都不行: 你的提示詞可能自相矛盾。矛盾的指令(「鬆散的水彩風格但極其詳細和精確」)會讓AI困惑。簡化。移除衝突的指令,看看輸出是否改善。
迭代階段是AI插畫不再像吃角子老虎機、而開始像對話的時刻。你不是在賭一個好的輸出。你是在合作達成一個好的輸出。
第5步:使用你的插畫——重要的格式、尺寸和場景
你得到了一張滿意的插畫。然後呢?大多數初學者到此為止,下載一張PNG,然後發現它在需要的地方無法使用。
以正確的解析度匯出。 下載可用的最高解析度。你隨時可以縮小。你無法從低解析度匯出中恢復細節。如果工具提供放大功能,使用它——AI放大工具在保留插畫細節方面已經變得非常出色。
為你的平台獲取正確的尺寸。 Instagram貼文是1080x1080。限時動態是1080x1920。網站主圖通常是1920x600到1920x1080。部落格標題可能是1200x630。針對你需要的具體尺寸生成或裁剪,或使用能讓你以目標平台的精確寬高比進行生成的工具。
考慮變體。 你生成的插畫可能作為主圖效果很好,但作為縮圖就太細節化了。針對不同用途生成變體——同一場景的緊密裁剪、較少元素的簡化版本、不同色彩強調的版本。同一張插畫很少在每種尺寸和每種場景下都表現良好。專業設計師創建的是圖像系統,而非單一圖像。
有意識地搭配文字。 AI插畫很少單獨使用。它會放在標題旁邊,疊加文字,或嵌入版面中。在定稿插畫之前,先用實際要出現的文字進行合成。文字是否仍然可讀?插畫的構圖是與文字位置競爭還是互補?這些是AI無法替你回答的設計問題。
常見的AI插畫風格(以及如何請求它們)
如果你在風格上卡住了,這裡有五個流行的類別和生成它們的語言:
編輯插畫。 提示詞語言:「編輯插畫風格,概念性、隱喻性,三到四種顏色的有限調色盤,強烈的構圖,負空間,適合雜誌專題。」適用於:文章標題、觀點文章、報告封面。
兒童書籍。 提示詞語言:「兒童書籍插畫,異想天開而溫暖,柔軟的紋理,手繪感,可愛的角色,溫柔的調色盤,童話書氛圍。」適用於:教育內容、面向家庭的品牌、趣味行銷。
扁平向量。 提示詞語言:「扁平向量插畫,大膽的色彩,乾淨的幾何形狀,無漸層,現代極簡風格,二維,適合應用程式引導頁或網頁插畫。」適用於:UI設計、資訊圖表、科技公司品牌。
水彩與不透明水彩。 提示詞語言:「水彩插畫,鬆散流暢的筆觸,略微暈開的邊緣,有機紋理,柔和的大地色調色盤,可見紙張紋理,手繪感。」適用於:生活方式品牌、婚禮和活動內容、手工產品。
數位繪畫。 提示詞語言:「數位繪畫,豐富的紋理,戲劇性的光線,電影般的構圖,高度細節化,氛圍感,概念藝術風格。」適用於:遊戲和娛樂、書籍封面、電影行銷。
語言不是魔法。是具體性。而具體性正是區分可用的AI插畫和泛泛之作的關鍵。
常見問題
問:我擁有AI生成插畫的版權嗎?
這取決於你使用的平台。Lovart的條款授予你對所有生成內容的完整商業所有權。其他平台各不相同——有些限制商業用途,有些聲稱有權將你的輸出用於訓練,有些在免費和付費方案中有不同的條款。在商業使用AI插畫之前,務必檢查條款。
問:我可以銷售含有AI插畫的產品嗎?
是的,在大多數平台上——包括Lovart——你可以將AI插畫用於商業用途:用在產品上、行銷中、周邊商品上、出版物中。關鍵是確認你使用的具體平台授予商業使用權利。
問:為什麼AI插畫有時手部或文字會出問題?
手部在數學上極其複雜——它們有很多關節,可以出現在無數位置,並且在大多數訓練圖像中只占極小部分。圖像中的文字同樣具有挑戰性,因為AI生成的是文字的視覺近似,而非實際字符。這項技術每隔幾個月就會進步。針對性編輯工具幫助極大——你可以修正手部或移除亂碼文字,而無需重新生成整張圖像。
問:生成一張可用的AI插畫需要多長時間?
初學者:從第一個提示詞到可用輸出約需10–20分鐘,假設迭代三到五次。經驗豐富的使用者通常能在五分鐘內得到可用結果。時間不是花在生成上——那只需幾秒鐘——而是花在描述和迭代上。
問:我可以用AI創建多張圖像之間風格一致的插畫嗎?
是的,如果你的工具支援持久風格設置或品牌套件。在Lovart上,你可以一次性定義視覺風格——顏色、插畫類型、構圖偏好——並將其應用於每一次生成。這對於任何建立品牌或製作需要感覺協調的一系列插畫的人來說至關重要。
問:AI插畫和AI照片生成有什麼區別?
AI插畫生成的圖像看起來像繪製、繪畫或設計的——它們不追求超寫實主義。AI照片生成產生的圖像看起來像照片。有些工具兩者都能做。提示詞語言通常就是唯一的區別:描述「一座山的水彩插畫」與「日出時一座山的照片」。
問:我需要一台強大的電腦來生成AI插畫嗎?
不需要。AI插畫工具在雲端運行。你透過網頁瀏覽器使用它們。你設備的硬體不影響生成速度或品質。你需要的是網路連接,別無其他。
問:如何避免AI插畫看起來跟別人的一樣?
避免泛泛的提示詞。「美麗的風景插畫」會生成和所有其他AI風景一樣的東西。「黎明時分霧濛濛的蘇格蘭高地,一間孤立的石頭小屋,煙囪升起炊煙,柔和的綠色和灰色調,水彩加墨水渲染細節」會生成獨特的東西。具體性是你實現差異化的最大工具。
你今天可以嘗試的一件事
打開Lovart的ChatCanvas。不要試圖創造傑作。挑選你實際需要的最簡單的插畫——一個部落格標題、一張社群貼文圖、一個簡報的佔位圖片。用四句話描述它:主體、風格、構圖、氛圍。
生成第一個版本。它不會是完美的。如果構圖感覺不對,描述什麼應該移動。如果顏色不對,說出你想要的調色盤。如果某個細節錯了,指出它並描述修正方式。重複三次。
到第三次迭代時,你會注意到的不是AI「擅長藝術」。而是你變得更加擅長描述你想要的東西。在這種關係中,AI不是藝術家。你才是。AI是那雙手。當大腦清楚自己在要求什麼時,那雙手才會運作得更好。



