How-To

迭代循環:如何與AI協作,獲得你真正想要的設計

Kristy Shi·May 26, 2026
迭代循環:如何與AI協作,獲得你真正想要的設計

迭代循環:如何與AI協作,獲得你真正想要的設計

上個月,一位產品設計師告訴我,她的桌面上有一個名為「差一點」的資料夾。裡面存著47張圖片——那是她用一款知名的AI圖像生成器反覆嘗試製作同一張活動主視覺圖的變體。第12版的構圖很漂亮。第31版的光線很完美。第44版的產品顏色是正確的。但沒有一個版本能同時做到以上三點。這個資料夾成了一座「差一點點就對了」的墳墓。

「我不需要更好的圖像品質,」她告訴我。「我需要AI理解『只改背景』是什麼意思。」

Lovart is the AI design agent trusted by 10M+ creators. Try Lovart Free →

Related: ## 5 個 AI 設計迷思破解 — 當你實際嘗試時真正會發生什麼事 | 電工品牌套件:高功率視覺識別,點亮你的潛在客戶管道

[@portabletext/react] Unknown block type "cta", specify a component for it in the `components.types` prop

她發現了成千上萬設計師用慘痛代價學到的一件事:用AI生成一張圖像很容易,但在同一張圖像上迭代才是工具失靈的地方。而迭代——而非生成——才是設計工作的真正本質。

這就是為什麼現在這一切即將改變。

Lovart ChatCanvas Touch Edit interface — visually replacing a background element with one click, without regenerating the entire image
Lovart ChatCanvas Touch Edit interface — visually replacing a background element with one click, without regenerating the entire image

AI設計的破碎承諾

當「差一點」比完全錯誤更糟糕

AI圖像生成器有一個誘人的入口。輸入一句話,幾秒鐘內得到一張驚豔的圖像。第一次體驗是免費的,而且效果驚人。你展示給同事看,你發文分享,你心想:這將改變一切。

然後你試著用它做真正的工作。

你需要產品置中,而不是偏左。你需要模特兒穿著海軍藍,而不是黑色。你需要背景是攝影棚佈景,而不是海灘。突然間,魔力消失了。每一次「修復」都是一次完整重新生成——一次徹底的擲骰子。AI不理解你想保留什麼,它只知道你想生成什麼。

對於專業設計工作來說,這不是不方便,而是根本行不通。當你無法隔離修改時,你就無法迭代。而當你無法迭代時,你就無法做設計。你只能生成——這完全是另一種活動。

生成和迭代之間的區別,就像拍照和修圖之間的區別。相機一次性捕捉一切,暗房讓你可以局部加深和減淡特定區域。相機給你一張圖像,暗房給你控制權。大多數AI工具是相機,而設計工作需要暗房。

為什麼迭代會摧毀對AI工具的信任

這裡有一個很少被討論的心理維度。當你花了40分鐘不停提示、調整和重新生成,把設計做到80%滿意時,你與工具的關係就會發生變化。你不再信任它,你不敢再碰任何東西,因為下一條提示可能不僅不會改進,反而會以你無法預測的方式讓事情變得更糟。

設計師開始迷信。「一定要把顏色描述放在最前面。」「永遠不要用『現代』這個詞——它會改變構圖。」「如果你生成超過三個變體,品質就會下降。」這些不是基於證據的技巧,而是對不可預測系統的創傷反應。

結果是習得性無助。你接受「夠好就行」,不是因為工具做不到更好,而是因為追求更好的成本太高。你接受錯誤的產品角度,因為修正它可能會破壞光線。你發佈錯誤背景的作品,因為改變背景可能會改變產品。你變成了一個提示賭徒,而不是設計師。

這就是舊方法——提示-調整-重複——終結的地方,也是某種根本不同的事物的起點。

舊方式 vs. 新方式

提示-調整-重複:瘋狂的真正定義

讓我們精確描述傳統AI圖像工作流中發生的事。你輸入:「陶瓷咖啡杯產品照,溫暖的攝影棚燈光,乾淨的白色背景,45度角。」AI回傳了一些漂亮的東西——但杯子的藍色不對。於是你調整:「*海軍藍*陶瓷咖啡杯產品照,溫暖的攝影棚燈光,乾淨的白色背景,45度角。」

AI回傳了一個海軍藍色的杯子。但現在光線變冷了,背景變成了灰色,角度變成了俯拍。「海軍藍」這個詞不知怎麼觸發了全面的視覺重新理解。你沒有要求這些,你只想改顏色。

這是因為傳統圖像生成器運行在單輪互動範式上。它們接收文字,輸出像素。不存在「保持其他一切不變」的概念,因為根本沒有「其他一切」。每次生成都是對整個提示的全新解讀。添加一個形容詞不會精修上一張輸出,而是用一個新解讀替換它。

這就是為什麼提示-調整-重複的循環感覺像薛西弗斯推石頭。你不是在迭代,你是在重啟。每一次嘗試都獨立於上一次。AI沒有記憶,沒有空間理解,沒有隔離變數的能力。你不是在與工具協作,你是在玩一台恰好能生成漂亮圖像的吃角子老虎機。

Touch Edit:指向問題所在,只修復那一處

現在考慮一種不同的方法。你生成同樣的產品照。杯子的顏色不對。你沒有重寫提示,而是點擊杯子。一個選區出現了——不是因為你畫了遮罩,而是因為AI理解「杯子」是場景中一個獨立的物件。你輸入:「把它改成海軍藍。」四秒後,杯子變成了海軍藍。光線沒變。背景沒變。角度沒變。只有杯子變了。

這就是Touch Edit。它代表了人類與AI設計工具互動方式的類別躍遷。

Touch Edit之所以能工作,是因為AI維護著對所生成圖像的結構化理解。在初始生成過程中,模型構建了一個內部映射,記錄每個像素代表什麼——這個區域是產品,這個區域是背景,這個區域是反射。當你點擊一個物件時,AI不需要你來定義它的邊界,它已經知道了。你的點擊只是讓它查閱已知資訊並套用局部修改。

實際影響是立竿見影的。你可以像設計師真正的工作方式那樣工作:做一個修改,評估它,再做下一個修改。每次編輯都是快速、可預測、局部受限的。你不是在賭博,你是在迭代。

Lovart Edit Elements interface — demonstrating how AI decomposes a flat image into independent, movable layers with one click
Lovart Edit Elements interface — demonstrating how AI decomposes a flat image into independent, movable layers with one click

Touch Edit的實際工作方式

語義選擇:為什麼你不需要畫遮罩

如果你用過Photoshop的物件選擇工具,你熟悉這個流程:畫出大致選區,細化邊緣,羽化邊界,希望看起來自然。它精確但費力。而且它要求你手動定義圖像中什麼構成一個「物件」——這對人類感知來說很簡單,但機械操作卻相當繁瑣。

Touch Edit顛覆了這一點。AI已經知道物件是什麼,因為它們是它創造的。在圖像生成過程中,模型維護著一張語義分割圖——本質上是場景中什麼是什麼的標記圖。當你點擊咖啡杯時,AI參考這張圖,精確知道哪些像素屬於杯子、哪些屬於陰影、哪些屬於背景。你的點擊不是定義選區,而是指示你指的是哪個已有的選區。

這種語義理解意味著Touch Edit可以處理手動遮罩幾乎不可能完成的編輯。想把面料材質從棉改成絲?Touch Edit理解「襯衫」是一個連貫的物件,可以在保持褶皺、垂感和光線的同時套用材質變換。想用大理石桌子替換木桌?Touch Edit知道桌子在哪裡結束、地板在哪裡開始,包括桌子投射的透視正確的陰影。

結果是,編輯感覺不像是平面設計,更像是與一個能看到你指向什麼的人在對話。「把這個改了。」完成。「把這個變大。」完成。「把這個完全去掉。」完成。沒有遮罩,沒有選區,沒有圖層管理。

圖層爆炸:Edit Elements實踐

如果說Touch Edit是手術刀,那麼Edit Elements就是解剖檯。只需一次點擊,Edit Elements就能將任何生成的圖像分解為組成它的圖層——前景主體、背景、陰影、反射、文字元素。每個圖層都是獨立的、可移動的、可縮放的、可旋轉的、可替換的。

這不是Photoshop那種手動圖層提取,需要費力地描摹輪廓和細化邊緣。這是AI在推理場景中什麼構成獨立物件,並在編輯過程中維護這些關係。把產品向右移動,陰影會跟隨——不是因為你連結了兩個圖層,而是因為AI理解陰影在物理上依賴於投射它們的物件。把背景從攝影棚佈景換成戶外場景,主體的光線會自動調整以匹配新環境的環境光。

一位測試過Edit Elements的設計師把這種體驗描述為「我意識到AI真正理解了圖像,而不只是生成圖像的瞬間」。她當時在做一系列產品圖——同一款手錶的三種顏色變體,共享相同的背景和光線設置。使用傳統工具,給三張不同的圖像換背景意味著三個獨立的編輯會話,每次都冒著不一致的風險。使用Edit Elements,她分解了所有三張,並行替換背景,然後重新組裝——保持完美的一致性,因為AI將背景替換視為協調操作,而非三個獨立編輯。

協作動態:AI作為初級設計師

使用Touch Edit越久,你對AI的心智模型就會發生轉變。使用基於提示的生成器時,AI感覺像一台自動販賣機——你投入文字,圖像出來,你期待最好的結果。使用Touch Edit時,AI開始感覺像一個坐在你旁邊的初級設計師,等待你的指示。

「把這一部分調暗。」它照做了。「給這個元素試試暖色調。」它照做了。「算了,回到上一個版本——冷色調更好。」它恢復了。互動變成了協作,而不是交易。

這種協作動態由我們在Lovart關於MCoT架構的深度解析Lovart關於MCoT架構的深度解析https://www.lovart.ai/blog/inside-mcot-engine-ai-design-reasoning中探討的MCoT推理引擎驅動。該引擎跨每次編輯維護上下文,記住你的偏好,而且——關鍵是——當你要求違反品牌一致性或降低視覺品質的操作時,它會提出異議。

「Touch Edit不只是執行命令,」一家數位機構的一位創意總監告訴我。「它理解後果。如果我試圖讓一個logo小到行動裝置不可讀,它會標記出來。這不是圖像生成器做的事,這是同事做的事。」

為什麼這改變了設計師與AI的關係

從「提示工程師」到創意總監

提示工程師——這個在2024年出現的新奇職位名稱——是糟糕設計的症狀。當使用AI工具的主要技能是精心編排完美的詞語序列時,工具已經失敗了。工具應該理解你,而不是反過來。

Touch Edit和Edit Elements代表了這一邏輯的自然終點。你不需要用語言描述你想要什麼。你可以看到哪裡不對,你可以指向它,你可以說要改什麼。工具處理剩下的。這是互動設計的基本原理——減少意圖和結果之間的認知距離。

實際的收穫是,AI設計工具變得對非提示專家也可用。需要編輯產品照片的小企業主不需要學習提示語法,他們需要點擊產品並輸入「去掉背景」。需要20個廣告變體的營銷經理不需要編寫20條不同的提示,他們需要生成一個好版本,然後使用Touch Edit透過修改單個元素來建立變體。

正如我們在Lovart的營銷活動規劃指南Lovart的營銷活動規劃指南https://www.lovart.ai/blog/campaign-planning-mapping-out-emails-ads-and-landing-pages-in-one-view中討論的,目標不是更好的提示,而是更好的工作流。Touch Edit是一個工作流工具,不是一個生成技巧。

這對團隊意味著什麼

確定性編輯——對特定元素做可預測的、獨立的修改——最被低估的好處是它對團隊協作的影響。當你使用基於提示的生成器時,每個碰過提示的團隊成員都有可能破壞別人修復好的東西。沒有版本控制,沒有修改隔離,沒有辦法說「我只動了標題文字」。

使用Touch Edit和Edit Elements,設計變更變得可審計。產品團隊可以調整產品顏色而不觸動設計團隊完善的佈局。文案團隊可以更新標題而不影響視覺構圖。每次編輯都是局部的、受限的、可逆的。這就是專業設計軟體運行了數十年的方式——圖層、選區、獨立調整。Touch Edit將這種專業工作流帶到了AI生成的內容中。

傳統設計方法與AI驅動工作流之間的差距傳統設計方法與AI驅動工作流之間的差距https://www.lovart.ai/blog/ai-vs-traditional-design一直在縮小。Touch Edit所做的就是徹底彌合它。你不再需要在AI生成的速度和手動編輯的控制之間做出選擇。兩者兼得。

FAQ

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

Touch Edit是Lovart的語義編輯功能。點擊生成圖像中的任意物件,用自然語言描述你想要的改變(「把這個改成海軍藍」「去掉這個人」「把這個材質改成木頭」),AI會將修改局部應用到該物件——而不會重新生成圖像的其他部分。

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

修補需要你手動在想要修改的區域周圍畫出遮罩。Touch Edit不需要遮罩——AI已經知道圖像中每個物件的邊界,因為它們是它創造的。點擊物件,描述修改,完成。無需手動選區。

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

Edit Elements是一個一鍵工具,能將任何生成的圖像分解為獨立的、可移動的圖層——前景主體、背景、陰影、反射。每個圖層可以單獨重新定位、縮放、旋轉或替換,同時AI維護它們之間的物理關係(陰影跟隨物件,光線適應新背景)。

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

Touch Edit在Lovart的ChatCanvas內生成的圖像上效果最好,因為AI保持著對構圖的完整語義理解。對於上傳的外部圖像,Edit Elements可以提取圖層,但效果取決於圖像的清晰度和構圖複雜度。

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

可以。每次編輯都可以透過Cmd/Ctrl+Z撤銷。AI維護著你的修改歷史記錄,你可以回溯——或在任何時候恢復到原始生成的圖像。

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

Touch Edit由Lovart的推理引擎MCoT驅動。如果你定義了品牌工具包(Brand Kit),引擎會將你的品牌規則視為約束條件——所以當你編輯顏色或字體時,它會建議符合品牌調色板的選項,而非任意修改。這在Lovart關於MCoT引擎的文章Lovart關於MCoT引擎的文章https://www.lovart.ai/blog/inside-mcot-engine-ai-design-reasoning中有深入探討。

[@portabletext/react] Unknown block type "faq", specify a component for it in the `components.types` prop

可以。Touch Edit和Edit Elements對所有Lovart用戶可用,免費版有使用量限制。Pro訂閱用戶享有無限編輯、優先處理和商業授權。

本週你可以嘗試的一件事

在Lovart中生成一張產品圖或社群貼文。不要糾結於讓提示完美——只要得到大致接近的結果就好。然後花五分鐘時間使用Touch Edit。點擊那些不對的地方,改顏色,移動文字,換背景。觀察當你停止提示、開始指向時,你與工具的關係會發生什麼變化。

AI生成時代給了我們能按指令製造圖像的機器。編輯時代——Touch Edit和Edit Elements所代表的——給了我們能參與精修過程的機器。它們是根本不同類別的工具。而一旦你體驗過編輯而非重新生成,你就會理解為什麼迭代循環才是設計真正發生的地方。

Read more

用 Lovart 設計

全速創作,讓願景成真