FLUX.1本機執行教學　4GB VRAM 顯卡也能使用！？一鍵安裝包　電腦小白也可輕鬆上手！

前一段時間我向大家介紹了開源 AI 繪圖模型 FLUX.1，它生成的圖片效果令人驚豔，細節處理、指令理解能力都非常出色，雖然與 Midjourney V6.1 相比略遜一籌，但依舊是目前最頂尖的一匹模型。

今天就來跟大家如和在自己的電腦上使用。整個過程非常簡單，電腦小白也可以輕鬆操作，而且即便是 VRAM 較少的顯卡，如 4GB / 6GB VRAM等也可以運行，使用 FLUX.1 生成精美的圖片!

4GB / 6GB VRAM 顯卡也能玩 FLUX.1 的秘密

你沒聽錯！即使電腦只有 4GB VRAM 的顯卡，也能夠體驗 FLUX.1 的強大功能。雖然圖片可能只能使用 512×512 這種較低的解析度，但基本上能夠算是順暢的使用 FLUX.1 模型。

在我這台電腦的筆電版 1650 Ti 這個 4 年前發布僅有 4GB VRAM 的顯卡上，約 3 分半即可生成一張圖。若使用較新一點的顯卡，速度必然能更快，擁有 6GB 以上 VRAM 的顯卡，解析度調 1024×1024 應該不成問題。

電腦可以正常生成圖片顯卡僅有 4GB VRAM

至於為何能做到在 VRAM 較少的顯卡上執行 FLUX.1，重點就在於使用經過 NF4 量化 的 FLUX.1 模型，以及為效能優化設計過的 Stable Diffusion WebUI Forge。

今天我所要介紹的本機運行 FLUX.1 方法，主要有兩個關鍵：

執行介面： 我們會使用由 lllyasviel 大神開發的 Stable Diffusion WebUI Forge，它基於 Automatic1111 的 Stable Diffusion WebUI 改良，操作簡便，且對顯卡效能進行了優化，生成速度更快。也有提供一鍵安裝包。
NF4 量化模型： 我們需要下載經過 NF4 量化的 FLUX.1 模型，才能在低 VRAM 顯卡上順暢運行。NF4 量化過後的模型比 fp8 還要更小，但卻有同等、或甚至更高的精度，非常適合所有人使用。

NF4 模型介紹:
https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/981#Flux%20Checkpoints

另外，雖然 NF4 模型也可以在 ComfyUI 中使用，但鑑於 ComfyUI 較為複雜，所以今天我才會選擇跟大家介紹使用 SD WebUI Forge 的方法。

接下來，就讓我們一步一步來看如何快速設定，輕鬆的在自己的電腦上使用 FLUX.1！

前往 Stable Diffusion WebUI Forge 的 Github 頁面（https://github.com/lllyasviel/stable-diffusion-webui-forge），找到一鍵安裝包的下載連結。
下載後解壓縮到任意資料夾中。

前往 HuggingFace 網站，下載 lllyasviel 上傳的 flux1-dev-bnb-nf4-v2 模型。(P.S.也可自行搜尋並下載 schnell 等其他模型)
將下載的 .safetensors 模型檔案放到 WebUI Forge 資料夾中的 webui\models\Stable-diffusion 資料夾內。

在正式開始生圖之前，我們要先了解並調整一下設定。

在 Web UI 左上方選擇 flux
Checkpoint 選擇剛剛下載的模型如: flux1-dev-bnb-nf4-v2。
VAE / Text Encoder 可以不用選擇，NF4 量化模型通常已內建。
Diffusion in Low Bits 保持 Automatic 即可，程式會自動偵測。
Swap Method 選擇 ASYNC 模式，可能可以有 30% 左右的性能提升，但不穩定，可能會反而變得更漫，若只想穩定使用建議選擇 Queue 模式，確保穩定性。
Swap Location 選擇 Share 模式，可能可以有 15% 左右的性能提升，但不穩定，可能會導致程式崩潰，一樣如果只想穩定使用建議選擇 CPU。
GPU Weight 根據生成圖片的大小調整，若生成 1024×1024 的圖片建議預留 2GB VRAM，例如顯卡有 6GB VRAM，GPU Weight就只設 4000 MB 左右。512×512 的圖片可能就預留 1GB 左右的 VRAM