圖像生成模型 —— 生成式 AI 的常用子集 —— 可以解析并理解書面語言,然后將文字轉換為幾乎任何風格的圖像。
Black Forest Labs 的一系列新模型代表了圖像生成領域的前沿技術 —— 現(xiàn)在可在 PC 和工作站上試用 —— 在 GeForce RTX 和 NVIDIA RTX GPU 上的運行速度最快。
流暢的功能
FLUX.1 AI 是由 Black Forest Labs 開發(fā)的文本生成圖像模型套件。這些模型基于 Diffusion Transformer(DiT)體系架構而構建,以便大參數(shù)量的模型保持高效運行。Flux 模型在擁有 120 億個參數(shù)的模型上進行訓練,以生成高質量圖像。
DiT 模型屬于高效的計算密集型模型 —— NVIDIA RTX GPU 對于處理這些新模型至關重要,其中最大規(guī)模的模型如果不進行重大調整,將無法在非 RTX GPU 上運行。Flux 模型現(xiàn)在支持 NVIDIA TensorRT 軟件開發(fā)套件,該套件可將這些模型的性能提升高達 20%。用戶可以在 ComfyUI 中借助 TensorRT 試用 Flux 和其他模型。
Flux 的優(yōu)勢
FLUX.1 在生成高質量、多樣化的圖像方面表現(xiàn)卓越,其出色的指令遵循性意味著 AI 能夠準確理解并執(zhí)行指令。提示依從性較高,意味著生成的圖像與文本提示描述的元素、風格和情緒高度匹配。提示依從性較低會導致圖像可能部分或完全偏離給定的指令。
FLUX.1 以能夠精確渲染人體解剖結構(包括手部和人臉等具有挑戰(zhàn)性的復雜特征)而著稱。FLUX.1 還顯著改進了在圖像中生成易讀文本的過程,解決了文本轉圖像模型的另一個常見挑戰(zhàn)。這使得 FLUX.1 模型非常適合需要精確文本表示的應用,例如宣傳材料和書籍封面。
FLUX.AI 具有三種變體,可為用戶提供最適合其工作流的選擇,而不會犧牲質量:
FLUX.1 pro:為企業(yè)用戶提供最高質量的模型;可通過應用編程接口訪問。
FLUX.1 dev:FLUX.1 pro 的免費精華版本,仍然具有較高質量。
FLUX.1 schnell:運行速度最快的模型,非常適合本地開發(fā)和個人使用;具有寬松的 Apache 2.0 許可證。
dev 和 schnell 模型為開源版本,Black Forest Labs 在流行平臺 Hugging Face 上提供對其關鍵功能的訪問。這一做法得到社區(qū)廣泛認可。
得到社區(qū)廣泛認可
自發(fā)布以來,F(xiàn)lux 模型的 dev 和 schnell 變體已在 Hugging Face 上被下載 200 多萬次。
FLUX.1 的強大功能受到用戶廣泛贊譽,稱其能夠生成具有非凡細節(jié)和逼真度、視覺效果令人驚艷的圖像,并且可以處理復雜的提示,而無需調整大量參數(shù)。
此外,F(xiàn)LUX.1 還善于處理各種藝術風格,并能夠快速高效地生成圖像,因此是完成個人和專業(yè)項目不可或缺的重要工具。