Black Forest Labs 的 FLUX.1 系列 8 款模型各有特点和优势,以下是具体介绍:
- black-forest-labs/FLUX.1-dev:开源非商业用途版本,从 FLUX.1 (pro) 提炼而来,有相似质量和快速遵守能力,比相同尺寸标准模型更高效。能处理复杂构图指令,文本生成出色,生成人手图像细节有进步,可用于图像生成实验和研究等。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-dev
- black-forest-labs/FLUX.1-schnell1:精简快速版本,基于 120 亿参数整流流变换器架构,专为本地开发和个人使用定制,仅需 1-4 步就能生成高质量图像,采用潜在对抗扩散蒸馏训练,具备先进输出质量,紧跟提示词能力可与闭源模型媲美,速度快。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-schnell
- black-forest-labs/FLUX.1-Fill-dev:主要用于图像修复与扩展,包含 inpainting(局部重绘)和 outpainting (外绘拓展)功能。能基于文本描述和二进制掩码对图像编辑与扩展,可无缝编辑图像并延伸至原始边界之外,处理速度快,新生成内容与原图衔接好,是目前较好的图像修复模型。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev
- black-forest-labs/FLUX.1-Redux-dev:是一种适配器,能将输入图像与文本提示结合和重构,生成有微妙差异新图像,保留原始图像主要特征,可用于保持人物一致性或融合多张图像不同部分等,能很好保留原图风格、构图、细节、人物特征等,可玩性高,应用范围广。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev
- black-forest-labs/FLUX.1-Depth-dev:用于基于深度信息的图像生成与控制,通过提取深度图和结合文本提示提供结构引导。采用指导蒸馏训练方法,能高效生成图像并遵循提示词,深度图保留技术有助于维持源图像空间关系和结构元素,擅长在引入新视觉元素时保持原始构图。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev
- black-forest-labs/FLUX.1-Canny-dev:基于 Canny 边缘检测技术,用于精确保留和利用图像边缘信息,方便对边缘细节控制和调整。可以很好识别和保留精细边缘,确保图像变换过程中结构边界完整,使生成图像边缘细节与原始图像一致,同时根据文本提示创作。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev
- black-forest-labs/FLUX.1-Depth-dev-lora:是 FLUX.1-Depth-dev 的 Lora 版本,Lora 技术通常能在不改变基础模型架构的情况下,通过少量参数微调来适应特定任务或数据集。它可能在深度信息利用和图像生成的特定场景下,通过 Lora 的微调机制,进一步优化性能,提高对特定类型图像或深度特征的处理能力,更灵活地满足用户在深度相关图像生成任务中的个性化需求。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev-lora
- black-forest-labs/FLUX.1-Canny-dev-lora:是 FLUX.1-Canny-dev 的 Lora 版本,结合了 Canny 边缘检测和 Lora 微调技术。在处理图像边缘细节的生成和编辑任务时,通过 Lora 的微调,可以更好地针对特定的图像风格、边缘特征或用户需求进行优化,能够更精准地控制边缘的生成效果,在保持图像整体结构的基础上,使边缘的细节处理更加细腻和符合预期,适用于对图像边缘质量有更高要求的场景。模型下载地址:https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev-lora