Black Forest Labs 发布了 FLUX.1 Kontext [dev],这是其图像编辑模型 FLUX.1 Kontext [pro] 的开源开发版本,拥有 12B参数,具备 接近专有工具的图像编辑能力,并可在消费级硬件上运行。
其目标是提供一个性能接近闭源专有模型的免费工具。
- 模型规模:12B 参数(对比 Stable Diffusion 约为 1B-2B)
- 模型定位:仅用于图像编辑(非从零生成),强调局部精准控制与角色一致性。
🔓 开源与可用性
- 模型在 FLUX.1 非商业许可下开源,支持研究与非商业用途。
- 权重可通过 Hugging Face 获取,兼容 ComfyUI、HuggingFace Diffusers、TensorRT。
- 由多个合作方(如 FAL、Replicate、Runware、DataCrunch、TogetherAI)提供云端或本地推理支持。
主要能力
FLUX.1 Kontext [dev]专注于 图像编辑任务:包括迭代编辑、角色保持、局部与全局精细控制。
- 可以非常准确地“重绘”图片中的局部或全图,比如:
- 把帽子加到人物头上
- 改变背景风景
- 把原图中的狗换成猫,人物保持原样
- 多次修改也不会“跑偏”或者失真
- 跟很多流行工具(如 ComfyUI)无缝结合,方便使用
性能评估与对比
- 评估基准:使用其自研的 KontextBench(一个新的图像编辑评测集)
- 评估维度:
- 编辑精度(是否能实现用户期望的修改)
- 角色保持(人物面部/姿态的一致性)
- 多场景迁移(是否能适应复杂背景与构图)
- 对比模型:
- 开源模型:
- Bytedance Bagel(文生图+编辑混合模型)
- HiDream-E1-Full(开源扩散图像编辑模型)
- 闭源模型:
- Google’s Gemini-Flash Image
- 开源模型:
- 结果:Kontext [dev] 在多项任务中人类偏好得分优于上述所有模型,并由第三方机构 Artificial Analysis 独立验证。
技术细节与优化
与 NVIDIA 合作,构建了专门针对全新 NVIDIA Blackwell 架构优化的 TensorRT 权重,该架构大幅提升推理速度并降低内存使用,同时保持高质量的图像编辑性能。
推理优化:
- 与 NVIDIA 合作,为最新的 Blackwell 架构(B100 GPU)定制推理优化:
- 提供 FP16、BF16、FP8、FP4 等低精度权重
- 极大降低延迟与显存需求,适配边缘设备部署
商业许可机制
- 推出自助购买平台(Self-Serve Portal)
- 支持在线获取商业授权,包括:
- FLUX.1 Kontext [dev]
- FLUX.1 Tools [dev](辅助图像处理)
- FLUX.1 [dev](文本生成图像模型)
模型下载:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
声明:本站资源来自会员发布以及互联网公开收集,不代表本站立场,仅限学习交流使用,请遵循相关法律法规,请在下载后24小时内删除。 如有侵权争议、不妥之处请联系本站删除处理! 请用户仔细辨认内容的真实性,避免上当受骗!







