この記事の要点
• FluxはStable Diffusion開発者が設立したBlack Forest Labsの高品質AI画像生成モデル
• FLUX.2で最大10枚の参照画像によるマルチリファレンスが可能に
• 4メガピクセル高解像度生成、業界最高水準のテキスト描画
• Meta・Adobe・NVIDIAとの大型パートナーシップで業界地位を確立
Fluxとは
Flux(FLUX.1 / FLUX.2)は、ドイツのBlack Forest Labs(BFL)が開発したテキストから画像への生成モデルです。BFLは2024年にStability AIの元従業員であるRobin Rombach氏らによって設立されました。
Robin Rombach氏はStable Diffusionの生みの親として知られており、画像生成AI分野において世界でもトップクラスの研究者です。BFLの設立はAI画像生成コミュニティに大きな注目を集め、リリース直後からMidjourney・DALL-E 3と並ぶ業界標準モデルとして認識されています。
特徴: オープンソースとプロプライエタリの両方のモデルを提供し、自社インフラでの運用からAPI利用まで柔軟な選択肢があります。
Black Forest Labs(BFL)の歴史と背景
創業の経緯
2024年、Stability AIで働いていたRobin Rombach(Stable Diffusionの主要開発者)、Andreas Blattmann、Dominik Lorenz、Patrick Esser、Björn Ommer(LDM論文の著者陣)らがBlack Forest Labsを設立しました。
Stability AIでの経験と研究成果を活かし、より高品質・高効率な画像生成モデルを開発することがミッションです。ドイツのフライブルクを拠点としており、欧州発のAIスタートアップとして注目を集めています。
資金調達と成長
- 2024年8月: シードラウンドで3100万ドル調達(a16z主導)
- 2025年: Meta・Adobe・NVIDIAとの大型パートナーシップ締結
FLUX.1(2024年リリース)
FLUX.1は2024年8月のBFL創業と同時にリリースされた初代モデルです。
モデルラインナップ
| モデル | ライセンス | 用途 |
|---|---|---|
| FLUX.1 Pro | プロプライエタリ(API) | 商用・本番環境 |
| FLUX.1 Dev | 非商用(オープンウェイト) | 研究・開発 |
| FLUX.1 Schnell | Apache 2.0(オープンソース) | 高速生成・商用可 |
FLUX.1 Schnell はわずか1〜4ステップで高品質画像を生成でき、Stable DiffusionやMidjourneyと比べて大幅に高速な生成を実現しました。
FLUX.1 Tools(2024年11月)
- Flux.1 Fill: インペインティング(画像の一部を変更)・アウトペインティング(画像を外側に拡張)
- Flux.1 Depth: 深度マップを参照して構図を保ちつつ画像スタイルを変更
- Flux.1 Canny: エッジ(輪郭)情報を保ちつつ画像を再生成
- Flux.1 Redux: 既存画像とテキストプロンプトをミキシングして新しい画像を生成
FLUX.2(2025年11月リリース)
FLUX.1から大幅に進化した最新世代モデルです。
モデルラインナップ
- FLUX.2 Pro: 商用API向け最高品質モデル
- FLUX.2 Flex: コスト効率を重視した柔軟な用途向け
- FLUX.2 Dev: 研究・開発者向け(非商用)
- FLUX.2 Klein: Apache 2.0ライセンスのオープンソース版(Schnellの後継)
主な改善点
| 機能 | FLUX.1 | FLUX.2 |
|---|---|---|
| 参照画像 | 1枚 | 最大10枚(マルチリファレンス) |
| 解像度 | 1メガピクセル | 4メガピクセル |
| テキスト描画 | 基本レベル | 高精度タイポグラフィ |
| 一貫性維持 | △ | ◎(キャラクター・スタイル) |
| プロンプト理解 | ◎ | ◎(さらに精密化) |
ポイント: FLUX.2のマルチリファレンス機能は、Webコミック・ゲームキャラクター・商品カタログなどシリーズものの画像制作で特に威力��発揮します。
マルチリファ��ンス機能(FLUX.2の目玉機能)
最大10��の参照画像��入力し、以��の要素を一貫して維持できます:
- キャラクターの一貫性: 同一人物・キャラクターを別シーンでも統一した外見で生成
- スタイルの一貫性: 特定のイラストスタイルや世界観を複数画像に適用
- レイアウトの一貫性: 構図のパターンを参照して類似構図で生成
この機能はWebコミック・ゲームのキャラクターデザイン・商品カタログなど、シリーズものの画像制作で特に威力を発揮します。
主な機能の詳細
テキスト描画(Typography)
従来のAI画像生成モデルの弱点だった「画像内のテキスト描画」において、FLUX.2は大幅な改善を実現しました。ロゴ入り商品画像、スローガン付きバナー広告、書籍カバーデザインなど、文字が重要な用途での活用が広がっています。
フォトリアリズム
FLUX.2 Proは現在市場で最高レベルのフォトリアリズムを誇り��す。人物の肌の質感、光の反射、ボケ感など、プロカメラマンが撮影したような画像をテキストだけで生成できます。
APIを使った実装例
BFL API(公式API)を使ったPython実装
import requests
import time
API_KEY = "YOUR_BFL_API_KEY"
BASE_URL = "https://api.bfl.ai"
def generate_image(prompt: str, model: str = "flux-pro-1.1") -> str:
"""BFL APIで画像を生成してURLを返す"""
# 生成リクエスト送信
response = requests.post(
f"{BASE_URL}/v1/{model}",
headers={"x-key": API_KEY, "Content-Type": "application/json"},
json={
"prompt": prompt,
"width": 1024,
"height": 1024,
"steps": 20,
"guidance": 3.5,
"output_format": "jpeg"
}
)
task_id = response.json()["id"]
print(f"生成タスクID: {task_id}")
# ポーリングで結果を待つ
while True:
result = requests.get(
f"{BASE_URL}/v1/get_result",
headers={"x-key": API_KEY},
params={"id": task_id}
).json()
if result["status"] == "Ready":
image_url = result["result"]["sample"]
print(f"画像URL: {image_url}")
return image_url
elif result["status"] == "Failed":
raise Exception(f"生成失敗: {result}")
print(f"ステータス: {result['status']} - 待機中...")
time.sleep(2)
# 使用例
image_url = generate_image(
prompt="A photorealistic portrait of a Japanese woman in traditional kimono, "
"soft natural lighting, shallow depth of field, 85mm lens",
model="flux-pro-1.1"
)
Replicate APIを使った実装(代替手段)
import replicate
output = replicate.run(
"black-forest-labs/flux-schnell",
input={
"prompt": "東京の夜景、超高層ビル、ネオンライト、フォトリアリスティック",
"num_outputs": 1,
"aspect_ratio": "16:9",
"output_format": "webp",
"output_quality": 90,
"disable_safety_checker": False
}
)
# 出力URLから画像をダウンロード
import requests
image_data = requests.get(output[0]).content
with open("tokyo_night.webp", "wb") as f:
f.write(image_data)
print("画像を保存しました: tokyo_night.webp")
インペインティング(Flux Fill)の使用例
import base64
import requests
def encode_image(path: str) -> str:
with open(path, "rb") as f:
return base64.b64encode(f.read()).decode()
# 既存画像の一部を変更
response = requests.post(
"https://api.bfl.ai/v1/flux-pro-1.0-fill",
headers={"x-key": "YOUR_API_KEY"},
json={
"prompt": "A beautiful garden with cherry blossoms",
"image": encode_image("original.jpg"),
"mask": encode_image("mask.png"), # 白=変更対象、黒=保持
"steps": 30,
"guidance": 30
}
)
料金
API料金(従量課金)
| モデル | 料金 | 備考 |
|---|---|---|
| FLUX.2 Pro | $0.03/メガピクセル | 最高品質・商用向け |
| FLUX.1 Pro 1.1 | $0.04/画像(1MP) | 高品質・商用向け |
| FLUX.1 Pro 1.0 | $0.05/画像(1MP) | 旧世代Pro |
| FLUX.1 Dev | $0.025/画像 | 開発・テスト向け(非商用) |
| FLUX.1 Schnell | $0.003/画像 | 高速・低コスト |
計算例:
- 1024×1024(1MP)画像を100枚生成 → $0.03 × 100 = $3.00(FLUX.2 Pro使用時)
- 同じ条件でSchnell使用時 → $0.003 × 100 = $0.30
セルフホスト(コスト比較)
実践メモ: FLUX.1 SchnellはApache 2.0ライセンスのため、自社GPU環境で無料運用可能です。プロトタイプにはSchnell、本番にはProという使い分けが一般的です。
FLUX.1 SchnellはApache 2.0ライセンスのため、自社GPU環境で無料運用可能です。
- NVIDIA A100(40GB): 約1〜2秒/枚(Schnell)
- RTX 4090: 約2〜4秒/枚(Schnell)
商用ライセンス
FLUX.2 Devの商用利用には別途ライセンス契約が必要です。月間使用量に応じた料金体系で、APIの使用量を自動トラッキングして管理できます。
競合ツールとの比較
| 項目 | FLUX.2 Pro | Midjourney v6 | DALL-E 3 | Stable Diffusion 3.5 |
|---|---|---|---|---|
| フォトリアリズム | ★★★★★ | ★★★★☆ | ★★★★☆ | ★★★★☆ |
| テキスト描画 | ★★★★★ | ★★★☆☆ | ★★★★☆ | ★★★☆☆ |
| プロンプト追従性 | ★★★★★ | ★★★★☆ | ★★★★★ | ★★★★☆ |
| 生成速度 | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | ★★★★☆ |
| API利用可否 | ◎ | △(非公式) | ◎ | ◎ |
| オープンソース | ◎(Klein) | ✗ | ✗ | ◎ |
| 料金 | 従量課金 | $10〜/月 | OpenAI従量 | 無料〜 |
| カスタマイズ性 | ◎ | △ | △ | ◎ |
| 商用ライセンス | ◎ | ◎ | ◎ | ◎ |
Fluxの強み: フォトリアリズム・テキスト描画・オープンソース版の存在・API柔軟性 Midjourneyの強み: コミュニティ・使いやすさ・独特のアーティスティックスタイル DALL-E 3の強み: ChatGPT連携・安全フィルタの精度・日本語プロンプト対応
パートナーシップ
主要な提携(2025年)
| パートナー | 内容 |
|---|---|
| Meta | 1億4000万ドルの複数年パートナーシップ(初年度3500万ドル)。MetaのAIインフラにFluxを組み込み |
| Adobe | Photoshopのベータ版Generative FillでFlux.1 Kontext Proが利用可能 |
| NVIDIA | Blackwellアーキテクチャの基盤モデルとして採用。RTX 4090でのローカル実行に最適化 |
| Hugging Face | モデルの配布・デモ環境を提供 |
| Replicate | クラウドAPIとして提供 |
アクセス方法
1. BFL公式API利用
公式サイト(bfl.ai)でAPIキーを取得し、本番ワークロードに対応したスケーラブルなアクセスが可能です。SLAが必要な商用プロジェクトに最適です。
2. セルフホスト(オープンウェイトモデル)
FLUX.1 Dev・FLUX.2 KleinなどのオープンウェイトモデルをローカルGPUまたは自社クラウドで運用できます。ComfyUI・Automatic1111などのUIフレームワークと組み合わせることで、高度なカスタマイズが可能です。
# ComfyUI 0.2 / Python 3.10+
# https://github.com/comfyanonymous/ComfyUI
pip install comfy-cli
comfy install
comfy model download --url https://huggingface.co/black-forest-labs/FLUX.1-dev
3. サードパーティプラットフォーム
| プラットフォーム | 特徴 |
|---|---|
| Replicate | シンプルなAPI、従量課金 |
| Hugging Face | 無料枠あり、開発者向け |
| fal.ai | 高速推論に特化 |
| Together AI | 企業向けSLA |
エンジニア・クリエイター向けの活用方法
1. ECサイトの商品画像自動生成
def generate_product_images(product_name: str, colors: list[str]) -> list[str]:
"""商品の複数カラーバリエーション画像を一括生成"""
image_urls = []
for color in colors:
prompt = (
f"Product photography of {product_name}, {color} color, "
"white background, professional studio lighting, "
"sharp focus, high resolution commercial photo"
)
url = generate_image(prompt, model="flux-pro-1.1")
image_urls.append(url)
return image_urls
# 使用例: Tシャツの5色展開を一括生成
urls = generate_product_images(
"cotton t-shirt",
["red", "blue", "black", "white", "navy"]
)
2. ゲームアセットの大量生成
インディーゲーム開発でのキャラクタースプライト、背景、UIアイコンの一括生成に活用できます。一貫したスタイルで複数アセットを生成するには、スタイルガイドとなる参照画像をシステムプロンプトに含めます。
3. マーケティング素材の自動化
A/Bテスト用のバナー広告を複数バリエーション自動生成し、パフォーマンスデータに基づいて勝者を選ぶワークフローを構築できます。
4. Stable Diffusionからの移行
既存のSD用プロンプトはFluxでも概ね動作しますが、以下の点に注意が必要です:
注意: 既存のStable Diffusion用LoRAやControlNetはFluxではそのまま使えません。FLUX専用版が必要です。
- LoRA・ControlNetなどのSDアドオンはFLUX専用版が必要
- ネガティブプロンプトの概念がFluxでは不要(プロンプトで直接指定)
- ステップ数はSD(20〜50)より少なくて済む(Schnellなら1〜4ステップ)
国内(日本)での利用状況・活用例
日本語プロンプトの対応状況
Fluxは日本語プロンプトをある程度理解しますが、英語プロンプトの方が精度が高い傾向があります。日本語でプロンプトを書く場合は、主要な要素は英語で補足するとよいでしょう。
推奨: 英語主体 + 日本語コンセプト補足
- “Anime style illustration of a Japanese high school girl in Harajuku fashion, kawaii aesthetic, pastel colors, detailed background”
日本語のみは動作するが精度やや低:
- “原宿ファッションの日本の女子高生、アニメスタイルのイラスト”
日本での主な活用シーン
- マンガ・イラスト制作補助: 背景や小物のラフスケッチ生成。作家がキャラクターを描き、背景をFluxで生成するハイブリッドワークフロー
- ゲームグラフィック: 国内インディーゲーム開発者がキャラクターデザインのプロトタイプ作成に活用
- 広告クリエイティブ: デジタル広告のバナー画像をAIで大量生成し、ABテストに活用
- 同人・創作活動: 二次創作のファンアート制作補助(商用利用規約に注意)
メリット・デメリットの詳細分析
メリット
- 業界最高水準のフォトリアリズム: 現在の主要モデルの中でリアルな人物・風景描写が最高レベル
- 優れたテキスト描画: 画像内の文字を正確に描画できる(他モデルの大きな弱点を克服)
- オープンソース版の存在: Schnell・Kleinはローカル実行・商用利用が無料
- 柔軟なアクセス方法: 公式API・セルフホスト・サードパーティと複数の選択肢
- 強力なツール群: Fill・Depth・Canny・Reduxで画像編集も対応
- 大手パートナーシップ: Adobe・Meta・NVIDIAとの連携で将来性が高い
デメリット
- 高コスト(Pro): FLUX.2 Proは競合と比べてやや高め
- 生成速度(Proモデル): SchnellやSD Turboと比べて遅い
- セーフティフィルタ: 過剰にフィルタリングされるケースがある
- ComfyUI等との設定複雑さ: セルフホストは初心者には難しい
- 日本語プロンプト対応: 完全ではなく英語の方が精度が高い
将来展望・ロードマップ
BFLは以下の領域への投資を継続しています:
- 動画生成モデル: Fluxの動画版(text-to-video)の開発・リリースを計画中
- リアルタイム生成: インタラクティブな用途向けに生成速度をさらに改善
- 3D生成: テキストから3Dモデルを生成する機能の研究開発
- ファインチューニングサービス: 企業向けのカスタムモデル訓練サービスの展開
Meta・Adobe・NVIDIAとのパートナーシップにより、各プラットフォームへのネイティブ統合が進む見込みで、クリエイターや開発者にとってより使いやすい環境が整備される方向性です。
よくある質問(Q&A)
Q1. FLUX.1 SchnellとFLUX.1 Proはどちらを選べばいいですか? A1. 速度重視・コスト重視なら Schnell(Apache 2.0、商用可)、品質重視の商用プロジェクトなら Pro が最適です。開発中のプロトタイプはSchnell、本番環境ではProという使い分けが一般的です。
Q2. ComfyUIでFluxを使う場合のVRAM要件は? A2. FLUX.1(12Bパラメータモデル)をFP16で実行するには約24GB VRAMが必要です。8bit量子化(GGUF形式)を使えば12〜16GBまで削減可能で、RTX 4090(24GB)での実行が推奨されます。
Q3. Stable Diffusionのファインチューニングモデル(LoRA)はFluxでも使えますか? A3. 既存のSD用LoRAはそのままでは使えません。Flux専用のLoRAを別途用意するか、Flux向けのファインチューニングを行う必要があります。Kohya-ssなどのツールでFLUX.1 Devのファインチューニングが可能です。
Q4. FLUX.2 DevとProの違いは何ですか? A4. Proは商用利用可能なAPIモデルです。Devはオープンウェイトで研究・開発用途向け(非商用)。品質はほぼ同等ですが、商用プロジェクトにはProまたは別途商用ライセンスが必要です。
Q5. 生成した画像の著作権は誰に帰属しますか? A5. BFLの利用規約上、有料APIで生成した画像はユーザーが権利を持ちます。ただし、著作権法の観点ではAI生成画像の権利帰属は各国の法制度によって異なります。商用利用時は弁護士への確認を推奨します。
Q6. Adobeとの連携でPhotoshopから直接使えますか? A6. 2025年時点でPhotoshopのGenerative Fill(ベータ)にFlux.1 Kontext Proが統合されています。Adobe Creative Cloudのサブスクリプション内で利用可能になる予定です。
Q7. APIのレート制限はありますか? A7. BFLの公式APIには同時リクエスト数の制限がありますが、スケールが必要な場合はエンタープライズプランへの問い合わせが推奨されます。Replicateなどのサードパーティ経由での利用でも制限は異なります。
推奨度評価(用途別)
| 用途 | 推奨度 | コメント |
|---|---|---|
| フォトリアリスティック画像 | ★★★★★ | 業界最高水準の品質 |
| テキスト入り画像(バナー等) | ★★★★★ | テキスト描画が他モデルより圧倒的に優秀 |
| ゲームアセット生成 | ★★★★☆ | APIで自動化しやすい |
| イラスト・アニメ調 | ★★★☆☆ | Midjourneyの方が向いている場合もある |
| 個人の趣味・制作 | ★★★★☆ | Schnellなら無料で商用利用可能 |
| 大規模商用運用 | ★★★★☆ | APIコストとSLA要件を要確認 |
公式リンク
まとめ
Fluxは、Stable Diffusionの開発者が次世代モデルとして開発した高品質AI画像生成モデルです。FLUX.2ではマルチリファレンス対応(最大10枚の参照画像)、4メガピクセル高解像度生成、テキスト描画の大幅改善など、他モデルを大きくリードする機能が搭載されています。
オープンソース版(Schnell・Klein)から商用API(Pro)まで幅広い選択肢があり、Meta・Adobe・NVIDIAとの大型提携により業界での地位を確立しています。フォトリアリズムとテキスト描画の品質で現在市場最高水準を誇り、ECサイトの商品画像、広告クリエイティブ、ゲームアセットなど多様な商用用途での活用が広がっています。
参考リソース
- Black Forest Labs 公式サイト
- BFL APIドキュメント
- GitHub: black-forest-labs/flux
- Hugging Face: Black Forest Labs
- Replicate: FLUX models