Black Forest Labs, il team originale dietro Stable Diffusion, ha annunciato l’uscita di Flux, il più grande modello open-source di text-to-image allo stato dell’arte disponibile finora. Flux spinge i confini della creatività e delle prestazioni con un impressionante numero di 12 miliardi di parametri, offrendo un’estetica paragonabile a Midjourney.
Grazie all’integrazione del motore di inferenza all’avanguardia di fal, è possibile eseguire i modelli Flux fino a 2 volte più velocemente rispetto all’eager torch. Ciò si traduce in tempi di elaborazione più rapidi mantenendo un’eccezionale qualità e dettaglio.
Differenze tra le Variazioni di Flux: Dev, Schnell e Pro
Flux.1 [dev]
- Licenza: Non commerciale, open-source.
- Prestazioni: Basato su un modello distillato dal Flux Pro, offre una qualità di output simile ma con una maggiore efficienza. È ideale per scopi di ricerca e sviluppo.
- Caratteristiche:
- Supporta la generazione di immagini ad alta qualità.
- Progettato per una maggiore aderenza ai prompt, paragonabile a modelli chiusi.
- Accessibile su Hugging Face, con pesi disponibili per l’uso.
Flux.1 [schnell]
- Licenza: Open-source, disponibile sotto licenza Apache 2.0.
- Prestazioni: Ottimizzato per la velocità, è progettato per l’uso locale e per progetti personali. Può funzionare fino a 10 volte più velocemente rispetto ad altri modelli standard.
- Caratteristiche:
- Eccellente per applicazioni che richiedono una rapida generazione di immagini.
- Mantiene una buona qualità visiva, sebbene possa essere meno dettagliato rispetto al modello Pro.
- Ideale per sviluppatori e hobbisti che desiderano un accesso rapido e flessibile.
Flux.1 [pro]
- Licenza: Closed-source, disponibile solo tramite API.
- Prestazioni: Considerato il modello di punta, offre prestazioni senza pari in termini di qualità visiva, dettaglio e diversità di output. È progettato per applicazioni professionali dove la qualità è fondamentale.
- Caratteristiche:
- Massima qualità di generazione di immagini, superando altri modelli come Midjourney e DALL·E 3.
- Eccellente aderenza ai prompt e capacità di generare immagini altamente dettagliate.
- Accesso tramite API, rendendolo adatto per integrazioni commerciali e professionali.