Hace menos de una semana FLUX.1 vio la luz dejando a los seguidores de la inteligencia artificial perplejos con la calidad de sus resultados
Ha aparecido casi de la nada y sin avisar, y ha revolucionado el mundo de la inteligencia artificial de generación de imágenes con sus resultados absolutamente fieles y una calidad digna de los modelos más profesionales.
Y es justo eso lo más llamativo, que todo lo que veamos a continuación es el resultado de un modelo recién salido hace apenas unos días, en continuo desarrollo y una versión 1.0 que hace que nos preguntemos: Si funciona así ahora, ¿hasta dónde llegará?
El origen de FLUX.1
El principio de todo es —inesperadamente— una empresa de aquí de Europa, concretamente alemana. Black Forest Labs fue fundada por un equipo de destacados investigadores y expertos en inteligencia artificial, muchos de los cuales trabajaron anteriormente en Stability AI, la empresa detrás de Stable Diffusion.
La startup se lanzó oficialmente el 1 de agosto de 2024 —está recién nacida a fecha de estas líneas—, con el objetivo de redefinir la inteligencia artificial generativa y establecer nuevos estándares en la creación de medios generativos, como imágenes y vídeos —próximamente—.
La empresa recibió una ronda de financiación inicial de 31 millones de dólares, liderada por Andreessen Horowitz, y cuenta con el respaldo de figuras destacadas de la industria, como Garry Tan, CEO de Y Combinator, y Timo Aila, investigador principal en Nvidia.
Esta impresionante ronda de financiación va a permitir a Black Forest Labs expandir sus capacidades y llevar sus innovaciones a un público global. Primero en imágenes como veremos hoy y más adelante, en formato vídeo.
Qué es FLUX.1
De manera muy resumida, FLUX.1 es la primera versión de este modelo de generación de imágenes, competidor directo de Dall-e o en particular de Midjourney. Pero tiene un par de peculiaridades que es conveniente destacar.
En primer lugar es absurdamente bueno entendiendo prompts complejos y largos, con varias líneas de peticiones. Puede mezclar dentro de la misma imagen diferentes ambientes, lo cual es complicado en otros modelos similares.
En segundo lugar es muy bueno añadiendo pequeños detalles —siempre que se lo pidamos— a las imágenes que generemos. De este modo es capaz de entender hasta lo más mínimo que queramos añadir a nuestra creación.
Y por otro lado, escribe como ninguna. Es extraordinariamente coherente escribiendo texto, tiene pequeños fallos de momento, pero para llevar menos de una semana accesible al público es increíble. Le esperan grandes cosas.
Cómo usar FLUX.1
Te voy a explicar de manera sencilla y rápida cómo usar FLIX.1 de forma totalmente gratuita —al menos de momento— para empezar a crear imágenes en menos de 5 minutos.
Paso 1: Entrar en su página web
Para empezar tenemos que ir a la web de Black Forest Labs, ya que FLUX como tal de momento no tiene ni web ni aplicación propia. Midjourney creó hace poco su propia página, pero con el modelo que nos ocupa tendremos que dar un rodeo.
Una vez en su página web, nada más entrar tienes que pulsar en el botón «Get FLUX» para que nos lleve al apartado del modelo de generación de imágenes.
Paso 2: Elegir el modelo
Llegados a este punto nos saldrá una página donde podremos elegir el modelo que queremos usar de los siguientes 3 que nos proponen. Vamos a empezar por desechar de momento el primero y el último y centrarnos en el DEV.
Modelo PRO. Este está pensado para usar su API y es de pago, y el modelo schnell es el más sencillo y listo para instalar en tu ordenador. Vamos a proceder a usarlo online y aademás totalmente gratis para nosotros, aunque quizás con algunas limitaciones.
El modelo a elegir es el FLUX.1 [dev]
Como se puede ver, puede accederse directamente desde el repositorio de GitHub, pero si quieres algo más sencillo y accesible podemos acceder al modelo en otras plataformas, para las cuales voy a decirte exactamente cómo hacerlo.
Huggingface
Desde este enlace que te dejo aquí podrás acceder directamente al modelo y empezar a escribir en el apartado que pone «Enter your prompt» e inmediatamente darle a Run para ejecutarlo y ver qué tal queda la imagen.
Replicate
Con la web de replicate pasa exactamente igual, con la diferencia de que tienes que registrarte a través de GitHub para usarlo, así que de momento no he llegado a probarlo por mi cuenta, ya que la opción anterior permite hacerlo sin registro.
Fal.ai
Esta de aquí es la última opción. El único problema que le he encontrado son las limitaciones para generar imágenes, y que, aunque es barato —40 peticiones por cada $1— tienes que pagar después de unas 5 ejecuciones.
Qué espero de FLUX.1
Para mí es toda una revolución, tanto por la capacidad de entender prompts extraordinariamente largos, tener infinidad de detalles y saber escribir de manera más o menos correcta. Creo que habrá que seguirlo de cerca.
[…] pasó con las imágenes. Desde aquellos primeros diseños con la primera versión de Dall-e hasta lo que es capaz de hacer Flux hoy por hoy hay un salto de calidad […]