El nuevo generador de imágenes de IA de OpenAI es potente y está obligado a provocar

0
4o_image_gen_hero_3-1152x648.jpg


OpenAI afirma varias mejoras clave: los usuarios pueden refinar imágenes a través de la conversación mientras mantienen la consistencia visible; El sistema puede analizar imágenes cargadas e incorporar sus detalles en nuevas generaciones; Y ofrece un fotorrealismo más fuerte, aunque lo que constituye el fotorrealismo (por ejemplo, las imitaciones de las características de la cámara HDR, el nivel de detalle y el contraste de la imagen) pueden ser subjetivas.

Una captura de pantalla del modelo de generación de imágenes 4O de OpenAI en ChatGPT. Vemos una imagen generada por la IA existente de un bárbaro y un televisor, luego una solicitud para incendiar el televisor.


Crédito: Openai / Benj Edwards

En su publicación de weblog, OpenAI proporcionó ejemplos de usos previstos para el generador de imágenes, incluida la creación de diagramas, infografías, gráficos de redes sociales utilizando códigos de colour específicos, logotipos, carteles de instrucciones, tarjetas de presentación, fotos de inventory personalizadas con antecedentes transparentes, ediciones de fotos de usuarios o visualización de conceptos discutidos anteriormente en una conversación de chat.

Notablemente ausente: cualquier mención de los artistas y diseñadores gráficos cuyos trabajos podrían verse afectados por esta tecnología. Como Cubrimos a lo largo de 2022 y 2023El impacto laboral sigue siendo una preocupación principal entre los críticos de los gráficos generados por IA.

Manipulación de medios fluidos

Poco después de que Operai lanzó la generación de imágenes 4O, la comunidad de IA en X puso la función a prueba, descubriendo que es bastante capaz en Insertar la cara de alguien en una imagen existente, creando capturas de pantalla falsasy convirtiendo fotos de meme en el estilo de Estudio ghibli, Parque sur, sintió, Muppets, Rick y Morty, Tipo de familiay mucho más.

Parece que estamos entrando en una «realidad» de medios completamente fluidos cortesía de una herramienta que puede convertir sin esfuerzo los medios visuales entre los estilos. Los estilos también potencialmente invaden la propiedad intelectual protegida. Dado lo que el cofundador de Studio Ghibli Hayao Miyazaki tiene dijo anteriormente Sobre las obras de arte generadas por IA («Siento firmemente que esto es un insulto a la vida misma»), parece que sería poco possible que aprecie la precise moda de Ghibli generada por AI en X en este momento.



Un meme de Web convertido en el arte de estilo «Studio Ghibli» de Individuals On X.



Un meme de Web convertido en el arte de estilo «Studio Ghibli» de Individuals On X.



Un meme de Web convertido en el arte de estilo «Studio Ghibli» de Individuals On X.



Un meme de Web convertido en el arte de estilo «Studio Ghibli» de Individuals On X.

Para tener una concept de lo que 4o IG puede hacer nosotros mismos, realizamos algunas pruebas informales, incluidas algunas de las habituales bárbaros de CRT, reinas del universo y gatos que beben cerveza, que ya has visto arriba (y, por supuesto, el plato de encurtidos).

La interfaz CHATGPT con el nuevo modelo de imagen 4O es conversacional (como antes con Dall-E 3), pero puede sugerir cambios con el tiempo. Por ejemplo, tomamos la biografía EGA Pixel del autor (como lo hicimos con Modelo de Google la semana pasada) e intentó darle un cuerpo completo. Podría decirse que el modelo de imagen más limitado de Google hizo un trabajo mucho mejor que 4O IG.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *