El nuevo generador de imágenes de IA de OpenAI es potente y está obligado a provocar

OpenAI afirma varias mejoras clave: los usuarios pueden refinar imágenes a través de la conversación mientras mantienen la consistencia visible; El sistema puede analizar imágenes cargadas e incorporar sus detalles en nuevas generaciones; Y ofrece un fotorrealismo más fuerte, aunque lo que constituye el fotorrealismo (por ejemplo, las imitaciones de las características de la cámara HDR, el nivel de detalle y el contraste de la imagen) pueden ser subjetivas.

Una captura de pantalla del modelo de generación de imágenes 4O de OpenAI en ChatGPT. Vemos una imagen generada por la IA existente de un bárbaro y un televisor, luego una solicitud para incendiar el televisor.

Crédito: Openai / Benj Edwards

En su publicación de weblog, OpenAI proporcionó ejemplos de usos previstos para el generador de imágenes, incluida la creación de diagramas, infografías, gráficos de redes sociales utilizando códigos de colour específicos, logotipos, carteles de instrucciones, tarjetas de presentación, fotos de inventory personalizadas con antecedentes transparentes, ediciones de fotos de usuarios o visualización de conceptos discutidos anteriormente en una conversación de chat.

Notablemente ausente: cualquier mención de los artistas y diseñadores gráficos cuyos trabajos podrían verse afectados por esta tecnología. Como Cubrimos a lo largo de 2022 y 2023El impacto laboral sigue siendo una preocupación principal entre los críticos de los gráficos generados por IA.

Manipulación de medios fluidos

Poco después de que Operai lanzó la generación de imágenes 4O, la comunidad de IA en X puso la función a prueba, descubriendo que es bastante capaz en Insertar la cara de alguien en una imagen existente, creando capturas de pantalla falsasy convirtiendo fotos de meme en el estilo de Estudio ghibli, Parque sur, sintió, Muppets, Rick y Morty, Tipo de familiay mucho más.

Parece que estamos entrando en una «realidad» de medios completamente fluidos cortesía de una herramienta que puede convertir sin esfuerzo los medios visuales entre los estilos. Los estilos también potencialmente invaden la propiedad intelectual protegida. Dado lo que el cofundador de Studio Ghibli Hayao Miyazaki tiene dijo anteriormente Sobre las obras de arte generadas por IA («Siento firmemente que esto es un insulto a la vida misma»), parece que sería poco possible que aprecie la precise moda de Ghibli generada por AI en X en este momento.

Para tener una concept de lo que 4o IG puede hacer nosotros mismos, realizamos algunas pruebas informales, incluidas algunas de las habituales bárbaros de CRT, reinas del universo y gatos que beben cerveza, que ya has visto arriba (y, por supuesto, el plato de encurtidos).

La interfaz CHATGPT con el nuevo modelo de imagen 4O es conversacional (como antes con Dall-E 3), pero puede sugerir cambios con el tiempo. Por ejemplo, tomamos la biografía EGA Pixel del autor (como lo hicimos con Modelo de Google la semana pasada) e intentó darle un cuerpo completo. Podría decirse que el modelo de imagen más limitado de Google hizo un trabajo mucho mejor que 4O IG.

El nuevo generador de imágenes de IA de OpenAI es potente y está obligado a provocar

Manipulación de medios fluidos

El fabricante de ChatGPT prevé una oferta pública inicial de 1 billón de dólares a pesar de las importantes pérdidas trimestrales

La descarga: Presentamos: la nueva period de la conspiración

IntrCity SmartBus obtiene 30 millones de dólares con una valoración de 140 millones de dólares para profundizar su management en el mercado de viajes interurbanos de la India

Deja una respuesta Cancelar la respuesta

Los sutiles cambios de postemporada de Gausman mantienen alerta a los bateadores rivales

El partido liberal centrista holandés de Rob Jetten gana la carrera electoral codo a codo, según un análisis de votos

Vodacom señala un gran aumento en sus ganancias

Alyssa Healy no jugará la próxima Copa del Mundo ODI, Australia pierde la semifinal ante India

El fabricante de ChatGPT prevé una oferta pública inicial de 1 billón de dólares a pesar de las importantes pérdidas trimestrales

Manipulación de medios fluidos

Más historias

Deja una respuesta Cancelar la respuesta

Te pueden interesar