Los investigadores de seguridad piratearon el calendario de Google usando IA y texto oculto en imágenes
La IA es una herramienta impresionante, y compañías como Google y OpenAI continúan mejorando y expandiendo lo que pueden hacer sus modelos. Al mismo tiempo, los chatbots de IA generativos también se están convirtiendo en objetivos más grandes para los malos actores, y ahora los investigadores de seguridad han encontrado una manera de piratear el calendario de Google de alguien usando texto oculto dentro de imágenes de alta resolución.
Investigadores de seguridad de Weblog Path of Bits afirman que pudieron aprovechar los sistemas de escala de imágenes que AI como Gemini usa para procesar imágenes agregadas a sus indicaciones. Esto permitió al grupo enviar un conjunto de instrucciones ocultas a la IA, que luego pudo recuperar información de una cuenta de Google Calendar y enviarla por correo electrónico a sí mismos, todo sin alertar al usuario.
Los ataques de escala de imágenes como este solían ser más comunes, y los investigadores señalan que «se usaron para el modelo de trasero, la evasión y el envenenamiento principalmente contra los sistemas de visión por computadora más antiguos que imponían un tamaño de imagen fijo». Este ataque se ha vuelto menos común, pero parece que se puede adoptar un enfoque related para enviar instrucciones ocultas a un modelo de idioma grande como el Géminis de Google, que plantea preocupaciones sobre la seguridad de la IA como Géminis y otras IA se mudan a nuestros hogares y Ai potencialmente avanza más allá de nuestra comprensión.
Cómo funciona el ataque con IA
Una exploit como esta funciona porque LLMS como GPT-5 y Gemini automáticamente redactan imágenes de alta resolución para procesarlas de manera más rápida y eficiente. Sin embargo, esta reducción de escala es cómo los investigadores pudieron aprovechar la IA y enviar instrucciones ocultas al chatbot. Si bien el proceso exacto puede cambiar en función del sistema, ya que cada sistema tiene un algoritmo de remuestreo de imagen diferente, todos proporcionan lo que los investigadores describen como «artefactos de alias» que pueden permitir que los patrones se oculten dentro de una imagen. Estos patrones solo aparecen cuando la imagen está reducida, ya que se vuelven más visibles gracias a los artefactos.
En el ejemplo que los investigadores proporcionaron, la imagen cargada en Géminis tiene secciones de fondo negro que se ponen rojos durante el proceso de remuestreo. Esto hace que el texto oculto con instrucciones aparezca cuando la imagen se vuelve a ver, que el chatbot verá y seguirá. En este caso, las instrucciones le dijeron al chatbot que verifique el calendario del usuario y envíe por correo electrónico cualquier evento próxima a la dirección de correo electrónico del investigador.
Esto podría no convertirse en un vector de ataque convencional para los piratas informáticos, pero teniendo en cuenta que ya han encontrado formas de Use invitaciones de calendario infectado para tomar el management de un hogar inteligentese necesita analizar cualquier posible amenaza para encontrar soluciones que protejan a los usuarios de la caída de la presa de los malos actores. Eso es especialmente cierto como Los piratas informáticos continúan usando IA para romper la IA de aterradoras formas nuevas.