Olvídese de AGI: Sam Altman celebra que ChatGPT finalmente haya seguido las reglas de formato de guión em

0
man_wrestling_with_robot_hand_2-1152x648.jpg



Cuando Altman celebra finalmente haber conseguido que GPT evite los guiones, en realidad está celebrando que OpenAI haya ajustado la última versión de GPT-5.1 (probablemente mediante aprendizaje por refuerzo o ajuste fino) para ponderar más las instrucciones personalizadas en sus cálculos de probabilidad.

Aquí hay una ironía sobre el management: dada la naturaleza probabilística del problema, no hay garantía de que el problema permanezca solucionado. Abierto AI actualiza continuamente sus modelos detrás de escena, incluso dentro del mismo número de versión, ajustando los resultados en función de los comentarios de los usuarios y las nuevas ejecuciones de capacitación. Cada actualización llega con diferentes características de salida que pueden deshacer ajustes de comportamiento previos, un fenómeno que los investigadores llaman «impuesto de alineación.”

Ajustar con precisión el comportamiento de una crimson neuronal aún no es una ciencia exacta. Dado que todos los conceptos codificados en la crimson están interconectados por valores llamados pesosajustar un comportamiento puede alterar otros de manera no deseada. Si se corrige el uso excesivo de em sprint hoy, la actualización de mañana (destinada a mejorar, digamos, las capacidades de codificación) podría traerlos de regreso sin darse cuenta, no porque OpenAI los quiera allí, sino porque esa es la naturaleza de intentar dirigir un sistema estadístico con millones de influencias en competencia.

Esto lleva a una pregunta implícita que mencionamos anteriormente. Si controlar el uso de la puntuación sigue siendo una lucha que podría volver a surgir en cualquier momento, ¿qué tan lejos estamos del AGI? No podemos saberlo con certeza, pero parece cada vez más possible que no surja únicamente de un modelo de lenguaje grande. Esto se debe a que AGI, una tecnología que replicaría la capacidad de aprendizaje basic humana, probablemente requeriría una verdadera comprensión y una acción intencional autorreflexiva, no una coincidencia de patrones estadísticos que a veces se alinea con las instrucciones si se tiene suerte.

Y hablando de tener suerte, algunos usuarios todavía no tienen suerte controlando el uso del tablero fuera de la función «instrucciones personalizadas». Cuando se le dijo en el chat que no usara guiones dentro de un chat, ChatGPT actualizó una memoria guardada y respondió a un usuario de X: «Entendido. De ahora en adelante me ceñiré estrictamente a guiones cortos».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *