Operai acaba de burlarse de un nuevo modelo de IA de ‘peso abierto’: esto es lo que eso significa

Operai, la compañía detrás del common chatbot, Chatgptestá construyendo un nuevo modelo de IA. El modelo será un modelo de lenguaje de «peso abierto» con razonamiento, según el CEO Sam Altman, quien tuiteado sobre el desarrollo del lunes.
Un modelo de IA de «peso abierto» es una especie de punto medio entre los enfoques de código abierto y cerrado. Los pesos son cómo los modelos de IA aprenden y hacen conexiones: ciertas características o conexiones tienen más peso en un esfuerzo por reforzar información específica. Un modelo de peso abierto significa que sus pesos están disponibles públicamente, como el Comisión federal lo pone. Eso significa que los usuarios podrían ver estos pesos y cambiarlos sin volver a capacitar el modelo en nuevos datos.
Los modelos de peso abierto suelen ser más baratos para las empresas y les permite personalizar los modelos. Por ejemplo, una empresa podría cargar sus documentos internos a un modelo de peso abierto existente para incorporar esa información en sus resultados sin tener que construir todo desde cero.
Pero los modelos de peso abierto no son lo mismo que los modelos de código abierto. Como el nombre implica, un modelo de código abierto le permite ver de qué está hecho, el código fuente, a veces además de cómo está entrenado y ponderado. En un modelo de peso abierto, puede ver cómo el modelo hace conexiones, pero no necesariamente su código subyacente o contenido de capacitación. Se trata del grado de apertura. Dado el historial de OpenAI de no revelar lo que usa para entrenar a ChatGPT, es possible que el nuevo modelo de peso abierto brinde a la gente un vistazo detrás de la cortina, pero no mucho más.
Las compañías de IA están en una carrera acalorada, ya que cada una desarrolla una variedad de modelos para diferentes usos. El nuevo modelo de Openai está preparado para ser un competidor de los modelos de llamas de Meta, que son de código abierto. Mark Zuckerberg ha dicho repetidamente que la fuente abierta es la correcta avanzar para el desarrollo de IA. El nuevo modelo también se produce cuando los AI chinos como Deepseek luchan por el primer lugar. Según los informes, el modelo V3 más nuevo de Deepseek es liderando el paquetey también es un modelo de peso abierto. Los pesos abiertos y los modelos de código abierto podrían amenazar los modelos de suscripción de OpenAI al proporcionar a las empresas herramientas de IA más más baratas y personalizadas, por lo que la compañía parece estar haciendo movimientos para alcanzar su competencia.
No está claro exactamente cuándo se lanzará el nuevo modelo. Por ahora, Operai está invitando a los desarrolladores a enviar comentarios sobre lo que haría que el modelo sea el más útil para ellos. Puede contribuir con esa retroalimentación en esta forma En el sitio net de OpenAI.
Para más, consulte el Imágenes de AI de estudio de Studio Ghibli-Gibli hecho con el nuevo generador de imágenes de Chatgpt y nuestro revisión completa del chatbot.