Los pioneros de aprendizaje de refuerzo critican duramente el estado «inseguro» del desarrollo de la IA
 
                 
¿Quiénes son? Richard Sutton y Andrew Barto son pioneros del aprendizaje de refuerzo, una técnica de aprendizaje automático que utilizan modernos modelos de IA. Sutton a menudo se conoce como el «padre del aprendizaje de refuerzo» y sirve como profesor en la Universidad de Alberta. Barto es profesor emérito en la Universidad de Massachusetts. Ambos científicos no están particularmente satisfechos con la forma en que las empresas de IA están aplicando el trabajo de su vida.
Richard Sutton y Andrew Barto ganaron el Premio Turing de este año, considerado el Premio Nobel de Computación, por sus importantes contribuciones al desarrollo del aprendizaje automático. Los dos investigadores ahora están hablando en contra de Operai, Google y otras compañías de IA que lanzan un software program potencialmente peligroso para terminar con los clientes. Criticaron a ChatGPT como una máquina de hacer dinero que nunca producirá una inteligencia basic synthetic (AGI) que funcione.
Sutton y Barto desarrollaron el aprendizaje de refuerzo (RL) durante la década de 1980, inspirados en la psicología conductista. El aprendizaje de refuerzo es uno de los tres paradigmas básicos de aprendizaje automático, junto con el aprendizaje supervisado y no supervisado. Aprendizaje de refuerzo enseñanza Los agentes de IA, a través de prueba y error, para tomar decisiones que logren los resultados más óptimos, similares a cómo aprenden los humanos.
Operai, Google y otras corporaciones construyen sus plataformas AI con RL. Monetary Instances señala que Barto cree Que llevar este tipo de software program de IA a millones de personas sin salvaguardas es inherentemente incorrecto. Usando una metáfora, Sutton y Barto señalaron que la mayoría o todas las compañías de IA están construyendo un puente y probando su integridad estructural al abrirlo al público.
Barto cube que las prácticas de ingeniería de sonido sugieren que los desarrolladores intentan mitigar las consecuencias negativas de la tecnología. Ni Openai ni ninguna otra compañía centrada en AI lo están haciendo. Los modelos actuales de IA cometen errores, alucinando «hechos» inexistentes con confianza binaria, pero las compañías detrás de ellos están recolectando miles de millones de dólares en campañas de financiación sin precedentes.
«La concept de tener grandes centros de datos y luego cobrar una cierta cantidad para usar el software program es motivar cosas, y ese no es el motivo al que me suscribiría», dijo Barto.
Las empresas con fines de lucro solo buscan oportunidades para tomar dinero. El evento eventual de uno de ellos trayendo el primero (AGI) al mundo es simplemente alardear de los derechos; Incluso esos están aprovechados para aumentar las ventas.
Los defensores de Agi piensan que este tipo de inteligencia sobrehumana y digital está casi aquí y radicalmente revolucionar tecnología y todo lo demás. Sutton sugirió que AGI es solo una palabra de moda para las campañas de advertising. Barto comentó que las empresas que desarrollan IA necesitan obtener una mejor comprensión de cómo funciona la mente humana antes de que puedan construir sistemas de manera responsable con inteligencia a nivel humano.
 
                       
                       
                       
                       
                       
                      