The Obtain: AI Benchmarks y España’s Grid Blackout

No es fácil ser uno de los puntos de referencia favoritos de Silicon Valley.
SWE-Bench (pronunciado «Swee Bench») se lanzó en noviembre de 2024 como una forma de evaluar la habilidad de codificación de un modelo de IA. Desde entonces, se ha convertido rápidamente en una de las pruebas más populares de la IA. Una puntuación SWE-Bench se ha convertido en un pilar de los principales lanzamientos de modelos de Operai, Anthrope y Google, y fuera de los modelos de Basis, los finos de las empresas de IA están en constante competencia para ver quién puede elevarse por encima del paquete.
A pesar de todo el fervor, esta no es exactamente una evaluación veraz de qué modelo es «mejor». Los participantes han comenzado a jugar el sistema, lo que está presionando a muchos otros a preguntarse si hay una mejor manera de medir realmente el logro de AI. Lea la historia completa.
—Russell Brandom
¿La energía photo voltaic causó el apagón de España?
Aproximadamente al mediodía del lunes 28 de abril, las luces se apagaron en España. El apagón de la cuadrícula, que se extendió a partes de Portugal y Francia, afectó a decenas de millones de personas: se basaron en las luces, las redes celulares cayeron y las empresas cerraron por el día.
Más de una semana después, los funcionarios aún no están completamente seguros de lo que sucedió, pero algunos han sugerido que las energías renovables pueden haber jugado un papel, porque justo antes de que ocurriera la interrupción, el viento y la energía photo voltaic representaron alrededor del 70% de la generación de electricidad. Otros, incluidos los funcionarios del gobierno español, insisten en que es demasiado pronto para asignar la culpa.
Tomará semanas obtener el informe completo, pero sí sabemos algunas cosas sobre lo que sucedió. Aquí hay algunas conclusiones que podrían ayudar a nuestra crimson futura.