Lanzamiento de OpenAI GPT-5.5: características, puntos de referencia y aumento de precio

0
21


OpenAI lanzó GPT-5.5 el jueves, con el nombre en código “Spud”, describiéndolo como su modelo más inteligente e intuitivo hasta la fecha. La compañía afirma que el modelo lidera en 14 puntos de referencia frente a rivales de Anthropic y Google. Ese liderazgo en puntos de referencia viene acompañado de una estructura de precios que se ha duplicado en comparación con el GPT-5.4 del mes pasado.

Características del lanzamiento de OpenAI GPT-5.5: puntos de referencia, velocidad y manejo de tareas autónomas

Las características del lanzamiento de OpenAI GPT-5.5 muestran ganancias impresionantes en puntos de referencia especializados de razonamiento y matemáticas, consolidando su posición en la cima de la escalera de rendimiento a pesar del aumento en el costo de acceso.

OpenAI describe GPT-5.5 como excelente en la escritura y depuración de código, realización de investigaciones, creación de documentos y hojas de cálculo, y ejecución de tareas en diferentes herramientas sin necesidad de indicaciones paso a paso. La compañía posiciona al modelo como capaz de actuar como un “jefe de personal” para el trabajo agéntico.

Greg Brockman, cofundador y presidente de OpenAI, resumió el cambio central del modelo: “Lo que es realmente especial de este modelo es cuánto más puede hacer con menos orientación”. Agregó: “Es mucho más intuitivo de usar. Puede mirar un problema poco claro y descubrir qué debe suceder a continuación”.

Brockman también describió el alcance directamente: “Es extremadamente bueno en codificación. También es excelente en trabajo informático más amplio, uso de computadoras, investigación científica: estos tipos de aplicaciones que son cuellos de botella muy inteligentes”.

Las velocidades de generación de tokens han aumentado un 20% debido a la optimización, y OpenAI dice que la latencia por token coincide con GPT-5.4 a pesar del tamaño del modelo más grande. En el punto de referencia Expert-SWE, un conjunto de tareas de ingeniería de software que un experto humano tarda una mediana de 20 horas en completar, GPT-5.5 publica el resultado más alto de OpenAI hasta la fecha.

En Terminal-Bench 2.0, OpenAI informa que GPT-5.5 obtiene una puntuación del 82,7%. El rival de OpenAI, Anthropic, lanzó Opus 4.7 solo una semana antes; ese modelo obtiene una puntuación del 69,4% en la misma prueba. El Mythos Preview de Anthropic, con acceso muy restringido, obtiene una puntuación del 82,0%, lo que lo coloca justo debajo de la marca de GPT-5.5. En todos los puntos de referencia comparados, OpenAI afirma que GPT-5.5 lidera 14, Opus 4.7 lidera 4 y Google Gemini 3.1 Pro lidera 2.

Amelia “Mia” Glaese, vicepresidenta de Investigación en OpenAI, dijo: “Definitivamente es nuestro modelo más fuerte hasta ahora en codificación, tanto medido por puntos de referencia como según la retroalimentación que hemos obtenido de socios de confianza, así como nuestra propia experiencia”.

Los usuarios de acceso temprano informaron resultados notables. Pietro Schirano, CEO de MagicPath, dijo que GPT-5.5 fusionó una rama con cientos de cambios de refactorización en 20 minutos. Dan Shipper, CEO de Every, lo llamó “el primer modelo de codificación que he usado que tiene una claridad conceptual seria”. Un ingeniero anónimo en NVIDIA expresó la dependencia de manera simple: “Perder el acceso a GPT-5.5 se siente como si me hubieran amputado una extremidad”.

En investigación científica, Derya Unutmaz, profesora en el Laboratorio Jackson para Medicina Genómica, utilizó GPT-5.5 Pro para analizar 28.000 genes en una sola sesión. Brandon White, CEO de Axiom Bio, dijo que “los fundamentos del descubrimiento de fármacos cambiarán para fin de año”.

Las brechas reales: costos, restricciones y puntos de referencia que cortan en ambos sentidos

El aumento de precios es la barrera más inmediata. GPT-5.4 costaba $2,50 por millón de tokens de entrada y $15,00 por millón de tokens de salida. GPT-5.5 duplica ambas cifras: $5,00 de entrada y $30,00 de salida. GPT-5.5 Pro se sitúa en $30,00 de entrada y $180,00 de salida por millón de tokens, una capa dirigida a investigación y uso empresarial de alto valor.

En Codex, el producto para desarrolladores de OpenAI, un modo Rápido ofrece 1,5 veces la velocidad de generación estándar, pero con un recargo de precio de 2,5 veces. Los equipos que ejecutan cargas de trabajo de producción a gran escala necesitarán sopesar si la ganancia de velocidad justifica ese costo múltiple antes de comprometerse.

OpenAI reconoce que GPT-5.5 va por detrás de Opus 4.7 y Mythos Preview en algunos puntos de referencia. La compañía también dice que el modelo lleva barreras de seguridad más estrictas debido a sus capacidades ampliadas, una variable adicional para equipos con requisitos de cumplimiento especializados o contextos de implementación sensibles.

Según Axios, OpenAI ha estado informando a agencias federales, gobiernos estatales y aliados de Five Eyes sobre sus capacidades GPT-5.4-Cyber bajo un programa de acceso escalonado. El papel de GPT-5.5 en ese ecosistema aún no se ha hecho completamente público, y cómo la compañía gestiona el acceso allí determinará qué organizaciones pueden realmente usar las aplicaciones más sensibles del modelo.

Te podría interesar:

Contexto externo: acceso gubernamental, controversia de competidores y momento de la industria

Según Axios, OpenAI lanzó GPT-5.5 una semana después de que Anthropic lanzara Opus 4.7, un momento que se lee como una respuesta deliberada. Ambas compañías están compitiendo simultáneamente por contratos cibernéticos gubernamentales, lo que agrega una capa de maniobra estratégica a lo que parece ser un lanzamiento de modelo estándar en la superficie.

El Mythos Preview de Anthropic, el modelo que GPT-5.5 supera por poco en Terminal-Bench 2.0, tiene sus propias complicaciones de acceso. Según TechCrunch, Mythos experimentó controversia esta semana después de un informe de acceso no autorizado al programa. Anthropic ya había restringido la liberación a aproximadamente 40 organizaciones, citando riesgos cibernéticos, lo que le dio a OpenAI una apertura a corto plazo con compradores empresariales y gubernamentales que buscan una alternativa más accesible.

El Gemini 3.1 Pro de Google, que lidera solo 2 de los puntos de referencia rastreados, es la tercera parte clara en este conjunto de comparación. Cómo y cuándo responde Google sigue siendo una variable abierta para las organizaciones que evalúan estrategias de adquisición de múltiples modelos o diversificación de proveedores.

Según CNET, OpenAI utilizó GPT-5.5 para ayudar a construirlo durante el proceso de desarrollo, un detalle que Brockman confirmó. Mark Chen, director de investigación de OpenAI, describió el objetivo a corto plazo de la compañía como tener a los humanos actuar como “orquestadores” de la investigación, en lugar de ser reemplazados por ella.

Qué observar antes de migrar a GPT-5.5

La duplicación de precios es el primer punto de decisión. A $30,00 de salida por millón de tokens para la capa estándar, las organizaciones necesitarán datos de ROI medibles antes de cambiar las cargas de trabajo de GPT-5.4. El precio de salida de $180,00 de la capa Pro es efectivamente una propuesta solo para investigación y empresas para la mayoría de los equipos.

El panorama de acceso cibernético y gubernamental aún se está formando. OpenAI informó a aproximadamente 50 profesionales cibernéticos federales en Washington, D.C. la semana pasada, pero qué agencias obtienen acceso a las características más capaces de GPT-5.5, y bajo qué términos, no se ha hecho completamente público. Para contratistas de defensa e industrias reguladas, esa ambigüedad importa antes de cualquier compromiso con la plataforma.

Jakub Pachocki, científico jefe de OpenAI, ofreció una señal digna de notar: “En realidad, todavía tenemos margen para entrenar modelos significativamente más inteligentes que este”. Para las organizaciones que consideran una migración a largo plazo, esa declaración puede argumentar a favor de un período de evaluación más corto en lugar de un compromiso total a los precios actuales.

También hay informes que circulan sobre un mayor desarrollo de modelos ya en marcha en OpenAI, lo que sugiere que los precios y puntos de referencia de capacidad actuales podrían cambiar nuevamente en unos meses. Los equipos que esperaron antes de adoptar GPT-5.4 pueden encontrar que la misma lógica se aplica aquí.

Preguntas frecuentes – FAQ

¿Cómo afectarán las barreras de seguridad más estrictas de GPT-5.5 a la personalización para casos de uso empresarial específicos?

OpenAI ha indicado que, aunque las barreras de seguridad más estrictas pueden limitar algunas opciones de personalización, están trabajando en un programa de personalización escalonado que permitirá a las empresas ajustar el nivel de barreras según sus requisitos de cumplimiento específicos. Se espera que este programa se lance en el próximo trimestre. Están por venir detalles adicionales sobre las opciones de personalización y los costos asociados.

¿Cuáles son las implicaciones de la estructura de precios de GPT-5.5 para desarrolladores independientes y pequeñas empresas?

Aunque el precio de GPT-5.5 se ha duplicado en comparación con GPT-5.4, OpenAI está introduciendo un nuevo plan de precios escalonado que ofrecerá tarifas con descuento para usuarios de menor escala. Los desarrolladores independientes y las pequeñas empresas pueden esperar ver opciones más asequibles, potencialmente incluyendo un modelo de pago por uso, en las próximas semanas.

¿Se integrará GPT-5.5 con otras herramientas y servicios de OpenAI, como Codex, en el futuro próximo?

Sí, OpenAI planea integrar GPT-5.5 con Codex y otras herramientas para desarrolladores en los próximos meses. Se espera que la integración mejore las capacidades de estas herramientas, particularmente en áreas como la generación de código y la depuración. Se compartirán más detalles sobre el calendario de integración y los detalles específicos en la próxima Conferencia de Desarrolladores de OpenAI.





Source link