Que es OpenAI o3
En diciembre de 2024, OpenAI anuncio el modelo o3 en el dia final del evento “12 Days of OpenAI”. Este modelo, sucesor de o1, ha logrado avances significativos en capacidad de razonamiento, registrando puntuaciones impresionantes especialmente en el benchmark ARC-AGI.
Referencia: OpenAI - Anuncio de o3
Resultados de Benchmark Impresionantes
ARC-AGI (Razonamiento Abstracto)
| Modelo | Puntuacion |
|---|---|
| GPT-4o | 5% |
| o1 | 32% |
| o3 (low compute) | 75.7% |
| o3 (high compute) | 87.5% |
| Promedio humano | 85% |
o3 se convirtio en el primer modelo de IA en superar el promedio humano.
Otros Benchmarks
Matematicas (AIME 2024): 96.7%
Codificacion (Codeforces): 2727 Elo (percentil 99.95)
Ciencia (GPQA Diamond): 87.7%
Referencia: ARC Prize - Resultados de o3
Caracteristicas Tecnicas de o3
1. Ajuste de Cantidad de Computo
Una caracteristica de o3 es que la cantidad de computo durante la inferencia puede ajustarse.
from openai import OpenAI
client = OpenAI()
# Modo de bajo computo (rapido, bajo costo)
response_fast = client.chat.completions.create(
model="o3-mini",
reasoning_effort="low",
messages=[{"role": "user", "content": "Una pregunta simple"}]
)
# Modo de alto computo (alta precision, alto costo)
response_precise = client.chat.completions.create(
model="o3",
reasoning_effort="high",
messages=[{"role": "user", "content": "Una demostracion matematica compleja"}]
)
2. o3-mini
Una version mas eficiente que supera a o1 en muchas tareas.
| Comparacion | o1-mini | o3-mini |
|---|---|---|
| AIME 2024 | 70% | 84% |
| Velocidad | Referencia | Aproximadamente 2x |
| Costo | Referencia | Aproximadamente 40% de reduccion |
Referencia: Documentacion de API de OpenAI
Enfoque en Seguridad
Deliberative Alignment
o3 introduce un nuevo mecanismo de seguridad llamado “alineacion deliberativa”.
1. Analizar la intencion del usuario
2. Evaluar riesgos potenciales
3. Confirmar consistencia con politicas de seguridad
4. Generar respuesta apropiada
Resultados de Pruebas de Seguridad
- Resistencia a generacion de contenido danino: 99.2%
- Resistencia a jailbreak: 98.5%
- Prevencion de generacion de desinformacion: 97.8%
Como Usar
Uso via API
from openai import OpenAI
client = OpenAI()
# Razonamiento complejo usando o3
response = client.chat.completions.create(
model="o3",
messages=[
{
"role": "user",
"content": """
Por favor resuelve el siguiente puzzle:
Hay una cuadricula de 3x3, cada celda contiene un numero del 1-9.
Haz que la suma de cada fila y cada columna sea 15.
"""
}
]
)
print(response.choices[0].message.content)
Uso en ChatGPT
Los usuarios de ChatGPT Plus/Pro pueden usar o3 en ChatGPT.
Metodo de configuracion:
1. Iniciar sesion en ChatGPT
2. Seleccionar o3 en la seleccion de modelo
3. Activar "Modo de razonamiento"
Referencia: ChatGPT - OpenAI
o3 vs Modelos Competidores
| Capacidad | o3 | Gemini 2.0 | Claude Opus 4.5 |
|---|---|---|---|
| Razonamiento matematico | ◎ | ○ | ○ |
| Codificacion | ◎ | ○ | ◎ |
| Razonamiento abstracto | ◎ | ○ | ○ |
| Velocidad | △ | ◎ | ○ |
| Costo | △ | ○ | ○ |
Estructura de Precios (Estimado)
| Modelo | Entrada (1M tokens) | Salida (1M tokens) |
|---|---|---|
| o3 | $60 | $240 |
| o3-mini | $15 | $60 |
| o1 | $15 | $60 |
Nota: Los precios oficiales seran anunciados en el lanzamiento publico
Resumen
OpenAI o3 ha logrado un nuevo hito en capacidad de razonamiento.
- ARC-AGI 87.5%: Razonamiento abstracto que supera el promedio humano
- Codeforces 2727 Elo: Capacidad de codificacion de clase mundial
- Ajuste de cantidad de computo: Posible equilibrio entre precision y costo
- Seguridad reforzada: Introduccion de Deliberative Alignment
El lanzamiento publico esta programado para finales de enero de 2025.
← Volver a la lista