GPT-5 puede llegar este verano como una actualización «materialmente mejor» de ChatGPT

Cuando OpenAI lanzó su modelo de IA GPT-4 hace un año, creó una ola de exageración masiva y pánico existencial sobre su capacidad para imitar la comunicación y composición humana. Desde entonces, la pregunta más importante en IA sigue siendo la misma: ¿Cuándo saldrá GPT-5? Durante entrevistas y apariciones en los medios de todo el mundo, a menudo le hacen esta pregunta al director ejecutivo de OpenAI, Sam Altman, y normalmente lo hace. Da una respuesta tímida o evasiva.a veces combinado Promesas De cosas increíbles por venir.

Según un nuevo informe de Interesado en el comercioSe espera que OpenAI lance GPT-5, una versión mejorada del modelo de lenguaje de IA que impulsa ChatGPT, en algún momento a mediados de 2024, y probablemente durante el verano. Dos fuentes anónimas familiarizadas con la compañía revelaron que algunos clientes empresariales recibieron recientemente demostraciones de GPT-5 y mejoras relacionadas a ChatGPT.

Un director ejecutivo que vio recientemente un lanzamiento de GPT-5 lo describió como “realmente bueno” y “materialmente mejor”, mientras OpenAI demostraba el nuevo modelo utilizando casos de uso y datos exclusivos de su empresa. El CEO también insinuó otras capacidades inéditas para el modelo, como la capacidad de lanzar agentes de IA desarrollados por OpenAI para realizar tareas automáticamente.

Preguntamos a los representantes de OpenAI sobre la fecha de lanzamiento de GPT-5 y Business Insider informó. Respondieron que no tenían ningún comentario específico, pero incluyeron un extracto del texto del libro de Altman. Apariencia final En el podcast de Lex Friedman.

Lex Friedman (01:06:13) Entonces, ¿cuándo volverá a salir GPT-5?
Sam Altman (01:06:15) No lo sé. Esta es la respuesta honesta.
Lex Friedman (01:06:18) Oh, esa es la respuesta honesta. Parpadea dos veces si este es el año.
Sam Altman (01:06:30) Este año lanzaremos un fantástico modelo nuevo. No sé cómo lo llamaremos.
Lex Friedman (01:06:36) Entonces esto va a la pregunta: ¿cómo editamos esto?
Sam Altman (01:06:41) Lanzaremos muchas cosas diferentes en los próximos meses. Creo que esto sería genial. Creo que antes de hablar de un modelo similar a GPT-5 llamado así, o no llamado así, o un poco peor o un poco mejor de lo que esperarías de GPT-5, creo que tenemos muchas otras cosas importantes. salir primero.

En esta conversación, Altman pareció insinuar que la compañía está lista para lanzar un importante modelo de IA este año, pero si se llamará “GPT-5” o se verá como una actualización importante de GPT-4 Turbo (o tal vez una actualización incremental). ) como GPT aún está por verse. -4.5) En el aire.

READ  Las últimas filtraciones del iPhone 16, las nuevas especificaciones del iPad Pro y el poder del navegador de Apple

Al igual que su predecesor, se espera que GPT-5 (o como se llame) sea un modelo multimedia de lenguaje grande (LLM) que pueda aceptar texto codificado o entrada visual (llamado «mensaje»). Al igual que GPT-4, GPT-5 será un modelo de predicción del próximo token, lo que significa que producirá la mejor estimación del siguiente token más probable (parte de una palabra) en una secuencia, lo que permitirá tareas como completar una oración o escribir código. . Cuando se configuran de cierta manera, las plantillas GPT pueden ejecutar aplicaciones de chatbot como ChatGPT.

OpenAI lanzó GPT-4 en marzo de 2023 como una actualización de su principal predecesor, GPT-3, que apareció en 2020 (y GPT-3.5 llegará a finales de 2022). En noviembre pasado, OpenAI lanzó GPT-4 Turbo, que redujo drásticamente los costos de inferencia (ejecución) del mejor modelo de IA de OpenAI, pero estuvo plagado de acusaciones de «pereza», ya que el modelo a veces se negaba a responder indicaciones o completar proyectos de programación según fuera necesario. OpenAI ha intentado solucionar el problema de la pereza varias veces.

Los titulares de maestrías como las desarrolladas por OpenAI reciben capacitación en grandes conjuntos de datos extraídos de Internet y Con licencia de empresas de medios., permitiéndoles responder a las indicaciones de los usuarios de forma humana. Sin embargo, la calidad de la información proporcionada por el modelo puede variar según los datos de entrenamiento utilizados y también según la tendencia del modelo a agregar información. Si GPT-5 puede mejorar la generalización (su capacidad para realizar nuevas tareas) y al mismo tiempo reducir lo que comúnmente se llama «alucinaciones» en la industria, probablemente representará un progreso significativo para la empresa.

READ  Qué esperar en el primer evento de productos Apple de este año

Según el informe, OpenAI todavía está entrenando GPT-5 y, una vez completado, el modelo se someterá a pruebas de seguridad internas y más «equipos rojos» para identificar y abordar cualquier problema antes de su lanzamiento público. La fecha de lanzamiento puede retrasarse dependiendo de la duración del proceso de prueba de seguridad.

Por supuesto, las fuentes citadas en el informe pueden estar equivocadas y es posible que GPT-5 se lance más tarde por motivos distintos a las pruebas. Entonces, considere esto como un rumor sólido, pero esta es la primera vez que vemos una posible fecha de lanzamiento para GPT-5 de una fuente confiable. Además, ahora sabemos que GPT-5 está lo suficientemente completo como para someterse a pruebas, lo que significa que su ejecución de entrenamiento principal probablemente esté completa. Es probable que se produzcan más mejoras.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio