OpenAI sigue en modo apisonadora: estas son las últimas novedades anunciadas en el DevDay

En un evento organizado por OpenAI y dedicado a los desarrolladores, la empresa anunció novedades para todos: desde un nuevo modelo, pasando por cambios de precios hasta nuevos productos para desarrolladores y usuarios finales.

OpenAI lo ha vuelto a hacer. Consiguió dejarnos a todos con la ilusión de ir a estrenar juguete nuevo y la sensación de que su único competidor, por ahora, es él mismo.

datos%20openAI OpenAI sigue en modo apisonadora: estas son las últimas novedades anunciadas en el DevDay

En una conferencia realizada el pasado 6 noviembre dedicada a los desarrolladores, OpenAI DevDay, se anunció un nuevo modelo de lenguaje, GPT-4 Turbo, una nueva herramienta de texto a voz con 6 voces que suenan muy naturales y el lanzamiento de la última versión de Whisper, Whisper V3.

Y ese fue solo el aperitivo.

A medida que avanzó el evento, Sam Altman y sus invitados presentaron GPTs, una especie de mini chatgpts que todos podemos construir y Assistants API, una API para crear asistentes de IA capaces de seguir instrucciones detalladas, usar información extra y trabajar con otros programas y herramientas para hacer todo tipo de trabajos.

A continuación vamos a ver de forma detallada las novedades más relevantes sobre OpenAI que se revelaron en el DevDay.

+Más: Lo que se sabe de Grok, la IA de Elon Musk que ya está en beta

GPT-4 Turbo: más barato, potente y actualizado

¿Cuánto hace de GPT-4? ¿7 meses? Pues ya está aquí un nuevo modelo, GPT-4 Turbo, superior en varios puntos:

  • Soporta hasta 128 000 tokens de contexto, mucho más que los 32 000 que como máximo admite GPT-4.

Para hacer más concreto lo anterior, Altman utilizó el equivalente en páginas de un libro.

Con GPT-4 Turbo podríamos subir un libro de hasta 300 páginas y la IA sería capaz de tenerlo en cuenta para elaborar la respuesta.

Al momento de escribir este texto, GPT-4 Turbo está disponible para los desarrolladores en modo preview y aunque Altman anunció que ese mismo día estaría disponible para ChatGPT, no ha sido el caso.

Si tu cuenta no está actualizada al nuevo modelo, no tienes que seguir cargando la página en espera del milagro, no estás solo, las actualizaciones todavía no están disponible para la mayoría de usuarios de ChatGPT Plus.

  • Actualizado hasta abril de 2023

Esta información ya se sabía y sí está disponible en ChatGPT: el modelo esta actualizado con información hasta abril de 2023.

Antes, su conocimiento del mundo llegaba hasta 2021.

Altman comentó que pretenden que nunca más quede tan desactualizado.

  • GPT-4 Turbo será mucho más barato que GPT-4

Hasta 3 veces más barato procesar el prompt y 2 veces más barato el precio del token de la respuesta.

Exactamente ahora costará $0.01/1K el prompt y $0.03/1K la respuesta.

Este cambio de precio solo afectará, hasta dónde se sabe, a los usuarios de la API, que también se verán beneficiados por la disminución de los precios en el anterior modelo GPT 3.5.

Con GPT-4 Turbo vienen otros cambios que afectarán directamente a los desarrolladores. OpenAI amplió el número de tokens por minuto que pueden usar y añadió el “modo JSON”, lo que hará que las respuestas del modelo se den en este formato.

  • DALL·E 3, GPT-4 Turbo con visión y el modelo TTS (más sobre esto pronto) pasan a estar disponibles en la API

Aunque los usuarios de ChatGPT Plus disponemos desde hace semanas de DALL•E 3 y GPT-4 con la capacidad de procesar imágenes, los desarrolladores todavía no, hasta ahora.

Ya pueden acceder mediante la API a DALL·E 3, GPT-4 Turbo con visión y el modelo TTS de generación de texto a voz.

+Más: Así puedes evitar que OpenAl utilice el contenido de tu web

Modelo TTS y última versión de Whisper

El nuevo modelo TTS lleva a voz de forma muy natural un texto cualquiera, al menos en inglés, que fue el idioma que pudimos escuchar durante la presentación de Altman.

Según lo comentado en el evento, debe funcionar también en español, aunque en la documentación oficial no se especifican idiomas.

Asumiendo que es el mismo modelo que impulsa la app móvil de ChapGPT, diríamos que suena naturalmente guiri.

TTS tiene dos variantes, ambas disponibles mediante API:

  • tts-1: optimizado para la velocidad y apto para usarlo en tiempo real
  • tts-1-hd: optimizado para tener mayor calidad

Los modelos de audio de OpenAI también experimentaron otra actualización con el último modelo de Whisper, el V3.

Prometen mejor desempeño y que estará próximamente disponible en la API.

GPTs, tus minis GPTs personalizados que podrás añadir a la GPT Store

¿Has visto esos chatbots impulsados por GPT-4 que te permitían añadir tu propia base de conocimiento? ¿Y has utilizado los plugins dentro de ChatGPT? Pues los recientemente anunciados GPTs son una mezcla de esos chatbots con los plugins.

Los GPTs pueden tener instrucciones específicas, una base de conocimiento propia y acciones.

Estas acciones pueden lograrse conectando ChatGPT a las APIs de otras herramientas.

Y que la palabra API no asuste a los que no saben de código, un GPT se podrá hacer a partir de lenguaje natural, simplemente diciéndole a la IA qué queremos.

Suena muy, muy potente y no podemos aguantar las ganas de probarlo.

Si te sientes especialmente orgulloso de tu GPT, puedes hacerlo público y publicarlo en la tienda de GPT que lanzarán a final de este mes, similar a como desarrolladores de todo el mundo publican apps en la Play Store.

Eso sí, todavía no está disponible para todos los usuarios al momento de hacer este artículo.

Assistants API

Los usuarios no técnicos tendremos GPT, pero los desarrolladores ya tienen Assistants API, una API que permite construir asistentes de inteligencia artificial dentro de las propias aplicaciones.

Un Assistant estará compuesto por instrucciones, el modelo que se decida utilizar y herramientas como Code Interpreter o la ejecución de código.

Al igual que GPT, esta nueva iniciativa de OpenAI abrirá la puerta a otro mundo de posibilidades tecnológicas que en los próximos meses veremos emerger.

OpenAI no disminuye el ritmo

Existe una frase muy socorrida para explicar creaciones afortunadas en un espacio de tiempo definido, se dice que alguien está en “estado de gracia”.

Cada nuevo anuncio de OpenAI me hace pensar en un estado de gracia. O, siendo más brutalista con la metáfora, en una apisonadora.

Cada nueva actualización la aleja más de los que pretenden ser sus competidores o, en las escasas ocasiones que un competidor se ha adelantado, alcanzarle con suficiencia.

Ahí está DALL•E 3 saludando a Midjourney, GPT-4 Turbo con 128 000 tokens de contexto diciendo a Claude 2 que a dónde va tan rápido.

No recuerdo la última vez que los anuncios de una empresa tecnológica me ataran tanto a las noticias o me hicieran esperar una actualización con ilusión.

El futuro será terrible o maravilloso, pero el presente es emocionante.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.