¿Por qué ha causado tanto revuelo ChatGPT?

La herramienta de IA que más está dando que hablar últimamente es ChatGPT, un chatbot de IA generativa que ha arrasado en todo el mundo. Lanzado para uso público por Open AI en noviembre de 2022, ChatGPT se ha convertido en un éxito instantáneo, con más de un millón de usuarios tan solo cinco días después de su lanzamiento y acaparando titulares en todo el mundo.

Con más de 25 millones de usuarios visitando la web a diario, se puede decir que ChatGPT lidera el mercado de la IA generativa, pero ¿El chatgpt está realmente a la altura de las expectativas? En este artículo, echaremos un vistazo sobre la tecnología que hay detrás de ChatGPT, las capacidades y limitaciones del nuevo modelo GPT-4, además de otras tecnologías de IA generativa a las que no hay que perder de vista.

¿Cómo funciona ChatGPT?

ChatGPT (Generative Pretrained Transformer) es un modelo de lenguaje generativo basado en la arquitectura «transformer». Estos modelos pueden procesar grandes cantidades de datos y aprender a realizar tareas de procesamiento del lenguaje natural con gran eficacia. Por ejemplo, el GPT específico que utiliza ChatGPT (perfeccionado a partir de un modelo de la serie GPT-3.5) tiene un tamaño de 175.000 millones de parámetros, lo que lo convierte en el mayor modelo lingüístico entrenado hasta la fecha.

Para que funcione, GPT debe «entrenarse» con una gran cantidad de texto. GPT-3, por ejemplo, se entrenó con un conjunto de textos que incluía más de 8 millones de documentos y más de 10.000 millones de palabras. A partir de este texto, el modelo aprende a realizar tareas de procesamiento de lenguaje natural y a generar respuestas similares a las humanas a una amplia variedad de preguntas e indicaciones con un alto nivel de precisión y fluidez. De hecho, he aquí una descripción generada por el propio ChatGPT:

«ChatGPT es un modelo avanzado de inteligencia artificial creado por OpenAI. Genera texto similar al humano a partir de datos de entrada e instrucciones, lo que lo hace ideal para la atención al cliente, la traducción de idiomas y la creación de contenidos. Su capacidad para entender el contexto y producir respuestas coherentes lo distingue en el campo de la IA generativa».

Sin embargo, por impresionantes que sean las capacidades del chatbot de IA, como la mayoría de la tecnología, GPT 3.5 no es ni mucho menos infalible. Por ejemplo, se ha demostrado que esta versión del chatbot tiene problemas con el lenguaje matizado, los problemas matemáticos y la generación de información falsa. En respuesta a estas limitaciones, en marzo de 2023 Open AI lanzó GPT-4, una versión actualizada de la tecnología que ha sido descrita por la empresa como el modelo «más capaz y alineado» hasta la fecha.

GPT-4: ¿Qué ha cambiado y qué ha mejorado?

Una de las mejoras más significativas de GPT-4 es su capacidad multimodal. A diferencia de GPT 3.5, que sólo puede procesar preguntas basadas en texto, GPT-4 es capaz de aceptar distintas entradas en forma tanto de texto como de imágenes. Por ejemplo, si un usuario cargara un cuestionario, GPT-4 podría escanear el documento y generar las respuestas adecuadas a las preguntas. Del mismo modo, el modelo actualizado también podría leer entradas gráficas y hacer cálculos basados en los datos presentados.

OpenAI también afirma que las capacidades creativas de GPT-4 han mejorado: ahora el chatbot es capaz de entender un lenguaje más matizado, así como de generar expresiones creativas como poemas, canciones y guiones, e incluso imitar los estilos de escritura de los usuarios para obtener resultados más personalizados.

Además, el nuevo modelo de OpenAI puede superar varias pruebas estandarizadas gracias a sus nuevas capacidades de razonamiento avanzado. Mientras que las versiones anteriores de la tecnología tenían dificultades para aprobar exámenes jurídicos o rendir en la mayoría de las pruebas de nivel avanzado (matemáticas en particular), la GPT-4 tiene el potencial de situarse entre el 10 por ciento de los mejores estudiantes estadounidenses que se presentan al Examen Uniforme de la Abogacía, según OpenAI. Además, los resultados de las pruebas indican que el sistema podría obtener una puntuación perfecta de cinco en los exámenes de Advanced Placement de cálculo, psicología, estadística e historia.

Para los desarrolladores, sin embargo, una mejora más significativa de GPT-4 es su mayor capacidad de codificación, que le permite comprender, revisar y generar mejor código de programación en varios lenguajes. El nuevo modelo también contará con la capacidad API, mensajes de «sistema», que permite acelerar el desarrollo de aplicaciones y servicios al permitir a los usuarios prescribir el estilo y la tarea mediante la descripción de instrucciones específicas. Según Open AI, la API tendrá un despliegue gradual y se pondrá a disposición primero de los usuarios y desarrolladores en lista de espera.

¿Cuáles son las limitaciones de GPT-4?

Aunque el GPT-4 supone una notable mejora con respecto a su predecesor, el nuevo modelo no está exento de defectos. Por ejemplo, GPT-4 sigue sufriendo «alucinaciones», es decir, resultados que suenan verosímiles pero que son inexactos. Estas imprecisiones suelen deberse a los sesgos inherentes al modelo de IA, a su falta de conocimiento del mundo real o a las limitaciones de los datos de entrenamiento. En comparación con GPT 3.5, GPT-4 muestra una mejora del 40 por ciento en las pruebas que miden estas alucinaciones, sin embargo, Open AI ha admitido que «GPT-4 todavía tiene muchas limitaciones conocidas que estamos trabajando para solucionar, como los sesgos sociales, las alucinaciones y las indicaciones adversas».

Otras limitaciones hasta ahora incluyen la inaccesibilidad de la función de introducción de imágenes. OpenAI aún no ha puesto a disposición de los usuarios las funciones de entrada visual de GPT-4 a través de ninguna plataforma porque, para empezar, la empresa de investigación está colaborando con un único proveedor. Sin embargo, los usuarios pueden acceder a la función de entrada de texto de GPT-4 mediante una suscripción a ChatGPT Plus, que garantiza a los suscriptores el acceso al modelo de lenguaje (con un límite de uso) al precio de 20 euros al mes. Para los usuarios que busquen una alternativa gratuita, Bing Chat, la tecnología de chatbot de Microsoft codesarrollada con OpenAI, también funciona con el modelo GPT-4 y es de uso público y gratuito.

¿Qué herramientas de IA generativa hay que tener en cuenta?

ChatGPT ha resultado ser una de las herramientas de IA generativa más potentes disponibles, pero no es la única herramienta de IA del mercado.

En marzo de 2023, Microsoft anunciaba la disponibilidad de GPT-4 en vista previa en Azure OpenAI Service y abría el acceso a la aplicación para clientes y partners actuales. Este servicio dará a los clientes de Azure acceso a modelos avanzados de IA, incluidos GPT-3.5, ChatGPT y DALL-E 2, respaldados por la infraestructura optimizada para IA de Azure, la preparación para empresas, el cumplimiento, la seguridad de datos y los controles de privacidad, junto con integraciones con otros servicios de Azure. Además, la filial de Microsoft, GitHub y OpenAI han presentado recientemente Copilot. Esta herramienta utiliza un nuevo modelo basado en GPT-3 llamado Codex, que ayuda a los desarrolladores de software a escribir código de manera más eficiente y evitar tareas repetitivas con la finalización automática de código y sugerencias.

En competencia directa con ChatGPT, Google ha lanzado su propio servicio de IA basado en modelos de transformadores, Bard, un chatbot de IA basado en la familia LaMDA de grandes modelos lingüísticos. Aunque Bard funciona de forma similar a ChatGPT, el servicio de Google extrae su información de la web, en lugar de utilizar conjuntos de datos masivos como ChatGPT. El acceso público está actualmente limitado, sin embargo, los usuarios interesados pueden apuntarse a la lista de espera para participar en » uno de los primeros experimentos que permitirá colaborar con la IA generativa».

Por último, Amazon también ha entrado en el terreno de la IA generativa con el anuncio de Bedrock, un servicio totalmente gestionado para crear y escalar aplicaciones de IA generativa. Bedrock es una experiencia sin servidor que ofrece una gama de modelos básicos de IA (FM) preentrenados de startups como AI21 Labs, Anthropic y Stability AI, así como acceso exclusivo a Titan FMs, una familia de modelos entrenados internamente por AWS, que proporciona a los clientes la flexibilidad de elegir y personalizar modelos según sus casos de uso. Aunque actualmente solo está disponible para una «vista previa limitada», las actualizaciones del servicio y el lanzamiento están disponibles a través de la página de información sobre IA Generativa de Amazon.

¿Cómo puede la IA transformar tu empresa?

A medida que la tecnología sigue evolucionando, las herramientas impulsadas por la IA están pasando rápidamente de ser instrumentos comodín a convertirse en activos de valor incalculable para el crecimiento y la productividad en unos mercados cada vez más competitivos. El campo de la IA generativa basada en modelos transformadores, en particular, está creciendo a un ritmo rápido, y esperamos ver más avances interesantes en un futuro próximo. Se espera que la GPT esté lista para las empresas, ya sea ChatGPT, Microsoft o Google.

techradar 2023, tecnologias emergentes analizadas por expertos de Devoteam

¿Quieres saber más sobre ChatGPT?

Consulta nuestro nuevo TechRadar 2023 para saber qué opinan nuestros expertos.

Descargar TechRadar