Inteligencia artificial generativa – Una fuerza que mueve al mundo y despierta dilemas

Hace ocho décadas se buscaba crear máquinas capaces de realizar cálculos elementales. Hoy, la IAG maneja volúmenes inmensos de información y transforma la vida a gran velocidad. Esto demanda procurar un equilibrio entre el potencial de la herramienta y nuestros valores como humanidad.

En los últimos años algo cambió profundamente en el mundo: la inteligencia artificial generativa (IAG) comenzó a reconfigurar industrias, rutinas y hasta la forma como pensamos. Hoy, la IAG nos ayuda a crear desde un texto sencillo hasta el diseño de nuevas moléculas o estrategias comerciales.

La IAG es una fuerza que atraviesa todo. No se trata solo de asistentes virtuales o herramientas que completan frases. Hablamos de algoritmos capaces de escribir código, automatizar tareas complejas, optimizar precios, analizar patrones de consumo y generar contenido a una escala impensada hace apenas unos años. Todo, a través de interfaces tan naturales como una conversación.

Desde que OpenAI liberó ChatGPT en 2022, la adopción de estas tecnologías ha crecido de forma vertiginosa. En 2024, el uso empresarial de la IAG entre líderes corporativos pasó de 55 a 75%. ¿La clave? Experiencias fluidas, intuitivas y accesibles, que reducen la barrera técnica y multiplican el impacto. Pero esta ubicuidad trae consigo nuevas preguntas. ¿Hasta dónde puede llegar la IAG? ¿Cuáles son sus verdaderas capacidades, y dónde están sus límites? Esta nota presenta un recorrido breve pero esencial: una introducción a la IAG, su evolución y los principales desafíos que aún debe enfrentar.

¿Qué es la inteligencia artificial generativa?

LA IAG es una subárea de la inteligencia artificial (IA) que se distingue por su capacidad para crear contenido, incluyendo texto, imágenes, videos, conversaciones coherentes, música y hasta estructuras moleculares.

A diferencia de los modelos de IA tradicionales, los cuales se centran en el análisis de datos existentes con fines descriptivos o de inferencia, la IAG puede producir ejemplos de datos que nunca hayan existido. Tal vez proponiendo nuevos grupos de clientes con características particulares, o generando imágenes originales para dominios específicos. Esta remodelación del panorama tecnológico impacta en una gran variedad de áreas que dependen de la tecnología.

Un viaje en el tiempo: de Turing a ChatGPT

La IA tiene más de sesenta años de historia, en la que podemos señalar —como se ve en la Figura 1— momentos con avances importantes basados en metodologías formales, pero también decepciones y regresos.

Los años cuarenta: Turing. El matemático Alan Turing propuso la creación de máquinas de propósito general capaces de realizar cualquier cálculo siguiendo algoritmos establecidos.

Los años cincuenta: definición. Los pioneros de la informática diseñaron los primeros circuitos lógicos. John McCarthy acuñó el término “inteligencia artificial” en 1956, y en esa misma década nacieron los conceptos fundamentales de la IA moderna, como el Perceptrón de Frank Rosenblatt en 1957.

Los años sesenta y setenta: primeras aplicaciones. Aparecen aplicaciones prácticas de una primitiva IA conocida como “sistemas expertos”: programas que resuelven tareas específicas mediante la toma de decisiones previamente codificadas, lo cual permite ofrecer soluciones efectivas, pero solamente para los casos previamente considerados durante la codificación. Es decir, estos sistemas no son capaces de generalizar ni de extrapolar soluciones para problemas nuevos.

Los años setenta y ochenta: primer invierno. A finales de la década de 1970, las expectativas en la IA superaban en gran medida a los recursos disponibles, resultando en aplicaciones limitadas para necesidades realistas. Este invierno duró más de diez años, y apenas en la década de 1980 la propuesta de nuevos modelos, conocidos como aprendizaje automático (machine learning), reactivó el interés por la IA.

Los años ochenta: aprendizaje automático. A diferencia de los sistemas expertos, los modelos de aprendizaje automático “aprenden” a resolver problemas mediante la experiencia (prueba y error), supuestamente de manera similar a los seres humanos. Es decir, los modelos de aprendizaje automático son expuestos a una serie de ejemplos de entrenamiento para un problema particular. En el escenario más común (aprendizaje supervisado), dichos ejemplos están formados por pares de datos de entrada y valores de salida esperados. Durante una etapa de entrenamiento, el modelo debe ajustar su propia “forma” (parámetros) para aprender a predecir la salida esperada dado un dato de entrada.

Los años noventa: músculo computacional. Ya que el proceso de aprendizaje requiere del procesamiento masivo de datos, una de las limitaciones para el aprendizaje automático fue la disponibilidad de recursos de cómputo, la cual comenzó a cubrirse con la exploración de la tecnología digital, aunque su mayor crecimiento sucedió a principios de los años 2010, cuando las tarjetas gráficas (GPU) comenzaron a utilizarse para el entrena- miento en paralelo de modelos de aprendizaje.

El milenio: muchos datos. Otra necesidad para el aprendizaje es la disponibilidad de datos. Esta limitación comenzó a cubrirse con la acumulación de datos en línea, pero hasta la década de 2010 no fue posible acumular las cantidades de datos necesarias. Con ello nació el término big data.

El Transformer. En 2017, un equipo de investigadores de Google presentó un nuevo modelo de aprendizaje automático que nombraron Transformer. A diferencia de los modelos previos, que explotan las combinaciones entre variables de entrada de manera somera, el Transformer aprende mecanismos avanzados de “atención”, los cuales le permiten identificar relaciones clave entre variables; por ejemplo, cuánta atención presta una palabra a todas las otras palabras en una misma frase. Esta identificación de atención entre variables permite que los modelos capturen nociones de semántica en las representaciones que internamente realizan de los datos (representaciones latentes). Por ejemplo, intención y significado de conversaciones, o la semántica visual en imágenes. Los Transformers se entrenaron para tareas como clasificación de texto, identificación de oraciones que deben ser continuación una de otra, respuesta a preguntas, identificación de la intención de una oración, generación de imágenes o incluso generación de campañas publicitarias.

La captura de la semántica de los datos por el Transformer no solo permitió la resolución de tareas como las mencionadas, también habilitó la posibilidad de generar ejemplos sintéticos de datos con las mismas características que los datos de entrenamiento; es decir, la IAG. Esto se logra mediante la modificación “quirúrgica” de las representaciones latentes y su posterior procesamiento por la sección de salida del modelo de aprendizaje, de manera que la predicción del modelo sea consistente (pero no idéntica) con la que hubiera dado al procesar la representación latente sin modificaciones. En términos formales, consiste en el muestro y la decodificación del espacio latente. La Figura 2 muestra un ejemplo de codificación de una petición (prompt) en el espacio latente, el muestreo de ese espacio y la decodificación del punto muestreado a un espacio de imágenes.

Creando el presente

La capacidad de creación de la IAG la convierte en una herramienta colaboradora, y ha probado ser efectiva en ámbitos muy diversos. Aquí unos ejemplos donde la IAG ha destacado.

  • Servicios financieros: diversas instituciones financieras emplean la IAG para crear chatbots que ofrecen recomendaciones de productos personalizadas; acelerar la aprobación de préstamos; detectar fraudes en reclamaciones, tarjetas de crédito y préstamos, y proporcionar asesoramiento financiero personalizado.
  • Sanidad y biología: en la aceleración del descubrimiento de fármacos, al crear nuevas secuencias de proteínas con propiedades específicas. También se utiliza para diseñar secuencias genéticas sintéticas que permiten simular ensayos clínicos o estudiar enfermedades raras. AlphaFold2 es un ejemplo de la predicción precisa de estructuras proteicas.
  • Automatización y fabricación: en el diseño de piezas mecánicas (por ejemplo, para reducir la resistencia aerodinámica en vehículos), la creación de nuevos materiales, el diseño de chips avanzados y la síntesis de datos para pruebas rigurosas de aplicaciones.
  • Telecomunicaciones: con la generación de configuraciones y políticas de redes de comunicaciones que permiten reducir costos.
  • Desarrollo computacional: con modelos que actúan como asistentes altamente eficientes para desarrollo de software, lo cual aumenta la productividad. Por ejemplo, un 46% del código nuevo es ahora escrito por IA.
  • Multimedia y entretenimiento: con la producción de animaciones, guiones, música, imágenes, y la personalización de contenidos y campañas publicitarias.
  • Negocios: en la optimización dinámica de precios. En la gestión de correo electrónico. Diseño de prototipos. Automatización de resúmenes y reportes.

Esta capacidad creativa viene acompañada de una reducción importante de costos y de tiempos. Adicionalmente, la IAG habilita formas completamente nuevas de creatividad y acelera los ciclos de descubrimiento, al dirigir las búsquedas más allá de la capacidad humana.

Ejemplos populares de estas nuevas capacidades incluyen haber ganado el juego de Go al campeón mundial utilizando estrategias no consideradas por humanos, o haber propuesto estructuras tridimensionales novedosas para el problema de pliegue de proteínas.

Figura 1 - Desarrollo histórico de la IA
Figura 1 – Desarrollo histórico de la IA

Lo que aún no sabemos resolver

Dado que la inteligencia artificial generativa es una herramienta reciente, aún debe superar varias dificultades, como los siguientes:

  • Alucinaciones: consisten en la generación de datos sintéticos que, aunque parezcan factibles, son falsos o inconsistentes. Por ejemplo, la creación de una referencia para un documento, la cual tenga el nombre de un autor real, el título de un documento real y una fecha creíble, pero que realmente no existe. Este fenómeno sucede como consecuencia del muestreo libre del espacio latente.
  • Derechos de autor: aún falta definir quién es el propietario de los datos sintéticos generados por la IAG, ¿el dueño inicial de los datos de entrenamiento? ¿O lo es quien entrenó el modelo? ¿O quien lo comercializa, o quien lo explota…? Esta falta de definición trae como consecuencia la falta de precisión al momento de saber qué tanto puede explotarse un modelo generativo, y también al momento de deslindar responsabilidades. Actualmente, los gobiernos de distintos estados trabajan en las legislaciones necesarias para desambiguar este reto.
  • Identificación de falsificaciones: la posibilidad de crear contenido sintético abre la puerta por completo a la creación de falsificaciones, las cuales pueden consistir desde simples datos de entretenimiento como animaciones o canciones con voces sobrepuestas hasta la creación de contratos o testimonios falsos. Por lo tanto, es crucial tomar acciones que permitan identificar datos sintéticos de los reales, así como legislar para controlar su creación y explotación.
  • Retos técnicos: la IAG debe disminuir el impacto de carbono que se produce al entrenar un modelo de este tipo, y hacer los modelos más ligeros en términos computacionales para que pequeños competidores puedan acceder a ellos.
Figura 2 - Modelo de aprendizaje
Figura 2 – Modelo de aprendizaje

Cierre

La inteligencia artificial generativa representa un punto de inflexión: no solo asiste en tareas técnicas, sino que colabora en procesos que tradicionalmente se consideraban exclusivos de los humanos.

Hoy, la IAG se aplica en sectores como la medicina, la ingeniería, las finanzas y las industrias creativas. Su capacidad para procesar grandes volúmenes de información y proponer soluciones innovadoras hacen de ella una herramienta poderosa. Sin embargo, su adopción acelerada, también revela desafíos cruciales, desde la gestión de sesgos y la veracidad de los resultados hasta la protección de datos, la propiedad intelectual y el desplazamiento de roles profesionales.

El verdadero reto no está solo en perfeccionar la tecnología, sino en integrarla de forma ética, segura y equitativa en la dinámica social. La pregunta no es si la IAG transformará nuestra forma de trabajar y crear, sino cómo queremos que lo haga. En esa respuesta se juega el equilibrio entre el potencial de esta herramienta y los valores que queremos preservar como sociedad.

Aclaración

Este documento se escribió parcialmente con ayuda de IAG: se empleó Google Gemini para generar una lista de ideas para su desarrollo; ChatGPT se usó para resumir o mejorar la redacción de algunos párrafos; la idea general y la redacción principal son obra del autor.

 

Edgar Francisco Román Rangel
Edgar Francisco Román Rangel
Edgar Francisco Román Rangel
Profesor de tiempo completo
Departamento Académico de Computación, ITAM
2019 a la fecha
Es investigador, con Nivel I en el SNI. Sus áreas de investigación incluyen el aprendizaje automático, el aprendizaje de representaciones y el procesamiento multimodal de señales. Su investigación ha tenido aplicaciones médicas, agrícolas y arqueológicas.

ANUNCIO

Anuncio

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.