Inteligencia artificial generativa - Una fuerza que mueve al mundo y despierta dilemas

Hace ocho décadas se buscaba crear máquinas capaces de realizar cálculos elementales. Hoy, la IAG maneja volúmenes inmensos de información y transforma la vida a gran velocidad. Esto demanda procurar un equilibrio entre el potencial de la herramienta y nuestros valores como humanidad.

En los últimos años algo cambió profundamente en el mundo: la inteligencia artificial generativa (IAG) comenzó a reconfigurar industrias, rutinas y hasta la forma como pensamos. Hoy, la IAG nos ayuda a crear desde un texto sencillo hasta el diseño de nuevas moléculas o estrategias comerciales.

La IAG es una fuerza que atraviesa todo. No se trata solo de asistentes virtuales o herramientas que completan frases. Hablamos de algoritmos capaces de escribir código, automatizar tareas complejas, optimizar precios, analizar patrones de consumo y generar contenido a una escala impensada hace apenas unos años. Todo, a través de interfaces tan naturales como una conversación.

Desde que OpenAI liberó ChatGPT en 2022, la adopción de estas tecnologías ha crecido de forma vertiginosa. En 2024, el uso empresarial de la IAG entre líderes corporativos pasó de 55 a 75%. ¿La clave? Experiencias fluidas, intuitivas y accesibles, que reducen la barrera técnica y multiplican el impacto. Pero esta ubicuidad trae consigo nuevas preguntas. ¿Hasta dónde puede llegar la IAG? ¿Cuáles son sus verdaderas capacidades, y dónde están sus límites? Esta nota presenta un recorrido breve pero esencial: una introducción a la IAG, su evolución y los principales desafíos que aún debe enfrentar.

¿Qué es la inteligencia artificial generativa?

LA IAG es una subárea de la inteligencia artificial (IA) que se distingue por su capacidad para crear contenido, incluyendo texto, imágenes, videos, conversaciones coherentes, música y hasta estructuras moleculares.

A diferencia de los modelos de IA tradicionales, los cuales se centran en el análisis de datos existentes con fines descriptivos o de inferencia, la IAG puede producir ejemplos de datos que nunca hayan existido. Tal vez proponiendo nuevos grupos de clientes con características particulares, o generando imágenes originales para dominios específicos. Esta remodelación del panorama tecnológico impacta en una gran variedad de áreas que dependen de la tecnología.

Un viaje en el tiempo: de Turing a ChatGPT

La IA tiene más de sesenta años de historia, en la que podemos señalar —como se ve en la Figura 1— momentos con avances importantes basados en metodologías formales, pero también decepciones y regresos.

Los años cuarenta: Turing. El matemático Alan Turing propuso la creación de máquinas de propósito general capaces de realizar cualquier cálculo siguiendo algoritmos establecidos.

Los años cincuenta: definición. Los pioneros de la informática diseñaron los primeros circuitos lógicos. John McCarthy acuñó el término “inteligencia artificial” en 1956, y en esa misma década nacieron los conceptos fundamentales de la IA moderna, como el Perceptrón de Frank Rosenblatt en 1957.

Los años sesenta y setenta: primeras aplicaciones. Aparecen aplicaciones prácticas de una primitiva IA conocida como “sistemas expertos”: programas que resuelven tareas específicas mediante la toma de decisiones previamente codificadas, lo cual permite ofrecer soluciones efectivas, pero solamente para los casos previamente considerados durante la codificación. Es decir, estos sistemas no son capaces de generalizar ni de extrapolar soluciones para problemas nuevos.

Los años setenta y ochenta: primer invierno. A finales de la década de 1970, las expectativas en la IA superaban en gran medida a los recursos disponibles, resultando en aplicaciones limitadas para necesidades realistas. Este invierno duró más de diez años, y apenas en la década de 1980 la propuesta de nuevos modelos, conocidos como aprendizaje automático (machine learning), reactivó el interés por la IA.

Los años ochenta: aprendizaje automático. A diferencia de los sistemas expertos, los modelos de aprendizaje automático “aprenden” a resolver problemas mediante la experiencia (prueba y error), supuestamente de manera similar a los seres humanos. Es decir, los modelos de aprendizaje automático son expuestos a una serie de ejemplos de entrenamiento para un problema particular. En el escenario más común (aprendizaje supervisado), dichos ejemplos están formados por pares de datos de entrada y valores de salida esperados. Durante una etapa de entrenamiento, el modelo debe ajustar su propia “forma” (parámetros) para aprender a predecir la salida esperada dado un dato de entrada.

Los años noventa: músculo computacional. Ya que el proceso de aprendizaje requiere del procesamiento masivo de datos, una de las limitaciones para el aprendizaje automático fue la disponibilidad de recursos de cómputo, la cual comenzó a cubrirse con la exploración de la tecnología digital, aunque su mayor crecimiento sucedió a principios de los años 2010, cuando las tarjetas gráficas (GPU) comenzaron a utilizarse para el entrena- miento en paralelo de modelos de aprendizaje.

El milenio: muchos datos. Otra necesidad para el aprendizaje es la disponibilidad de datos. Esta limitación comenzó a cubrirse con la acumulación de datos en línea, pero hasta la década de 2010 no fue posible acumular las cantidades de datos necesarias. Con ello nació el término big data.

El Transformer. En 2017, un equipo de investigadores de Google presentó un nuevo modelo de aprendizaje automático que nombraron Transformer. A diferencia de los modelos previos, que explotan las combinaciones entre variables de entrada de manera somera, el Transformer aprende mecanismos avanzados de “atención”, los cuales le permiten identificar relaciones clave entre variables; por ejemplo, cuánta atención presta una palabra a todas las otras palabras en una misma frase. Esta identificación de atención entre variables permite que los modelos capturen nociones de semántica en las representaciones que internamente realizan de los datos (representaciones latentes). Por ejemplo, intención y significado de conversaciones, o la semántica visual en imágenes. Los Transformers se entrenaron para tareas como clasificación de texto, identificación de oraciones que deben ser continuación una de otra, respuesta a preguntas, identificación de la intención de una oración, generación de imágenes o incluso generación de campañas publicitarias.

La captura de la semántica de los datos por el Transformer no solo permitió la resolución de tareas como las mencionadas, también habilitó la posibilidad de generar ejemplos sintéticos de datos con las mismas características que los datos de entrenamiento; es decir, la IAG. Esto se logra mediante la modificación “quirúrgica” de las representaciones latentes y su posterior procesamiento por la sección de salida del modelo de aprendizaje, de manera que la predicción del modelo sea consistente (pero no idéntica) con la que hubiera dado al procesar la representación latente sin modificaciones. En términos formales, consiste en el muestro y la decodificación del espacio latente. La Figura 2 muestra un ejemplo de codificación de una petición (prompt) en el espacio latente, el muestreo de ese espacio y la decodificación del punto muestreado a un espacio de imágenes.

Creando el presente

La capacidad de creación de la IAG la convierte en una herramienta colaboradora, y ha probado ser efectiva en ámbitos muy diversos. Aquí unos ejemplos donde la IAG ha destacado.

Servicios financieros: diversas instituciones financieras emplean la IAG para crear chatbots que ofrecen recomendaciones de productos personalizadas; acelerar la aprobación de préstamos; detectar fraudes en reclamaciones, tarjetas de crédito y préstamos, y proporcionar asesoramiento financiero personalizado.
Sanidad y biología: en la aceleración del descubrimiento de fármacos, al crear nuevas secuencias de proteínas con propiedades específicas. También se utiliza para diseñar secuencias genéticas sintéticas que permiten simular ensayos clínicos o estudiar enfermedades raras. AlphaFold2 es un ejemplo de la predicción precisa de estructuras proteicas.
Automatización y fabricación: en el diseño de piezas mecánicas (por ejemplo, para reducir la resistencia aerodinámica en vehículos), la creación de nuevos materiales, el diseño de chips avanzados y la síntesis de datos para pruebas rigurosas de aplicaciones.
Telecomunicaciones: con la generación de configuraciones y políticas de redes de comunicaciones que permiten reducir costos.
Desarrollo computacional: con modelos que actúan como asistentes altamente eficientes para desarrollo de software, lo cual aumenta la productividad. Por ejemplo, un 46% del código nuevo es ahora escrito por IA.
Multimedia y entretenimiento: con la producción de animaciones, guiones, música, imágenes, y la personalización de contenidos y campañas publicitarias.
Negocios: en la optimización dinámica de precios. En la gestión de correo electrónico. Diseño de prototipos. Automatización de resúmenes y reportes.

Esta capacidad creativa viene acompañada de una reducción importante de costos y de tiempos. Adicionalmente, la IAG habilita formas completamente nuevas de creatividad y acelera los ciclos de descubrimiento, al dirigir las búsquedas más allá de la capacidad humana.

Ejemplos populares de estas nuevas capacidades incluyen haber ganado el juego de Go al campeón mundial utilizando estrategias no consideradas por humanos, o haber propuesto estructuras tridimensionales novedosas para el problema de pliegue de proteínas.

Figura 1 - Desarrollo histórico de la IA — Figura 1 – Desarrollo histórico de la IA

Lo que aún no sabemos resolver

Dado que la inteligencia artificial generativa es una herramienta reciente, aún debe superar varias dificultades, como los siguientes:

Alucinaciones: consisten en la generación de datos sintéticos que, aunque parezcan factibles, son falsos o inconsistentes. Por ejemplo, la creación de una referencia para un documento, la cual tenga el nombre de un autor real, el título de un documento real y una fecha creíble, pero que realmente no existe. Este fenómeno sucede como consecuencia del muestreo libre del espacio latente.
Derechos de autor: aún falta definir quién es el propietario de los datos sintéticos generados por la IAG, ¿el dueño inicial de los datos de entrenamiento? ¿O lo es quien entrenó el modelo? ¿O quien lo comercializa, o quien lo explota…? Esta falta de definición trae como consecuencia la falta de precisión al momento de saber qué tanto puede explotarse un modelo generativo, y también al momento de deslindar responsabilidades. Actualmente, los gobiernos de distintos estados trabajan en las legislaciones necesarias para desambiguar este reto.
Identificación de falsificaciones: la posibilidad de crear contenido sintético abre la puerta por completo a la creación de falsificaciones, las cuales pueden consistir desde simples datos de entretenimiento como animaciones o canciones con voces sobrepuestas hasta la creación de contratos o testimonios falsos. Por lo tanto, es crucial tomar acciones que permitan identificar datos sintéticos de los reales, así como legislar para controlar su creación y explotación.
Retos técnicos: la IAG debe disminuir el impacto de carbono que se produce al entrenar un modelo de este tipo, y hacer los modelos más ligeros en términos computacionales para que pequeños competidores puedan acceder a ellos.

Figura 2 - Modelo de aprendizaje — Figura 2 – Modelo de aprendizaje

Cierre

La inteligencia artificial generativa representa un punto de inflexión: no solo asiste en tareas técnicas, sino que colabora en procesos que tradicionalmente se consideraban exclusivos de los humanos.

Hoy, la IAG se aplica en sectores como la medicina, la ingeniería, las finanzas y las industrias creativas. Su capacidad para procesar grandes volúmenes de información y proponer soluciones innovadoras hacen de ella una herramienta poderosa. Sin embargo, su adopción acelerada, también revela desafíos cruciales, desde la gestión de sesgos y la veracidad de los resultados hasta la protección de datos, la propiedad intelectual y el desplazamiento de roles profesionales.

El verdadero reto no está solo en perfeccionar la tecnología, sino en integrarla de forma ética, segura y equitativa en la dinámica social. La pregunta no es si la IAG transformará nuestra forma de trabajar y crear, sino cómo queremos que lo haga. En esa respuesta se juega el equilibrio entre el potencial de esta herramienta y los valores que queremos preservar como sociedad.

Aclaración

Este documento se escribió parcialmente con ayuda de IAG: se empleó Google Gemini para generar una lista de ideas para su desarrollo; ChatGPT se usó para resumir o mejorar la redacción de algunos párrafos; la idea general y la redacción principal son obra del autor.

Edgar Francisco Román Rangel
Profesor de tiempo completo
Departamento Académico de Computación, ITAM
2019 a la fecha
Es investigador, con Nivel I en el SNI. Sus áreas de investigación incluyen el aprendizaje automático, el aprendizaje de representaciones y el procesamiento multimodal de señales. Su investigación ha tenido aplicaciones médicas, agrícolas y arqueológicas.

Mundo ITAM

Inteligencia artificial generativa – Una fuerza que mueve al mundo y despierta dilemas

Me gusta esto:

Relacionado

ANUNCIO

Deja un comentarioCancelar respuesta

Comparte y difunde

Me gusta esto:

Relacionado

ANUNCIO

Deja un comentarioCancelar respuesta

Descubre más desde Mundo ITAM