domingo, 9 de noviembre de 2025

Inteligencia artificial generativa: un experimento social sin control

 


(Imagen generada por GPT)



Escribe el neuropsicólogo Gari Marcus en Frenar a Silcon Valley, cómo las Big Tech se aprovechan de nosotros y cómo la inteligencia artificial puede empeorarlo que la ola de chats dirigidos por modelos fundacionales extensos que se han hecho presentes en nuestras vidas a través de internet hay que considerar que es un experimento social a gran escala sin ningún objetivo práctico y, sobre todo, sin ningún control social sobre las consecuencias que puede tener  la introducción de estos sistemas de consulta online en todos los aspectos de la vida social.

Las llamadas inteligencias artificiales con objetivos de manipulación de enormes cantidades de datos, orientadas a la minería de datos y basadas en técnicas como las redes neuronales, quizás en hibridación con otras técnicas más tradicionales, fueron creciendo a lo largo del siglo actual en las plataformas como los exploradores (Google), en los llamados falsamente trabajos compartidos como Uber, en el comercio online, como Amazon, en los mapas orientados por GPS, en el control de grandes sistemas complejos, o en el cálculo económico en banca y otros dispositivos financieros.

Cuando apareció el llamado aprendizaje profundo las cosas cambiaron: la historia reciente del aprendizaje profundo, que comenzó principalmente con el desarrollo de AlexNet en 2012, se ha caracterizado por una rápida innovación, importantes avances arquitectónicos y la adopción generalizada de tecnologías de IA. Entre 2012 y 2017 se produjo la generalización del aprendizaje profundo. En 2012 se introducen AlexNet e ImageNet.  El punto de inflexión se produjo cuando AlexNet, una red neuronal convolucional (CNN) desarrollada por Alex Krizhevsky, Ilya Sutskever y Geoffrey Hinton, logró una victoria revolucionaria en el ImageNet Large Scale Visual Recognition Challenge (ILSVRC). Su uso de GPU (Graphics processing Unit) e innovaciones arquitectónicas (ReLU o Rectified Linear Unit, un tipo de función de activación en inteligencia artificial y aprendizaje profundo que introduce no linealidad en una red neuronal)  permitió superar cumplidamente a los métodos tradicionales y desencadenó la «revolución del aprendizaje profundo» en la visión por computadora.

Entre 2013 y 2014 se introdujeron cambios y usos en RNN (redes neuronales recurrentes) y modelos generativos. El éxito del aprendizaje profundo se extendió a otros ámbitos. En diciembre de 2013, DeepMind Technologies desveló un tipo de inteligencia artificial que, sin conocimientos previos, había llegado a dominar siete juegos de Atari 2600 en cuestión de horas y además mejor que algunos de los mejores jugadores humanos. En 2014, las redes generativas adversarias (GAN), introducidas por Ian Goodfellow y otros proporcionaron un marco novedoso para el modelado generativo, lo que condujo a avances significativos en la creación de imágenes sintéticas. Así, en 2015, se extendió el diseño de redes más profundas y nuevas aplicaciones. El problema del entrenamiento de redes muy profundas se abordó con la introducción de las redes neuronales residuales (ResNet), que permitieron el entrenamiento de redes con docenas de capas. El aprendizaje profundo también mejoró significativamente los sistemas de reconocimiento de voz de Google, que adoptaron modelos basados en LSTM (Long sort-term memory es un tipo de red neuronal recurrente (RNN) utilizada en el aprendizaje automático para procesar y clasificar datos secuenciales, como texto y series temporales). También surgieron Google DeepDream y la transferencia de estilo neuronal, lo que demostró el potencial artístico de las CNN. En 2016, la victoria de AlphaGo de Google DeepMind, derrotó al campeón mundial de Go, Lee Sedol, lo que supuso un hito importante que demostró la capacidad del aprendizaje por refuerzo profundo en juegos de estrategia complejos.

En 2017 comenzó el tiempo de los transformadores y la IA generativa hasta el presente.  En 2017, la introducción de la arquitectura Transformer, centrada en los mecanismos de atención, revolucionó el procesamiento del lenguaje natural (NLP). A diferencia de los modelos secuenciales anteriores, como las RNN y las LSTM, los transformadores podían procesar secuencias completas en paralelo, lo que dio lugar a una nueva era de modelos de lenguaje. A finales de la década de 2010 yprincipios de la década de 2020 observamos todos la proliferación de la IA generativa. La arquitectura Transformer sustentó el desarrollo de grandes modelos básicos, tanto propietarios como de código abierto. Esto dio lugar a un auge de sofisticados chatbots (por ejemplo, ChatGPT) y modelos de texto a imagen (por ejemplo, DALL·E 2, Stable Diffusion), que entraron en la conciencia pública alrededor de 2022.

La aparición de la inteligencia generativa integrada por los modelos lingüísticos extensos comenzó con buenas intenciones de crear aplicaciones que diesen a los humanos control sobre los crecientes usos de la inteligencia artificial. Al menos en las primeras manifestaciones de los grandes laboratorios como DeepMind o la empresa de Sam Altman OpenAI, la intención era crear un campo de usos dirigido al servicio humano en usos controlados.

En noviembre de 2022 apareció en los exploradores el ChatGPT, que se lanzó inicialmente  de modo gratuito para el público, con planes de monetizarlo más adelante. El 4 de diciembre, OpenAI calculaba que ChatGPT ya tenía más de un millón de usuarios. El 14 de marzo de 2023 se lanzó GPT-4. El 6 de noviembre de 2023, OpenAI publicó que cien millones de personas utilizaban ChatGPT semanalmente.El 19 de octubre de 2023, ChatGPT-4 se integró con el modelo de generación de imágenes DALL·E 3, lo que permitió a los usuarios de ChatGPT Plus crear imágenes directamente dentro del chat, utilizando descripciones textuales. Esta integración facilitó una experiencia fluida, combinando las capacidades avanzadas de generación de texto de GPT-4 con las poderosas herramientas visuales de DALL·E 3. A partir de ese momento, los usuarios pudieron generar imágenes de alta calidad a partir de instrucciones detalladas, sin tener que recurrir a una plataforma separada.  

Él éxito de OpenAI desencadenó una carrera entre las grandes empresas de tecnología por el dominio del mercado de los modelos generativos, Microsoft, Anthropic, Google, crearon sus propios sistemas como Copilot, Gemini, Llama, Claude, que se fueron incorporando a internet y usados para las más diversas tareas de traducción, generación de textos, generación de informes, producción de códigos, resolución de problemas matemáticos, creación de imágenes y vídeos, de modo que desde 2023 a 2025, y en los próximos tiempos, la extensión de su uso ha sido tan exponencialmente creciente en usuarios y empresas que cabe calificarlo como ha hecho Gari Marcus de un experimento social sin nadie al mando, sin objetivo ni control sobre las consecuencias.

¿Por qué todo este proceso acelerado de transformaciones puede calificarse de experimento social? El uso de los conversadores artificiales (Chats) ha invadido en cuestión de meses la mayoría de los usos de la red. Las traducciones automáticas, la escritura de textos escolares e incluso de investigación, el uso de los chats para consultas a la red que antes se hacían a través de exploradores, el uso en educación matemática e informática, la elaboración de vídeos producidos para TikTok y otras plataformas visuales con reels, la producción de relatos hablados automáticos con historias estereotipadas con mensajes en general conservadores. Los exploradores, los procesadores de texto y los smartphones han incorporado ya los modelos fundacionales para que no haya que consultar las páginas de formas tradicionales. Al igual que las redes sociales y otras plataformas insisten en que no las consultes en la red, sino que bajes a tu dispositivo la App correspondiente, para poder extraer así todos los datos del dispositivo y el uso diario, los modelos fundacionales se integran en las más diversas aplicaciones y asistentes para que toda consulta sirva de entrenamiento y datos al modelo.

Los modelos generativos no deben ser considerados simplemente como un producto comercial que se extiende, al modo como lo hicieron las redes sociales, las plataformas de consumo o los smartphones. Si bien es cierto que esta cadena de productos ha transformado nuestro entorno cotidiano, así como el conjunto de la economía y la sociedad, podemos aún pensarlos dentro de los encadenamientos de cambios técnicos que modelan el mundo desde la primera Revolución industrial. Pueden calificarse de cambios acelerados y pueden criticarse desde todos los ángulos y facetas que se han ido abriendo a lo largo de los años. El desenvolvimiento de los modelos fundacionales en el entorno técnico, sin embargo, tiene explícitamente objetivos antropológicos, el de sustitución de la inteligencia humana por la llamada inteligencia artificial en cada uno de los aspectos de la vida. Los señores de las grandes tecnológicas proclaman cada día que están buscando la inteligencia general definitiva que adelante a la inteligencia humana. No tengo la menor duda de que estas proclamas entre el entusiasmo y la amenaza son parte de una campaña de propaganda para la obtención de más financiación por parte del Estado y las financieras, pero opera colateralmente de modo performativo impulsando lo que se supone que es la adaptación humana a este proceso de crecimiento sin control de los modelos.

Un experimento es una intervención en la naturaleza para observar la reacción y con ello captar mecanismos profundos que han sido antes pensados como hipótesis. En parte, el globo o la burbuja de la inteligencia generativa es algo así solamente que no hay coordinación entre la hipótesis y las consecuencias. Se introduce el producto en el mercado de la información, este produce efectos en todas las escalas psicológicas, sociales, económicas, políticas y ecológicas, y la hipótesis de la inteligencia general camina por su propio ensimismado sendero sin atender a los cambios que está introduciendo en la sociedad que, por otra parte, tiene que mantenerla y alimentarla con sus datos y con sus fuentes de energía.

Es una locura social solo comparable a la introducción irrestricta de algún virus construido artificialmente para producir algún cambio en el organismo, que genera sin control una pandemia de transformaciones no pensadas anteriormente.


No hay comentarios:

Publicar un comentario