(Imagen generada por GPT)
Escribe el neuropsicólogo Gari Marcus en Frenar a Silcon Valley, cómo las Big Tech se aprovechan de nosotros y cómo la inteligencia artificial puede empeorarlo que la ola de chats dirigidos por modelos fundacionales extensos que se han hecho presentes en nuestras vidas a través de internet hay que considerar que es un experimento social a gran escala sin ningún objetivo práctico y, sobre todo, sin ningún control social sobre las consecuencias que puede tener la introducción de estos sistemas de consulta online en todos los aspectos de la vida social.
Las llamadas inteligencias artificiales con objetivos de
manipulación de enormes cantidades de datos, orientadas a la minería de datos y
basadas en técnicas como las redes neuronales, quizás en hibridación con otras
técnicas más tradicionales, fueron creciendo a lo largo del siglo actual en las
plataformas como los exploradores (Google), en los llamados falsamente trabajos
compartidos como Uber, en el comercio online, como Amazon, en los mapas
orientados por GPS, en el control de grandes sistemas complejos, o en el
cálculo económico en banca y otros dispositivos financieros.
Cuando apareció el llamado aprendizaje profundo las cosas
cambiaron: la historia reciente del aprendizaje profundo, que comenzó
principalmente con el desarrollo de AlexNet en 2012, se ha caracterizado por
una rápida innovación, importantes avances arquitectónicos y la adopción
generalizada de tecnologías de IA. Entre 2012 y 2017 se produjo la generalización
del aprendizaje profundo. En 2012 se introducen AlexNet e ImageNet. El punto de inflexión se produjo cuando
AlexNet, una red neuronal convolucional (CNN) desarrollada por Alex Krizhevsky,
Ilya Sutskever y Geoffrey Hinton, logró una victoria revolucionaria en el
ImageNet Large Scale Visual Recognition Challenge (ILSVRC). Su uso de GPU
(Graphics processing Unit) e innovaciones arquitectónicas (ReLU o Rectified
Linear Unit, un tipo de función de activación en inteligencia artificial y aprendizaje
profundo que introduce no linealidad en una red neuronal) permitió superar cumplidamente a los métodos
tradicionales y desencadenó la «revolución del aprendizaje profundo» en la
visión por computadora.
Entre 2013 y 2014 se
introdujeron cambios y usos en RNN (redes neuronales recurrentes) y modelos
generativos. El éxito del aprendizaje profundo se extendió a otros ámbitos. En
diciembre de 2013, DeepMind Technologies desveló un tipo de inteligencia
artificial que, sin conocimientos previos, había llegado a dominar siete
juegos de Atari 2600 en cuestión de horas y además mejor que algunos de
los mejores jugadores humanos. En 2014, las redes generativas adversarias
(GAN), introducidas por Ian Goodfellow y otros proporcionaron un marco novedoso
para el modelado generativo, lo que condujo a avances significativos en la
creación de imágenes sintéticas. Así, en 2015, se extendió el diseño de redes
más profundas y nuevas aplicaciones. El problema del entrenamiento de redes muy
profundas se abordó con la introducción de las redes neuronales residuales
(ResNet), que permitieron el entrenamiento de redes con docenas de capas. El
aprendizaje profundo también mejoró significativamente los sistemas de
reconocimiento de voz de Google, que adoptaron modelos basados en LSTM (Long
sort-term memory es un tipo de red neuronal recurrente (RNN) utilizada en el
aprendizaje automático para procesar y clasificar datos secuenciales, como
texto y series temporales). También surgieron Google DeepDream y la
transferencia de estilo neuronal, lo que demostró el potencial artístico de las
CNN. En 2016, la victoria de AlphaGo de Google DeepMind, derrotó al campeón
mundial de Go, Lee Sedol, lo que supuso un hito importante que demostró la capacidad
del aprendizaje por refuerzo profundo en juegos de estrategia complejos.
En 2017 comenzó el tiempo de
los transformadores y la IA generativa hasta el presente. En 2017, la introducción de la arquitectura
Transformer, centrada en los mecanismos de atención, revolucionó el
procesamiento del lenguaje natural (NLP). A diferencia de los modelos
secuenciales anteriores, como las RNN y las LSTM, los transformadores podían
procesar secuencias completas en paralelo, lo que dio lugar a una nueva era de
modelos de lenguaje. A finales de la década de 2010 yprincipios de la década de
2020 observamos todos la proliferación de la IA generativa. La arquitectura
Transformer sustentó el desarrollo de grandes modelos básicos, tanto
propietarios como de código abierto. Esto dio lugar a un auge de sofisticados
chatbots (por ejemplo, ChatGPT) y modelos de texto a imagen (por ejemplo, DALL·E 2,
Stable Diffusion), que entraron en la conciencia pública alrededor de 2022.
La aparición de la inteligencia generativa integrada por los
modelos lingüísticos extensos comenzó con buenas intenciones de crear
aplicaciones que diesen a los humanos control sobre los crecientes usos de la
inteligencia artificial. Al menos en las primeras manifestaciones de los grandes
laboratorios como DeepMind o la empresa de Sam Altman OpenAI, la intención era
crear un campo de usos dirigido al servicio humano en usos controlados.
En noviembre de 2022 apareció en los exploradores el ChatGPT,
que se lanzó inicialmente de modo gratuito
para el público, con planes de monetizarlo más adelante. El 4 de diciembre,
OpenAI calculaba que ChatGPT ya tenía más de un millón de usuarios. El 14 de marzo de 2023 se
lanzó GPT-4. El 6 de noviembre de 2023, OpenAI publicó que cien millones
de personas utilizaban ChatGPT semanalmente. El 19 de octubre de 2023,
ChatGPT-4 se integró con el modelo de generación de imágenes DALL·E 3,
lo que permitió a los usuarios de ChatGPT Plus crear imágenes directamente
dentro del chat, utilizando descripciones textuales. Esta integración facilitó
una experiencia fluida, combinando las capacidades avanzadas de generación de
texto de GPT-4 con las poderosas herramientas visuales de DALL·E 3. A
partir de ese momento, los usuarios pudieron generar imágenes de alta calidad a partir de instrucciones
detalladas, sin tener que recurrir a una plataforma separada.
Él éxito de OpenAI desencadenó una carrera entre las grandes
empresas de tecnología por el dominio del mercado de los modelos generativos, Microsoft,
Anthropic, Google, crearon sus propios sistemas como Copilot, Gemini, Llama, Claude,
que se fueron incorporando a internet y usados para las más diversas tareas de traducción,
generación de textos, generación de informes, producción de códigos, resolución
de problemas matemáticos, creación de imágenes y vídeos, de modo que desde 2023
a 2025, y en los próximos tiempos, la extensión de su uso ha sido tan exponencialmente
creciente en usuarios y empresas que cabe calificarlo como ha hecho Gari Marcus
de un experimento social sin nadie al mando, sin objetivo ni control sobre las
consecuencias.
¿Por qué todo este proceso acelerado
de transformaciones puede calificarse de experimento social? El uso de los
conversadores artificiales (Chats) ha invadido en cuestión de meses la mayoría
de los usos de la red. Las traducciones automáticas, la escritura de textos
escolares e incluso de investigación, el uso de los chats para consultas a la
red que antes se hacían a través de exploradores, el uso en educación matemática
e informática, la elaboración de vídeos producidos para TikTok y otras plataformas
visuales con reels, la producción de relatos hablados automáticos con
historias estereotipadas con mensajes en general conservadores. Los
exploradores, los procesadores de texto y los smartphones han incorporado ya
los modelos fundacionales para que no haya que consultar las páginas de formas
tradicionales. Al igual que las redes sociales y otras plataformas insisten en
que no las consultes en la red, sino que bajes a tu dispositivo la App
correspondiente, para poder extraer así todos los datos del dispositivo y el
uso diario, los modelos fundacionales se integran en las más diversas
aplicaciones y asistentes para que toda consulta sirva de entrenamiento y datos
al modelo.
Los modelos generativos no
deben ser considerados simplemente como un producto comercial que se extiende,
al modo como lo hicieron las redes sociales, las plataformas de consumo o los smartphones.
Si bien es cierto que esta cadena de productos ha transformado nuestro entorno
cotidiano, así como el conjunto de la economía y la sociedad, podemos aún
pensarlos dentro de los encadenamientos de cambios técnicos que modelan el
mundo desde la primera Revolución industrial. Pueden calificarse de cambios acelerados
y pueden criticarse desde todos los ángulos y facetas que se han ido abriendo a
lo largo de los años. El desenvolvimiento de los modelos fundacionales en el
entorno técnico, sin embargo, tiene explícitamente objetivos antropológicos, el
de sustitución de la inteligencia humana por la llamada inteligencia artificial
en cada uno de los aspectos de la vida. Los señores de las grandes tecnológicas
proclaman cada día que están buscando la inteligencia general definitiva que
adelante a la inteligencia humana. No tengo la menor duda de que estas proclamas
entre el entusiasmo y la amenaza son parte de una campaña de propaganda para la
obtención de más financiación por parte del Estado y las financieras, pero
opera colateralmente de modo performativo impulsando lo que se supone que es la
adaptación humana a este proceso de crecimiento sin control de los modelos.
Un experimento es una
intervención en la naturaleza para observar la reacción y con ello captar
mecanismos profundos que han sido antes pensados como hipótesis. En parte, el
globo o la burbuja de la inteligencia generativa es algo así solamente que no
hay coordinación entre la hipótesis y las consecuencias. Se introduce el
producto en el mercado de la información, este produce efectos en todas las
escalas psicológicas, sociales, económicas, políticas y ecológicas, y la hipótesis
de la inteligencia general camina por su propio ensimismado sendero sin atender
a los cambios que está introduciendo en la sociedad que, por otra parte, tiene que
mantenerla y alimentarla con sus datos y con sus fuentes de energía.
Es una locura social solo comparable
a la introducción irrestricta de algún virus construido artificialmente para
producir algún cambio en el organismo, que genera sin control una pandemia de
transformaciones no pensadas anteriormente.
No hay comentarios:
Publicar un comentario