Democratizando la IA
A nivel de usuarios básicos, todos hemos tenido múltiples ocasiones de probar las bondades de la Inteligencia Artificial.
Nos sentimos unos afortunados de vivir en una era en que la potencia de los ordenadores se pone a nuestro servicio y, en la mayoría de casos, de forma gratuita. Hemos podido hacer cosas realmente espectaculares con IA, que parecían sacadas de una película de ciencia ficción.
Durante los últimos meses he ido probando las principales utilidades de Inteligencia Artificial que los teléfonos móviles ponen a disposición de los usuarios, con unos resultados que a continuación paso a relatar.
Traducción simultánea
Este verano he tenido la ocasión de visitar Shenzhen, la ciudad más tecnológica de China, donde una marca me invitó a conocer sus colosales instalaciones. Aparte del músculo y del poder económico de la multinacional, también conocí algo de la cultura del país, incluyendo a sus gentes, que en la mayoría de los casos tienen bastante más educación que nosotros. Eso me permitió poner en práctica la traducción simultánea de mi smartphone de última generación. Sin la cortesía de los chinos no habría sido posible probar una y otra vez distintos modos de hacernos entender. En un país mediterráneo dudo que hubiesen tenido tanta paciencia.
En China, poca gente habla inglés. De hecho, hubo varios hoteles donde ni siquiera los recepcionistas me entendían, así que tanto mis compañeros de viaje como un servidor no tuvimos más remedio que usar la traducción simultánea por IA. Si bien en frases cortas no hubo mayor complicación, cuando teníamos que transmitir peticiones o razonamientos algo más complejos, la conversación ya no era tan fluida.
Si hablamos de una traducción escrita, más convencional, la situación dista igualmente de ser perfecta. El periódico donde trabajo es un medio bilingüe en el que los artículos que se escriben en castellano me aparecen automáticamente traducidos al catalán. Siguiendo varios criterios, puedo elegir algunos de estos textos y publicarlos en catalán. Pues bien, si clicara directamente en el botón de publicar, habría perdido mi empleo hace tiempo. Pese a utilizar las herramientas más punteras de traducción, todavía es imprescindible que el redactor revise con lupa cada frase antes de darle el visto bueno. La IA sigue cometiendo múltiples errores en este terreno. Estoy convencido de que se perfeccionará, pero de momento, el humano sigue siendo necesario.
Transcripción
Hace unas semanas, una empresa emergente me envió un dispositivo que graba llamadas telefónicas, las transcribe y las resume mediante Inteligencia Artificial. También he probado otros servicios de transcripción, como Whisper.
A pesar de que puse todos mis esfuerzos en usar las entrevistas transcritas para elaborar mis artículos basados en conversaciones con expertos, no me acabé de acostumbrar. Darle la forma oportuna para obtener el resultado que yo quiero quizá me hace ganar algo de tiempo, pero al final me queda una sensación de pérdida de control. Los artículos que acabé publicando mediante este proceso no me convencieron del todo, no era mi estilo. Así que volví al método humano y artesanal de ir escribiendo a partir de la versión sonora de la entrevista. Además, el tono y el énfasis con que un entrevistado dice las cosas da una información imposible de trasladar en una transcripción automática. Quizá sea muy útil para algunos, pero yo he renunciado a ella.
Generación de imágenes
Todavía está muy verde, pero apunta maneras. En muchas plataformas gratuitas de generación de imágenes por Inteligencia Artificial, las figuras humanas siguen teniendo unas imperfecciones y una inexpresividad intolerable, y son muy pocas las creaciones que se pueden llegar a confundir con la realidad.
Cuando no encuentro lo que busco en los bancos de imágenes, recurro a herramientas como Recraft, Firefly, Copilot y muchas otras. Si bien en algunas ocasiones sencillas han dado en el clavo —normalmente cuando le pido objetos inanimados—, cada vez que necesito una foto realista de una persona ejecutando alguna acción o en unas circunstancias determinadas, tengo muchos problemas para conseguir un resultado aceptable. Si se conoce la herramienta y se tiene un poco de idea a la hora de darle la orden para que genere la imagen, con paciencia se puede lleegar a lograr. Para este uso, actualmente recomendamos Rectaft.ai. Es la mejor de las gratuitas. En este aspecto, la IA sin coste para el usuario ha mejorado mucho, sí, pero todavía le queda camino por recorrer.
Este es un ejemplo de lo mejor que se puede encontrar actualmente en IA generativa. Recraft, no obstante, tiene un límite de unas pocas imágenes que se pueden generar al día, sean satisfactorias para el usuario o no.
El retoque y edición de imágenes
Con una base generalmente sentada por la IA de Google, marcas como Samsung, Oppo o Apple están poniendo sus esfuerzos en conseguir retoques mágicos de sus fotos, como borrar o desplazar objetos y personas, hacer un garabato y que se convierta en una foto realista, y muchas cosas más.
Sí, en muchos casos son unos efectos asombrosos que nos maravillan el día que nos compramos un teléfono de 1.500 euros, pero que luego caen en el olvido o no recordamos cómo se usan.
Donde sí podríamos decir que funciona bastante bien es en la optimización de fotos. Sacamos una instantánea con el móvil y su Unidad de Procesamiento Neuronal (NPU) conseguirá que parezcamos fotógrafos profesionales. Dicho esto, desde aquí invitamos a las marcas que optimizan las fotos a que permitan graduar la intensidad de la optimización, así como desactivarla, porque no siempre es posible, y no siempre quedan a nuestro gusto.
Podríamos seguir hablando de más ejemplos, como Suno.ai, el sitio más popular de generación de música y canciones por IA, o los divertidos filtros de aplicaciones de mensajería, que nos convierten en Nosferatu cada vez que llega Halloween. Llegados a este punto, déjenme hacerles una reflexión.
¿Está realmente democratizada, la IA?
La IA está integrada en muchos segmentos de nuestro día a día, pero es algo que escapa a nuestro control. Si vamos al banco, un algoritmo decidirá por nosotros qué condiciones nos impone para darnos un crédito. Si queremos generar o ampliar una imagen a partir de unas instrucciones determinadas (el famoso prompt), la IA decidirá cómo formula la foto a partir de su propia interpretación. Si deseamos obtener la imagen que tenemos en mente o nos proponemos que emule el paisaje que estamos viendo, eso ya nos será imposible, a menos que seamos unos auténticos prodigios del prompt, y eso es tan complicado que se ha convertido en un oficio. Los buenos prompters están cobrando fortunas, actualmente. Pero ya no son usuarios básicos.
La gente de la calle tiene la sensación de poder hacer muchas cosas con Inteligencia Artificial, pero son probablemente los responsables de estas IAs quienes usan a la gente para enriquecer unos Grandes Modelos de Lenguaje y unas ingentes bases de datos que nutrirán tanto sus complejos algoritmos como sus bolsillos. ¿A cambio de qué? De convertirnos en un pastel para que nos corte un cuchillo virtual. Es decir, de servicios inútiles que nos encantan como a serpientes. Es el nuevo opio del pueblo, y cada vez lo será más.
Tengo ganas de ver una inteligencia artificial que realmente sea útil en el día a día y cumpla con las verdaderas necesidades del usuario. No espero una IA que me ayude a borrar la señora que afea mi foto ni juegos que me entretengan con efectos sorprendentes. Eso se usa una vez o dos. Espero una IA que pueda pedir mis alitas de pollo favoritas en la aplicación de delivery que sea, que pague con mi autorización y que me avise cuando el repartidor esté a punto de llamar a mi puerta. Quiero cosas reales, y ya ven que no soy muy exigente, podría serlo mucho más.
Afortunadamente, el camino de la IA va en esta dirección. Próximamente descubriremos una multinacional de la telefonía que está a punto dar un salto en cómo usamos la Inteligencia Artificial.