Google ha sido durante años el gran dominador en el desarrollo de sistemas de inteligencia artificial (IA). A ello ha contribuido sin duda la adquisición en 2014 de DeepMind, la startup londinense centrada en la investigación en IA que desarrolló un programa, AlphaGo, capaz de derrotar a un gran campeón de Go, el complejo juego de tablero asiático, y abrir el debate sobre si las capacidades de esta tecnología acabarían superando a la mente humana.
Pero el plácido dominio de Google se vio interrumpido el año pasado por otra startup, en este caso OpenAI. El lanzamiento de ChatGPT, la aplicación más exitosa de la historia, cogió con el pie cambiado a las grandes tecnológicas, que se vieron forzadas a acelerar sus programas de IA. En abril de este año, DeepMind, que hasta entonces había funcionado como un laboratorio de investigación relativamente independiente, y Google Brain, la otra gran división de investigación de la tecnológica, se fusionaron en una sola organización, Google DeepMind, en la que trabajan varios de los mejores científicos del mundo en esta disciplina.
Colin Murdoch (Glasgow, 45 años) es el director de negocio de esta nueva superdivisión de IA de Google que acaba de presentar su primer juguete: Gemini, una plataforma de IA generativa multimodal que puede procesar y generar texto, código, imágenes, audio y vídeo desde distintas fuentes de datos. Quienes la han usado dicen que supera con creces la última versión de ChatGPT y que vuelve a colocar a Google en la pelea por dominar este mercado.
Ingeniero electrónico e informático de formación, Murdoch fichó por DeepMind hace nueve años, tras acumular experiencia en la gestión de startups y grandes corporaciones. Su trabajo consiste en hacer que los avances en IA cosechados por el equipo científico de Google acaben repercutiendo en el gran público. Atiende a EL PAÍS desde Londres por videollamada.
Pregunta. ¿Es Gemini la respuesta definitiva a ChatGPT? ¿Qué aporta de nuevo respecto a la popular aplicación de OpenAI?
Respuesta. Gemini es un avance significativo en el desarrollo de la IA. Es nuestro modelo más grande y capaz hasta la fecha: entiende y razona texto, imágenes, audio, vídeo y código, por lo que puede ayudar a la gente a ser más creativa o a aprender. Por ejemplo, supongamos que tu hijo te trae a casa deberes de física y necesita ayuda para entender lo que ha hecho bien y mal. Si le haces una foto a la hoja, Gemini no solo te daría la respuesta correcta al problema, sino que leería la letra y explicaría lo que el niño ha hecho bien, lo que ha hecho mal y los conceptos subyacentes. Los usuarios también pueden interactuar con Gemini a través de Bard, que ahora funciona con Gemini Pro y es más eficaz para comprender, resumir, razonar, codificar y planificar. Ya está disponible en inglés en más de 170 países y, en los próximos meses, lo estará para miles de millones de personas a través de otros productos básicos de Google como Search, Ads, Chrome y Duet AI. A largo plazo, herramientas como Gemini transformarán la forma en que miles de millones de personas viven y trabajan en todo el mundo.
P. ¿Qué opina del revuelo causado por la salida y posterior reincorporación de Sam Altman como consejero delegado de OpenAI?
R. Fueron unos días muy interesantes en la industria. Pero nosotros seguimos centrados en nuestro trabajo de lanzar productos e investigación de primera clase. Hemos tenido unos meses increíblemente ajetreado: desde el anuncio de Lyria, nuestro modelo avanzado de generación de música por IA, que aumentará la creatividad y generará nuevas formas de innovación para artistas, creadores y fans en el futuro, hasta la publicación de GraphCast, nuestro sistema de previsión meteorológica de última generación, y de Gemini. Tenemos mucha confianza en nuestra cartera tecnológica y estamos entusiasmados con el año que tenemos por delante.
P. ¿De qué es capaz la inteligencia artificial en este momento?
R. Nuestro laboratorio de investigación busca mejorar la vida de la gente, y creo que la IA es una buena herramienta para ello. Siempre y cuando se trabaje de forma cuidadosa, cosa que está en el ADN de DeepMind. Una de las áreas que más me entusiasman es lo que llamamos ciencia a velocidad digital: que la IA ayude a avanzar en el progreso científico. Le daré un ejemplo. Las proteínas son los componentes básicos de las células. Cuando funcionan mal, pueden causar problemas o enfermedades. Así que la ciencia lleva años estudiando la estructura de las proteínas, concretamente la forma de esas estructuras, que es lo que realmente nos dice cómo funcionan. El número de formas que pueden adquirir estas estructuras supera al de átomos que hay en el universo. Pues bien, hace dos años, un equipo de DeepMind logró desarrollar un modelo algorítmico, AlphaFold, capaz de determinar la estructura y la apariencia de los aminoácidos, el elemento esencial de las proteínas. Sabemos la estructura de 200 millones de proteínas, y hemos liberado ese conocimiento. Se está empleando nuestra herramienta para acelerar la investigación sobre métodos para combatir la resistencia de los antibióticos. También se está usando para acelerar la investigación sobre enzimas que coman plástico en los océanos. Y en la investigación de vacunas para el cáncer.
P. ¿Han logrado avances en otras áreas?
R. Tenemos esperanzas de que haya avances con la fusión nuclear, la fuente de energía más limpia que existe. Para lograrla, se hace circular plasma por superconductores a grandes velocidades, unas 10.000 vueltas por segundo. Se usan imanes para reducir la fricción del plasma en los tubos. Nosotros estamos usando IA para tratar de optimizar, en tiempo real, el calibrado de esos imanes para que la resistencia sea la menor posible.
P. El interés del gran público, y parece que también de las empresas, se ha vuelto hacia la IA generativa. ¿Cree que eso puede perjudicar el avance en otras muchas áreas de la IA, como las que acaba de mencionar?
R. Llevamos mucho tiempo trabajando en IA generativa. De hecho, los modelos que ahora triunfan están basados en una arquitectura llamada Transformer que desarrollaron científicos de Google hace ahora cinco años. Lo que ha pasado en los últimos 12 o 18 meses es que las cosas han escalado de forma muy rápida: tenemos modelos más grandes y más datos. El cambio fundamental es que nos podemos relacionar con esos modelos con un lenguaje convencional, como el que estamos hablando usted y yo ahora, y eso lo hace más accesible. Antes, solo podían relacionarse con esa tecnología los informáticos; ahora, cualquiera que sepa hablar y escribir.
La IA es muy poderosa y prometedora, pero debemos tener mucho cuidado porque se trata de una tecnología muy potente
P. Ha mencionado la importancia de tener cuidado al desarrollar IA. ¿Qué tipo de reglas están siguiendo?
R. La IA es muy poderosa y prometedora, pero debemos tener mucho cuidado porque se trata de una tecnología muy potente. Tenemos una serie de principios operativos sobre cómo podemos llevar a cabo nuestras investigaciones. Un segundo elemento es que nosotros mismos investigamos en áreas como los prejuicios y la equidad, para asegurarnos de que abordamos esos desafíos de forma correcta. En tercer lugar, es importante tener una correcta configuración institucional en la organización y la cultura adecuada. Tenemos grupos multidisciplinares en los que hay especialistas en ética, ingenieros y una amplia gama de profesionales con distintas especializaciones, que ponen a prueba y analizan las ventajas y los riesgos de cada sistema que desarrollamos. También invitamos a especialistas externos para que nos ayuden.
P. ¿Cómo cree que debería regularse esta tecnología?
R. La regulación es importante. Creo que tiene que ser medida y proporcionada para no constreñir la innovación y que al mismo tiempo pueda mitigar los grandes riesgos, porque creo que esta es una tecnología excepcionalmente prometedora.
P. ¿Le parece correcta la aproximación de la normativa sobre inteligencia artificial que la UE acaba de aprobar?
R. Creo que sí, establece un enfoque proporcionado y basado en los riesgos de cada herramienta. Me parece que eso es un buen punto de partida para el debate mundial. Es importante que tratemos de promover ese tipo de enfoque coordinado de la regulación y la política en todo el mundo para que podamos maximizar los beneficios para todos —que los hay, y muchos—, y que también podamos mitigar sus riesgos de forma adecuada.
P. DeepMind era hasta ahora el laboratorio avanzado de IA de Google. ¿Ha cambiado tras su integración empresarial con Google? ¿Tienen ahora que orientar más su trabajo hacia resultados comerciales?
R. Creo que la fusión ha sido un movimiento muy acertado. Por un lado, tenemos un equipo científico sin parangón en el campo de la IA; por el otro, un mercado gigantesco al que podemos acceder gracias a Google, que nos ofrece la posibilidad de tratar de resolver problemas de la gente. Mi trabajo es encontrar ideas en la intersección entre estas dos esferas. Y, cuando las encontramos, incubar cada idea y sacarla adelante.
P. Deme un ejemplo en que hayan coincidido esos dos elementos.
R. En Deepmind tenemos un software, MuZero, capaz de jugar a ajedrez, Go y otros juegos complejos. Un día, hablando con alguien de YouTube, nos dijo que necesitaban reducir el ancho de banda necesario para hacer llegar nuestros vídeos a personas de todo el mundo, de modo que puedas verlos independientemente de la velocidad de conexión a internet que tengas. Hubo un momento muy creativo en el que nos dimos cuenta de que un vídeo, en esencia, se parece a una partida de ajedrez: se puede ver como una sucesión de imágenes fijas individuales, y hay transiciones entre esas imágenes. Cada una de esas imágenes puede ser una posición en el tablero de ajedrez, y las transiciones, movimientos de ajedrez. Así que aplicamos MuZero a un vídeo y le dimos el objetivo de reducir su tamaño, de comprimirlo. Vimos que tuvo un impacto dramático en el peso de esos vídeos y, ahora, esa tecnología ya está incorporada en YouTube.
Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.
Suscríbete para seguir leyendo
Lee sin límites
_