Los centros de datos, infraestructuras capaces de procesar grandes cantidades y volúmenes de información, pueden sonar ajenos y lejanos a nuestro día a día. Sin embargo, están más cerca de lo que imaginamos. Así como un restaurante de comida rápida puede utilizar un centro de datos del tamaño de un frigobar para procesar las órdenes y pagos de sus comensales, las ‘7 Magníficas’ pueden demandar centros de datos del tamaño de un contenedor de 13 metros, valorizado en más de US$1 millón.
Esta industria crece cada vez más rápido, especialmente después de la pandemia, y hoy incluso se habla de centros de datos que incorporan Inteligencia Artificial (IA). Los retos son enormes.
Natalya Makarochkina, vicepresidente senior de la División Secure Power de Schneider Electric, conversa con Dia1, al respecto durante “The Future of OA Ready Data Centers”, evento realizado en Barcelona durante el mes pasado.
¿A qué velocidad considera que la IA se está apoderando del desarrollo de los centros de datos?
Lo que podemos ver, sobre todo después de la Covid-19, es que la Inteligencia Artificial (IA) es utilizada principalmente en los procesos de digitalización en diferentes industrias. Del 2012 al 2022, en 10 años, solo se crearon 25 grandes modelos lingüísticos, mientras que en los dos últimos años se crearon 100. Así que puedes imaginarte la velocidad de la IA, es realmente exponencial.
El impacto es muy grande en la economía y de acuerdo con PwC, el impacto de la IA agregará US$16 mil millones a la economía mundial en los próximos cinco años, un aumento potencial del 14%.
Usted ha mencionado modelos lingüísticos. ¿Qué son y cuáles son las diferencias entre los modelos grandes, medianos y cortos?
Los grandes modelos de lenguaje ayudan a crear y manejan una gran cantidad de datos. El ChatGPT, por ejemplo, usa una gran cantidad de datos para responder preguntas, porque requiere de diferentes fuentes. Primero analiza la información y luego crea un párrafo o información general, lo que sea que se le solicite. Eso es un modelo lingüistico grande. También lo es la IA generativa, que no se limita a hacer cosas repetidas o a aprender de las cosas que ya ha hecho, sino que crea nuevos contenidos. Así, puede escribir historias, música…
"Los CPU son servidores que están disminuyendo, porque para procesar y trabajar sobre ‘big data’, se requiere procesamiento paralelo, y por lo tanto, servidores GPU".
Puede analizar textos.
No sólo analizar, porque yo también puedo analizar, sino también crear. Cuando uno va al ChatGPT, puede pedir preparar una presentación basada en algo particular. El Chat seleccionará las imágenes, los videos. Se trata de modelos lingüísticos realmente grandes. Pero, se pueden tener también modelos especializados y muy pequeños, centrados en algo como el reconocimiento de imágenes.
Por ejemplo, las multas que recibimos cuando conducimos. Eso es una cámara que toma fotos y que analiza que los números (de una placa) coincidan con la base de datos. Luego, envía la multa. Eso es un modelo lingüístico pequeño, ya que no se requieren muchos datos. Eso no es IA generativa, no crea contenido, es un sistema que sólo actúa según lo que ha aprendido o le han enseñado. Esa es la mayor diferencia.
Hay una diferencia importante respecto a las infraestructuras que requiere cada modelo.
(Aciente). Las infraestructuras físicas para los modelos comprimidos y los grandes son totalmente diferentes. Para los grandes modelos necesitas procesamiento gráfico (GPU, por sus siglas en inglés) y servidores de almacenamiento.
¿Un GPU es un CPU 2.0?
No del todo. Los CPU son servidores que están disminuyendo, porque para procesar y trabajar sobre ‘big data’, se requiere procesamiento paralelo, y por lo tanto, servidores GPU. Los GPU también se componen de CPU, pero sólo se utilizarán para gestionar procesos específicos.
El CPU, entonces, es parte de una infraestructura más grande si lo que se busca es crear contenido.
(Aciente). Para poder trabajar y producir, todo tiene que estar muy unido. Se crea una red especial en el centro de datos, cuya conectividad es diferente. Por lo tanto, esa conectividad es mucho más cara que el cobre utilizado hoy (para conectar e interconectar).
¿El cobre es suficientemente rápido como vía de transmisión?
El cobre no puede transferir los datos con la velocidad que se necesita. Se usa fibra óptica, que es diez veces más cara. Además, para reducir la latencia, los GPU tienen que estar juntos, lo que le da vida a la terminología ‘cluster’. Esta palabra se refiere a un espacio pequeño de muy alta densidad, y debido a la potencia de procesamiento, habrá una gran carga y consumo de energía. Así que el reto para procesar una gran cantidad de datos es el consumo de energía en un espacio pequeño. Eso hace que (quienes diseñan los centros de datos que incorporan IA) tengan un enfoque totalmente diferente. Hay que pensar cómo enfriar el centro de datos, ese lugar pequeño, de alta densidad y temperatura.
"El mundo entero está cambiando mucho. Por ejemplo, los centros de datos más sofisticados pueden encontrarse en universidades".
Se usa aire y agua.
El aire no es suficiente para un espacio de alta densidad. Se opta por la refrigeración líquida. Si tienes un centro de datos donde no se desarrollan grandes modelos lingüísticos –no se entrena la IA, sino que sólo se utiliza–, no tiene sentido utilizar toda la refrigeración líquida, sino un modelo híbrido de aire y agua, pero este último recurso solo se usa en espacios específicos.
¿Cómo se está desarrollando la industria de los centros de datos en América Latina?
Hablaré de Sudamérica, porque no tengo todas las cifras de Latinoamérica. Sudamérica representa un 5% del total de centros de datos en el mundo, que es poco. Pero al mismo tiempo, la demanda está ahí. Vemos muchos centros de datos prefabricados en Sudamérica. De hecho, nuestra fábrica está en Brasil porque hay una demanda muy alta […] Perú es muy famoso. Trabajamos mucho con minas en el Perú.
¿Mineras que operan actualmente?
(Aciente) Las minas son muy sofisticadas en Perú. Vigilan la salud de la gente –incluso su estado mental–, la calidad del aire, entre otras cosas. Todo esto lo hacen desde sus centros de datos, que están impulsados por la IA, porque tienen que analizar y predecir el riesgo potencial que puede correr una persona. Trabajamos muy estrechamente con las minas.
Y en Sudamérica, además de la minería, ¿alguna otra industria se destaca?
Trabajamos con industrias totalmente distintas en Sudamérica. La sanidad es una de ellas. El mundo entero está cambiando mucho. Por ejemplo, los centros de datos más sofisticados pueden encontrarse en universidades. América del Sur crecerá muy rápido. La capacidad de los centros de datos se duplicará en los próximos 3 a 5 años.
"Pero lo que también es importante en América del Sur cuando se construye un centro de datos, es que tenemos 28 parámetros diferentes que seguir. Cuando hablamos de sostenibilidad, por ejemplo, es importante ver cuánta agua se utiliza y cuál es el impacto en el medio ambiente".
¿Ve este desarrollo empresarial como un B2C o como un B2B?
Nuestro cliente es quien utiliza el centro de datos. En Sudamérica, muy a menudo nos asociamos con una compañía en un país específico. Por ejemplo, en Chile colaboramos con una empresa local en la construcción de un centro de datos prefabricado con una solución antisísmica ubicado en las montañas. Increíble […] Siempre intentamos asesorar al cliente para que no construya un nuevo centro de datos, sino que adapte el que ya tiene y lo amplíe. Para eso, se trabaja en el diseño desde el inicio.
El diseño de un centro de datos es 100% personalizado, entonces.
Sí. Por lo general es personalizado, y puede ser escalable. América del Sur es una de las mejores regiones respecto a la discusión energética, porque cuando se mira el conjunto de países o continentes donde se utiliza más energía verde, Sudamérica es la región más grande.
El Perú representa aproximadamente el 0,2% de la contaminación global. Nuestra matriz es principalmente hidroléctrica.
(Aciente) Sí. En Brasil, la energía es un 80% solar, hidroeléctrica y eólica. Chile pretende alcanzar el 70% en 2030, si no me equivoco. Muy pocos países pueden estar orgullosos de esas cifras. Ya tenemos en Sudamérica centros de que están conectados a la red (tradicional), pero que también utilizan energía solar. Algunos centros de datos tienen incluso paneles solares en los techos.
Chile comenzó la transición energética de su matriz hace casi 10 años. Pero, la base de la que partió Chile en términos de contaminación era más crítica que la peruana. Hoy, usan mucha energía solar, por ejemplo, que está creciendo rápido en el mundo.
Está creciendo. Lo vemos en el desarrollo de centro de datos y en lugares donde no hay físicamente ninguna otra fuente de energía. La energía solar se volverá más barata.
¿Tanto como para alcanzar su uso masivo?
Absolutamente. Se abaratará. Si nos fijamos en otras energías, son cada vez más caras y así seguirá siendo. Pero lo que también es importante en América del Sur cuando se construye un centro de datos, es que tenemos 28 parámetros diferentes que seguir. Cuando hablamos de sostenibilidad, por ejemplo, es importante ver cuánta agua se utiliza y cuál es el impacto en el medio ambiente.
En Sudamérica tenemos una naturaleza increíble. Lo que realmente aprecio es que se tenga en cuenta el impacto medioambiental a la hora de construir un centro de datos.
En Sudamérica existe una conversación, especialmente en Chile, Perú y Bolivia, sobre el litio para las baterías y el hidrógeno verde como fuentes de energía. Ambos se encuentran también en las discusiones sobre cómo alimentar los centros de datos de manera más eficiente. ¿Cómo percibe esta discusión? No solo en Sudamérica, sino a nivel mundial.
Todo el mundo habla de ello porque hoy se buscan soluciones sostenibles. Se trata de consumir la misma energía pero ser más eficiente en ese consumo.
La refrigeración gratuita ahorra mucha energía, y todo se puede monitorear a través de un software que utilizamos en el centro de datos, que también está basado en IA. Este software no solo recopila los datos, sino que los analiza y brinda consejos sobre cuándo utilizar refrigeración libre, cuándo usar el aire o el agua y qué procesos se pueden automatizar… Los centros de datos deben ser respetuosos con el medio ambiente y Sudamérica es muy buena en ello.