Aprendizaje federado

Aprendizaje federado es una de esas cosas que se pueden hacer con la Inteligencia Artificial (IA) que no son hablar con ella de tus problemas íntimos (o para lo que sea que la uses).

Muchas veces, especialmente los nuevos gurús “Expertos en IA”, no saben que la IA empezó a dar sus primeros pasos en los años 1940 con Warren McCulloch y Walter Pitts que proporcionaron el primer modelo matemático para una red neuronal. Posteriormente, aparecieron Alan Turing y una miríada de expertos que han llevado a la Inteligencia Artificial a un enorme abanico de posibilidades. Las IA generativas (si es que se pueden llamar así), son la mezcla de varias disciplinas: los avances en infraestructuras capaces de soportar los cálculos que antes eran imposibles y la de diversos descubrimientos como los Transformers, un tipo de arquitectura neuronal especial que son especialmente usados en la NLP (Natural Language Processing).

A partir de aquí, me parece ridículo que una persona que dice que sabe hacer “prompts” y conectarlo a una n8n o Make kilométrico se llame experto en IA.

Al grano, ¿qué es el aprendizaje federado?

Imagínate que eres un Hospital que tienes una gran cantidad de datos en tu haber y que has desarrollado un modelo de machine learning para poder predecir si un paciente puede desarrollar o no cierto tipo de cáncer o enfermedad aguda, como un infarto.

Pero, como sabes, el aprendizaje automático funciona mucho mejor con muchísimos datos, millones, lo que haría tu modelo un sistema especialmente preciso: a más datos, mejores resultados.

Si quieres mejorar tu algoritmo, ¿qué harías entonces? ¿Compartirías tus datos con otros hospitales?  Quizás lo puedas hacer si perteneces a algún tipo de unión entre hospitales; al menos en Catalunya, existe la red del Institut Català de la Salut (ICS), que tiene varios hospitales. ¿Pero y si quisieras ir más allá? Entonces te toparías con la GPDR y la Agencia de Protección de Datos, a los que no les haría mucha gracia el que vayas compartiendo datos ultrasensibles de los pacientes.

También puedes leer  La inteligencia Colectiva y las mixobacterias

Y aquí es donde aparece, tacháaaan, el Aprendizaje Federado (Chen Zang et al, 2020). El aprendizaje federado surge como una técnica de machine learning descentralizada que permite a las organizaciones entrenar modelos localmente pero sin compartir los datos en bruto.

Cada organización entrena un modelo local con sus propios datos y solo envía actualizaciones del modelo (pesos o gradientes) a un servidor central, que las agrega para mejorar el modelo global.

¿Qué quiere decir esto? Pues que si tú entrenas un modelo, pongamos, la detección precoz del cáncer de mama, un sistema externo puede combinar los datos de los modelos sobre la misma premisa para obtener un modelo entrenado con todos los datos en bruto, pero sin tenerlos.

Ahora mismo, Digipàtics (Vall d’Hebron, 2024), permite mejorar el diagnóstico del cáncer de mama a partir de la cuantificación de cuatro biomarcadores: HER2, Ki67, receptores de estrógenos y receptores de progesterona. Con un machine learning para cada uno.

Digipàtics cuenta ahora mismo con el Hospital Universitari Arnau de Vilanova, el Hospital Universitari de Bellvitge, el Hospital Universitari de Girona Doctor Trueta, el Hospital Universitari Germans Trias i Pujol, el Hospital Universitari Joan XXIII, el Hospital de Tortosa Verge de la Cinta y el Hospital Universitari Vall d’Hebron.

Parecen muchos hospitales, pero, ¿y si pudieras integrar a más hospitales para que los modelos aprendiesen de todavía más millones de pacientes?

Cuando el modelo centralizado empieza a recibir bien los pesos de cada uno de los nodos (neuronas) o el gradiente (que es un vector matemático que señala la dirección y magnitud del cambio necesario en los parámetros del modelo). Los datos quedan en cada uno de los hospitales y se va enviando cómo el modelo va cambiando, con lo que nos olvidamos del problema de los datos, enviando solo lo que es importante, cómo está evolucionando el modelo de cada uno.

También puedes leer  Humanos e IA: ¿cuándo colaboramos mejor?

Después de haberlos recibido, se hace una agregación de cada modelo: lo más habitual es hacerlo a través de una simple mediana: Federated Averaging (FedAvg) (Chen Zang et al, 2020).

Existen un montón de técnicas relacionadas con el Aprendizaje federado, como cifrado homomórfico, privacidad diferencial y Computación segura multiparte, pero el objetivo de este artículo es mostrarte las bases de esta técnica. Tampoco está exento de problemas técnicos como la calidad de datos o la precisión del modelo centralizado, aunque existen técnicas para mitigar estos riesgos.

¿Qué te parece? ¿Crees que esto podría empezarse a usar con la colaboración de miles de hospitales de todo el mundo para un diagnóstico eficaz de todo tipo de enfermedades graves?

El futuro será colectivo o no será.

El artículo original lo puedes encontrar en:

https://www.linkedin.com/pulse/aprendizaje-federado-la-ia-m%C3%A1s-all%C3%A1-del-chatbot-fede-montes-quiles-m90kf

#AprendizajeFederado

Referencias

Chen Zhang, Yu Xie, Hang Bai, Bin Yua, Weihong Li, Yuan Gao (2020). A survey on federated learning. ScienceDirecthttps://www.sciencedirect.com/science/article/abs/pii/S0950705121000381

Vall d’Hebron (2024). Els hospitals de l’ICS utilitzen la intel·ligència artificial per millorar el diagnòstic del càncer de mama. https://www.vallhebron.com/en/node/20534


¿Te ha parecido interesante este contenido?

¡Haz clic en una estrella para puntuarlo!

Promedio de puntuación 0 / 5. Recuento de votos: 0

Hasta ahora, ¡no hay votos!. Sé el primero en puntuar este contenido.

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Deja una respuesta

3 × tres =