Un laboratorio di federated learning per la pediatria

Timothy Chou
6 min readMar 19, 2023

--

Finalmente abbiamo la possibilità di trasformare l’assistenza sanitaria per i bambini che per motivi geografici o sociali hanno difficoltà di accesso alle cure, attraverso l’uso di applicazioni di intelligenza artificiale. Come abbiamo discusso, le tradizionali architetture centralizzate non sono adatte per addestrare e sviluppare applicazioni sanitarie di intelligenza artificiale che siano accurate, che siano responsive in tempo reale e che tutelino la privacy. E abbiamo visto come il federated learning per le applicazioni di intelligenza artificiale per i consumatori rappresenta un’interessante soluzione tecnica, che viene sviluppata su architetture altamente decentralizzate (milioni di smartphone) che richiedono modeste risorse di rete e che preservano la privacy.

Un approccio ideale alla costruzione di applicazioni AI per la pediatria che siano altamente accurate, capaci di lavorare in tempo reale e che tutelino la privacy, richiederebbe l’accesso ai dati da tutti i dispositivi medici in tutti gli ospedali del mondo. Se parlassimo di dispositivi per l’ecocardiografia si tratterebbe di circa 1.000.000 di dispositivi in 500 ospedali pediatrici: un vero “Pediatric Moonshot”. Per raggiungere un obiettivo così ambizioso, stiamo sviluppando un laboratorio di federated learning progettato per rispondere a un’ampia gamma di quesiti di ricerca.

Ma prima che queste attività di ricerca possano essere affrontate, dobbiamo risolvere alcune questioni: i software sviluppati per l’AI per i consumatori sono un buon modello anche per la pediatria? Quale strategia dovremmo usare per il training degli algoritmi? Dato che sarebbe difficile sviluppare applicazioni di intelligenza artificiale senza dati, con il Laboratorio di Federated Learning intendiamo affrontare e risolvere questi problemi. Questo laboratorio si concentrerà prima sulla cardiologia, ma presto seguiranno neurologia e radiologia (e altre discipline), come vedrete nei prossimi post.

Il Federated Learning Lab ha cinque componenti.

1. Un servizio di edge cloud, decentralizzato e locale

BevelCloud è stata fondata con una missione ambiziosa che ha bisogno di mezzi innovativi. Per questo ha progettato un servizio di edge cloud decentralizzato e locale. Nella configurazione iniziale sono disponibili cinque servizi: edge computing, edge storage, edge network, edge data e edge application. Inoltre, il sistema include 37 funzionalità di sicurezza (security by design), inclusi meccanismi di condivisione dei dati ad alta risoluzione. Gli edge server forniscono anche l’anonimizzazione delle immagini diagnostiche con il partner ISV, Glendor. L’idea di BevelCloud è quella di sviluppare e distribuire applicazioni per la cardiologia pediatrica e successivamente per l’ortopedia, radiologia, oncologia, neonatologia e altre discipline, così come Apple ha creato un marketplace per applicazioni consumer.

L’infrastruttura di BevelCloud offre soluzioni ad alcuni dei problemi che sono stati riscontrati nelle applicazioni di federated learning per i consumatori. In particolare, gli edge server di BevelCloud comunicano continuamente con i dispositivi medici con una larghezza di banda elevata sia all’interno della edge zone che all’esterno. In secondo luogo, gli edge server rimangono sempre accesi, caratteristica interessante se si considera che un ecografo rimane in funzione almeno 16 ore per 7 giorni alla settimana e che durante tutto questo tempo si può utilizzare potenza computazionale per il federated learning. Infine, grazie ai servizi di edge data, ogni applicazione nell’edge cloud accede a dati con formattazione identica indipendentemente dal fatto che gli edge server si trovino a Roma, a Orange County o a San Paolo del Brasile.

2 Cento server, cento ecografi connessi

Il secondo componente dell’implementazione iniziale del Federated Learning Lab è la costruzione di una rete di almeno sei ospedali pediatrici in due continenti. Il laboratorio permetterà l’accesso in tempo reale alle immagini non compresse di 100 ecografi tramite applicazioni autorizzate su 100 edge server dedicati

3 Condivisione di grandi quantità di dati diversi in modo continuo

Mettere in rete 100 ecografi consentirà ai ricercatori che si occupano di intelligenza artificiale di accedere a dati ecografici grezzi (non compressi) in tempo reale. Dato che gli edge server sono connessi direttamente, le applicazioni non risentiranno degli attuali problemi legati all’estrazione di dati compressi da una varietà di applicazioni PACS. Durante il primo anno di funzionamento, un’applicazione di federated learning sarà addestrata su oltre 100.000 terabyte di dati ecografici diversi.

4 Una app open source basata su AI per la cardiologia su edge cloud

Per standardizzare ulteriormente il Federated Learning Lab, verrà sviluppata un’applicazione di cardiologia AI open source per misurare la frazione di eiezione sulle immagini ecocardiografiche. Questa operazione è utile per consentire a ogni utente del Federated Learning Lab di partire dalla stessa base per valutare i successivi miglioramenti. L’applicazione sarà disponibile come applicazione edge cloud.

5 Competenza in cardiologia pediatrica per siti diversi e approvazione da parte del comitato etico

Insieme alla Dottoressa Reddy della Stanford University, stiamo preparando un protocollo internazionale per siti diversi per governare il laboratorio. I ricercatori che parteciperanno al Federated Learning Lab avranno accesso all’esperienza combinata di sei cardiologi pediatrici che potranno fornire competenze di dominio agli utenti del laboratorio.

Sarà necessario rispondere a diversi quesiti di ricerca, a cominciare dal più elementare: il modo di sviluppare il software per l’AI dei consumatori sarà applicabile all’AI pediatrica? Mentre la maggior parte delle esperienze nel federated learning per l’assistenza sanitaria si è svolta attraverso un modello cross-silo, il Federated Learning Lab funzionerà in un modo più convenzionale, un modello cross-device. Si tratta di comprendere quanto questo modello può essere valido in un nuovo dominio. Tra i vari esempi da considerare, ci sono i seguenti:

Acuratio è una piattaforma aziendale con soluzioni per dati partizionati orizzontalmente e verticalmente. (https://acuratio.com/ ). Raccomandato dal Comitato spagnolo per la protezione dei dati.

DynamoFL semplifica l’addestramento del modello su set di dati sensibili per la privacy utilizzando il federated learning e la privacy differenziale. (https://www.dynamofla.com/)

FedML è una comunità open source, come piattaforma aziendale per l’IA aperta e collaborativa (https://fedml.ai)

FLARE (Federated Learning and AI for Robotics and Edge) è un software stack creato per la distribuzione di modelli AI su dispositivi edge.

Flower è una piattaforma di ricerca open source per la formazione di modelli con federated learning, sviluppata da adap e dall’Università di Cambridge.

HP Swarm Learning un sistema per la decentralizzazione dell’aggregazione dei dati.

OpenFL è un progetto di librerie Python* 3 supportato dalla community e originariamente sviluppato da Intel Labs e Intel Internet of Things Group.

NimbleEdge lavora sull’apprendimento automatico iper-personalizzato sull’edge mobile. (https://www.nimbleedge.ai/)

PySyft è una libreria open source sviluppata per il federated learning sicuro e privato.

TensorFlow Federated (TFF): TFF è un framework open source sviluppato da Google per implementare il federated learning. ()

Anche al di là della domanda su quale software di federated learning puntare, ci sono molti altri importanti quesiti che gli informatici che lavorano attivamente in quest’area saranno in grado di affrontare, tra cui….

Quali sono le implicazioni di un allentamento dei vincoli tradizionali del federated learning per i consumatori sul federated learning per la medicina? L’allentamento dei vincoli modifica le funzionalità fornite dal software di federated learning?

Esiste una strategia di aggregazione migliore di altre? Dovremmo aggregare i coefficienti della rete neurale all’interno di una edge zone prima di aggregarli a livello globale?

Dovremmo considerare lo split learning (apprendimento solo su metà del modello di rete neurale) prima di inviare i risultati al server di aggregazione, come proposto dal team del MIT?

Quale deve essere considerata la versione di rilascio del modello dato il potenziale per l’apprendimento continuo?

Questa è solo una piccola parte degli importanti quesiti di ricerca che verranno affrontati dal Federated Learning Lab.

Infine, attualmente esistono diversi progetti di ricerca sull’intelligenza artificiale nel mondo che sono completamente isolati. Ad esempio, insieme allo Shiners Children’s Hospital abbiamo identificato 91 ricercatori che si occupano di applicazioni di intelligenza artificiale applicata alle patologie della colonna vertebrale. La maggior parte delle attività di ricerca di intelligenza artificiale attualmente finisce con la pubblicazione di un lavoro scientifico, ma ben poco oltre a questo. Come possiamo trasferire questa conoscenza alla pratica clinica?

Continuate a leggere per capire come possiamo trasferire la ricerca sull’intelligenza artificiale dal laboratorio al letto del paziente.

Special thanks to Alberto Tozzi, Head of Predictive and Preventive Medicine Research Unit at Ospedale Pediatrico Bambino Gesù for the translation to Italian. Also, thanks for extensive editing to the English version by Laura Jana, Pediatrician, Social Entrepreneur & Connector of Dots; Leanne West, Chief Engineer of Pediatric Technology at Georgia Tech.

--

--

Timothy Chou
Timothy Chou

Written by Timothy Chou

www.linkedin.com/in/timothychou, Lecturer @Stanford, Board Member @Teradata @Ooomnitza, Chairman @AlchemistAcc

No responses yet