Le architetture centralizzate non sono una buona soluzione per l’intelligenza artificiale in medicina

Timothy Chou
5 min readFeb 24, 2023

--

Sebbene sia istintivo pensare di affrontare le disuguaglianze delle cure e la mancanza di accesso alle strutture sanitarie ad esempio formando più medici, esiste una soluzione più potente per risolvere i problemi dei sistemi sanitari: le applicazioni di intelligenza artificiale.

Naturalmente, non tutte le intelligenze artificiali sono uguali. Le applicazioni di intelligenza artificiale per i consumatori hanno compiuto notevoli progressi nell’ultimo decennio applicando tecniche di deep learning e approfittando della disponibilità di grandi quantità di dati diversi. Tuttavia, l’approccio dell’architettura centralizzata usato nelle applicazioni per I consumatori non può funzionare per le applicazioni di intelligenza artificiale in medicina.

Come abbiamo discusso nel post precedente, nella medicina per adulti la maggior parte dei dati per queste applicazioni proviene da soli 3 stati e 2 paesi. Non è che i dati non esistano, intendiamoci. Pensiamo ad esempio agli ecocardiogrammi pediatrici. Cinquecento ospedali pediatrici nel mondo producono l’incredibile cifra di 6.000.000 TB di dati all’anno solo per le ecografie. Per comprendere questa dimensione, 6 milioni di TB sono 100.000 volte la quantità di tutti i dati attualmente disponibili nella base di dati centralizzata per l’Imaging dell’NIH. Proviamo ad immaginare l’accuratezza di un algoritmo per la diagnosi di una condizione cardiologica pediatrica che si potrebbe ottenere, sia a livello locale che globale, se i dati delle ecocardiografie pediatriche fossero utilizzati per addestrare applicazioni di intelligenza artificiale.

Se vi state chiedendo perché non potremmo semplicemente replicare quello che è stato fatto con ImageNet, il database centralizzato che rende disponibili oltre 14 milioni di immagini per addestrare algoritmi AI, e semplicemente aggregare i nostri dati ecografici pediatrici (così come tutti gli altri nostri repository di immagini pediatriche) in un database centralizzato, avete formulato una buona domanda. Consideriamo questa possibilità scegliendo prima un luogo dove questo può avvenire, diciamo un data center in Irlanda, e poi pensiamo ai dettagli di questo tipo di proposta centralizzata. Come vedrete, ci troveremo rapidamente ad affrontare almeno cinque problemi significativi.

Problema n. 1. Le architetture centralizzate non sono adatte ai network collaborativi.

Le architetture centralizzate richiedono maggiore larghezza di banda e reti più costose, quindi, una delle nostre prime considerazioni sarà il costo della rete. Ovviamente vorremmo una partecipazione globale, giusto? Quindi dovremo essere in grado di spostare i dati degli ecocardiogrammi dall’ospedale Gertrude’s Children’s in Kenya, da Hospital de Criança e Maternidade (HCM) in Brasile, e da Nemours negli Stati Uniti verso l’Irlanda. Naturalmente, dovremo anche tenere conto del fatto che alcune località avranno connessioni di rete non affidabili. E, come sanno tutti coloro che hanno familiarità con i fornitori di servizi cloud di oggi, ci saranno costi di rete aggiuntivi associati al trasferimento dei dati dal nostro sito centralizzato in Irlanda a qualsiasi altro luogo.

Problema n.2. Le architetture centralizzate non sono compatibili con applicazioni diverse.

Il processo di aggregazione dei dati in un’architettura centralizzata, repository o data commons richiede intrinsecamente che tali dati siano organizzati. Ogni volta che viene creato un database centralizzato, come il nostro repository ipotetico in Irlanda, viene creato uno schema o una struttura definita per organizzare i dati. Sfortunatamente, uno schema perfettamente progettato per un’applicazione, è quasi impossibile da utilizzare per un’altra applicazione. Anni di esperienza nel software aziendale ci hanno insegnato questa lezione. Il disegno di uno schema che rende i dati facilmente trattabili in un’applicazione, li rende poco o nulla gestibili in un’altra.

Problema n. 3. Le architetture centralizzate non consentono di gestire I dati in tempo reale.

Per capire perché è importante l’accesso in tempo reale ai dati che un algoritmo di intelligenza artificiale deve utilizzare per l’apprendimento, immaginate semplicemente se un’auto autonoma dovesse accedere a un server centrale per decidere cosa fare a ogni svolta o segnale di stop o per evitare un pedone. Il tempo necessario per accedere ai dati per ognuna di queste decisioni da un’architettura centralizzata in Irlanda (o in qualunque altro luogo) renderebbe l’applicazione del tutto inutilizzabile. La stessa cosa sarebbe valida per qualsiasi applicazione pediatrica che richieda una decisione in tempo reale.

Problema n. 4. Le architetture centralizzate non garantiscono la privacy.

Supponiamo di dover aggregare tutti i dati ecografici pediatrici da tutto il mondo in Irlanda. Come garantire la privacy di un paziente in California i cui dati vengono inviati e conservati in Irlanda? Come potremo controllare chi è stato in grado di accedere a quei dati? E come potremo impostare limiti su quali dati vengono condivisi? Qualcuno in Irlanda senza alcun collegamento con il paziente potrebbe avere accesso non solo ai dati ecografici pediatrici di un paziente, ma anche alle sue informazioni di identificazione personale.

Queste domande mettono in primo piano una considerazione molto importante sulla condivisione dei dati e sulla privacy nota come “Limitazione dello scopo”. In un mondo in cui ci aspettiamo sempre più che i dati specificati vengano utilizzati solo con il nostro permesso, da determinate persone e per scopi chiaramente definiti, l’accumulo di dati in un’architettura centralizzata va in direzione opposta, senza uno scopo dichiarato diverso dalla conservazione dei dati per il futuro. La condivisione dei dati in questa modalità, in Irlanda o in qualsiasi altro paese, non offre garanzie sufficienti per la privacy.

Problema n. 5. Le architetture centralizzate possono violare i requisiti di posizionamento dei dati in determinate aree geografiche.

Le organizzazioni sanitarie possono richiedere che i loro dati siano archiviati in una località o regione specifica all’interno del proprio paese. Inoltre, I singoli paesi possono regolamentare la localizzazione dei repositorty di dati. Anche se non abbiamo niente contro contro l’Irlanda, quasi certamente ci sarebbero molti paesi che si opporrebbero al fatto che i dati sanitari dei loro cittadini siano sotto il dominio irlandese.

Sebbene le architetture di intelligenza artificiale centralizzate abbiano svolto un ruolo straordinario nel potenziare lo sviluppo di molte applicazioni per i consumatori fino ad oggi, ci sono molteplici ragioni per cui questo non è un approccio conveniente per l’addestramento e la distribuzione delle applicazioni di intelligenza artificiale per la medicina pediatrica. Le architetture centralizzate non sono compatibili con applicazioni diverse, non supportano i network collaborativi, non gestiscono I dati in tempo reale e non garantiscono la privacy o il rispetto per la collocazione geografica dei repository di dati. Quindi qual è la soluzione? Come possono essere affrontate queste criticità in modo da poter costruire e implementare applicazioni di intelligenza artificiale accurate per la medicina pediatrica?

Continua a leggere per capire cos’è una architettura decentralizzata per l’intelligenza artificiale in medicina.

Special thanks to Alberto Tozzi, Head of Predictive and Preventive Medicine Research Unit at Ospedale Pediatrico Bambino Gesù for the translation to Italian. Also, thanks for extensive editing to the English version by Laura Jana, Pediatrician, Social Entrepreneur & Connector of Dots; Leanne West, Chief Engineer of Pediatric Technology at Georgia Tech.

--

--

Timothy Chou

www.linkedin.com/in/timothychou, Lecturer @Stanford, Board Member @Teradata @Ooomnitza, Chairman @AlchemistAcc