Grandi novità nel mondo della biochimica e, di riflesso, della biologia e della medicina. Il team di Deep Mind (Google), in collaborazione con il The Francis Crick Institute e l’University College of London, ha messo a punto un software basato su reti neurali (= intelligenza artificiale, abbreviato in inglese AI) capace di operare predizioni accurate sul meccanismo di ripiegamento delle proteine. Questa scoperta, che potenzialmente risolve un vecchio ed intricato problema, è a dir poco rivoluzionaria (qui il link al paper, pubblicato su Nature). Ma che significa?

Facciamo un passo indietro. Cosa è una proteina? Tutti gli organismi, unicellulari o monocellulari (quindi dal batterio all’uomo passando per celenterati, giraffe, balene e gatti), sono composti, appunto, da cellule. La cellula è il mattone di base della vita sulla terra. Cellule specializzate operano compiti differenti (lunga storia, ma in breve: un neurone ed una fibra muscolare sono entrambe cellule ma sono molto diverse fra loro). Ma tutte le cellule hanno una caratteristica comune: gli elementi biochimici che le compongono.

Questi elementi possono riassumersi in quattro macro-categorie (la stiamo semplificando al massimo):

  1. Gli zuccheri (glucosio, fruttosio, galattosio, ecc.) – rappresentano il carburante essenziale per la sopravvivenza della cellula e, in misura minore, una parte della sua impalcatura.

  2. I grassi (più tecnicamente detti lipidi) – sono la componente principale delle membrane delle cellule e la loro riserva ultima di energia quando gli zuccheri scarseggiano.  

  3. Gli acidi nucleici (DNA ed RNA) – Il codice genetico che serve alla cellula per produrre i suoi ingranaggi e riprodursi.

  4. Le proteine, appunto. Le proteine sono tantissime e sono letteralmente l’impalcatura e il motore delle cellule. Noi funzioniamo grazie alle proteine. Possiamo dire che viviamo, grazie alle proteine. Le proteine possono essere strutturali (le fibre delle piante, quelle muscolari, i prolungamenti dei neuroni), funzionali (gli enzimi, quelle meravigliose strutture che sono letteralmente dei micro-motori molecolari in grado di tagliare, cucire, mettere insieme, convertire), di segnale (come i recettori o gli ormoni), ecc.

Ora: le proteine hanno una struttura molto complessa con quattro livelli di complessità crescente. Il primo, definito struttura primaria, è comune a tutte le proteine e rappresenta semplicemente la sequenza lineare delle componenti fondamentali della proteina. Questa sequenza è costituita da aminoacidi. Gli aminoacidi sono piccole molecole con caratteristiche particolari. L’uomo necessita di venti aminoacidi diversi, alcuni li produce, altri li prende con la dieta. Gli aminoacidi possono essere idrorepellenti (cioè possono respingere l’acqua, più correttamente detti “idrofobici”) o avere delle cariche elettriche (positive o negative) che li fanno interagire maggiormente con l’acqua (che, ricordiamo, è il mezzo in cui tutte queste molecole navigano e lavorano) o legare preferenzialmente ad altri aminoacidi. Una proteina “stesa”, nella sua forma più semplice, è una catena di aminoacidi in fila.

Qua viene il bello: gli aminoacidi, come detto, hanno proprietà diverse, quindi alcuni si attraggono, altri si respingono, altri ancora si legano fra loro in maniera quasi indissolubile, altri si legano con legami più deboli. La fila degli aminoacidi, a causa di queste proprietà elettriche, tende quindi a piegarsi. E lo fa in ben tre modi diversi.

La struttura secondaria della proteina rappresenta la tendenza degli aminoacidi a formare due strutture più complesse: le alfa eliche ed i foglietti beta. In pratica immaginate di avere un filo molto, ma molto lungo (la proteina nella sua forma più basilare) e di metterlo steso sul pavimento. A questo punto in alcuni punti del filo create una specie di spirale cilindrica, e ripetete l’operazione più volte in modo da ottenere varie spirali cilindriche una in fila all’altra. In altri punti, invece, accostate segmenti di filo uno accanto all’altro in modo che un pezzo di filo diventi una specie di mini-foglietto in 2 dimensioni. Ecco, questa è la struttura secondaria, grazie alle interazioni fra aminoacidi. Qualcosa del genere:

Fonte qua

Non è finita. Come detto, le alfa eliche e i foglietti beta rappresentano una struttura secondaria. Ma gli aminoacidi contenuti in queste strutture interagiscono fra loro nuovamente, formando agglomerati sempre più complessi. Questa è la struttura terziaria, una cosa così:

Qui la fonte

Infine, se due grossi “fili agglomerati” così prodotti interagiscono e si legano l’uno all’altro, questo definirà la struttura quaternaria della proteina, che a questo punto è completa.

Non tutte le proteine seguono questi passaggi. L’insulina, che è il famoso ormone responsabile dell’assorbimento di zucchero, è una proteina molto piccola che non ha, per esempio, struttura quaternaria. Al contrario l’emoglobina, una proteina molto più grande e complessa responsabile del trasporto di ossigeno, contiene diverse subunità (proteine più piccole) aggregate fra loro e addirittura un “gruppo eme” (ossia una molecola diversa contenente un atomo di ferro), al centro. Esistono proteine ancora più grandi, a volte contenenti migliaia di subunità che si snodano dentro la cellula stessa. Un esempio è quello dell’actina/miosina, proteine responsabili della contrazione muscolare. Altre proteine sono incredibilmente complesse nella struttura, come l’ATP sintasi (qui una simulazione della sua struttura), letteralmente una delle proteine grazie alle quali viviamo, essendo responsabile della conversione ultima di ossigeno e zucchero in energia attiva per la cellula.

Come si fa a capire la struttura terziaria e quaternaria della proteina e a cosa ci serve? Le risposte brevi sono: “è un bel casino” e “a tutto”. Elaboriamo un po’.

Partendo dal primo quesito, prendiamo un esempio eclatante: la “huntingtina”. Questo gigante delle proteine, che contiene oltre 3000 aminoacidi, ha una struttura estremamente complessa che serve ad altre proteine per espletare le loro funzioni. Non l’avrete mai sentita nominare, ma una sua errata codifica ereditaria è responsabile di una malattia serissima simile al Parkinson, la Corea di Huntington. La huntingtina è stata prima sequenziata, poi studiata con complesse tecniche di laboratorio (microscopia elettronica, cristallografia a raggi x, ecc.) per capirne la struttura terziaria. Questo processo ha richiesto anni e non è ancora del tutto perfezionato. Soprattutto, nel caso di una proteina deficitaria nella sua sequenza e quindi nella sua funzione, è estremamente complesso capire quali siano le “zone” di quell’ammasso di aminoacidi da andare a modificare. L’errato ripiegamento delle proteine è alla base di tantissime altre patologie serie, quali la fibrosi cistica, il morbo di Parkinson, la demenza.

Il problema fondamentale che nessuna macchina è mai riuscita a risolvere finora è capire a priori, data la sequenza base degli aminoacidi della proteina, come facciano questi ad interagire per far sì che la proteina si ripieghi esattamente in quel modo ed esplichi quella funzione. Immaginate un mostro di 3000 aminoacidi che devono interagire fra di loro per produrre una proteina: il numero di possibili combinazioni è quasi un fattoriale.

AlphaFold sembra aver risolto questo problema. Utilizzando un algoritmo che tenga conto sia delle proprietà basilari dei singoli aminoacidi sia della loro tendenza a ripiegarsi formando alfa eliche, foglietti beta, strutture terziarie e quaternarie, il programma può prevedere la struttura finale di quella proteina e le sue interazioni. Un risultato che nessuno, in 100 anni di storia della biochimica, era mai riuscito a raggiungere.

Quindi a cosa serve? Sostanzialmente alla cura mirata di diverse delle patologie menzionate sopra. Se sappiamo cosa va storto e perché, nell’erroneo ripiegamento della proteina, abbiamo capito il punto cruciale su cui agire.

C’è di più, anzi molto di più. Un’altra delle applicazioni potenziali è quella di poter produrre nanotecnologie in maniera estremamente più rapida e soprattutto efficiente. Proteine ingegnerizzate in laboratorio grazie ad algoritmi AI potrebbero essere in grado di trasportare medicine alle cellule target, riparare i tessuti, o addirittura agire sul processo di editing del DNA per poter risolvere patologie croniche o letali quali cancro, diabete, ipertensione. O condizioni para-fisiologiche quali… l’invecchiamento. Insomma, se confermata e se efficace (qui la prudenza è d’obbligo), questa scoperta è letteralmente una delle più grandi rivoluzioni degli ultimi decenni.

The future is now.