Publicația industriei TECH regionale

Biologia sintetică – cel mai spectaculos și promițător domeniu al științei

În ultimii cinci ani am asistat la începutul celei de-A Treia Revoluții Industriale. Nu comentez numerotarea, la Davos s-a vorbit, probabil din motive de marketing, că ar fi vorba despre a patra, dar aceasta este o chestiune secundară.
Acest nou stadiu de dezvoltare a societății umane a fost posibil datorită acumulărilor excepționale din științele naturale și dezvoltării masive a digitalului din ultimele două decenii. Practic, ele au dus la instalarea în zona de avangardă a economiei a patru domenii: fabricația aditivă, fabricația robotică, inteligența artificială și biologia sintetică.
Toate patru au un suport semnificativ în cercetarea științifică fundamentală și în dezvoltarea infrastructurilor IT, în special în domeniile care au crescut în ultimul timp, adică big data, cloud computing și Internet of things.
În anul 2012 Ikea (fostă companie suedeză producătoare de mobilă cu rezidența fiscală actuală în Olanda) a luat calea robotizării masive a producției și a împachetării produselor utilizând roboți ABB și Yaskawa.
În anul 2014 Midea (companie chineză producătoare de electrocasnice) a realizat prima fabrică pentru instalații de aer condiționat complet robotizată (800 de roboți au înlocuit 24.000 de oameni) utilizând roboți și proiectare de la Kuka. Între timp, Midea a cumpărat Kuka urmând ca locurile de muncă din Germania să fie transferate în China începând cu anul 2023.
Tot în anul 2014, Unilever făcea prima campanie de marketing global utilizând inteligență artificială pentru a realiza personalizare la scară mare. De atunci, tot mai multe domenii care presupun interacțiune utilizând limbaj natural și bazându-se pe un set de reguli încep să devină apanajul acestui domeniu. Fabricația aditivă a avut un parcurs mai lent, dar acesta a fost accelerat în ultimii ani prin utilizarea sa în construcții și în fabricația de bunuri personalizate.
Dintre toate aceste domenii însă, cel mai spectaculos și promițător pare a fi cel al biologiei sintetice.
Biologia sintetică este un domeniu relativ tânăr. Chiar dacă despre el se vorbește din anul 1910, primul pas serios avea să se întâmple abia în anul 1994 când s-a demonstrat utilitatea unei tehnologii de tip zinc finger în tratamentul cancerului.
Dar data de naștere a biologiei sintetice este anul 2010, atunci când Craig Venter realiza prima celulă sintetică capabilă să trăiască și să se înmulțească, după ce în anul 2008 odată cu cartografierea genomului uman în anul 2003, domeniul a cunoscut o dezvoltare rapidă, creșterea cea mai mare a sa survenind după anul 2012 când Jennifer Doudna și Emmanuelle Charpentier au pus la punct o tehnologie bazată pe CRISPR și complexul sgRNA:Cas9 a permis editarea genomului la un cost de circa 100$/genă.
Biologia sintetică are azi ca obiect realizarea de structuri vii programate fie prin sinteza directă, fie prin editarea structurilor existente utilizând instrumente sintetice. Aplicațiile sunt greu de enumerat datorită multitudinii lor, dar principalele categorii vizează medicina umană și veterinară, agricultura, industria alimentară, știința materialelor, combustibilii, științele creierului, inteligența artificială, robotica hibridă și protetica, arta și moda. Mai mult, în acest an a fost realizat primul organism viu stabil cu genomul pe șase litere, adică primul organism non-terestru, care a sintetizat o proteină inexistentă până acum.
Odată cu ridicarea biologiei sintetice, centrul global al științei și tehnologiei s-a mutat la Boston, acolo unde Harvard și MIT sunt principalele motoare globale ale cercetării în domeniu.
Datorită importanței uriașe a unui domeniu care face parte, în sens larg, din tehnologia informației, m-am hotărât să scriu o serie de articole de popularizare a lui pentru că:

  • Este un domeniu accesibil oricărui om cu formație științifică sau tehnologică, fiind la granița dintre acestea, adică ni se potrivește.
  • Este un domeniu în care (prin școala de chimie și cea de biologie celulară) avem o tradiție semnificativă în România, adică avem resurse.
  • Nu necesită investiții mari și este în principal bazat pe inteligența și cunoștințele umane, având o mare valoare adăugată.
  • Mai mult, prin similitudinea cu tehnologia informației clasică, reprezintă o zonă în care specialiștii din acest domeniu pot migra, pregătind astfel exit-ul dintr-un domeniu în care inteligența artificială va face să dispară grosul locurilor de muncă în următorii 10-15 ani.

În articolele ce urmează voi schița domeniul biologiei sintetice și voi scrie câte ceva despre aplicațiile sale, voi indica surse din care cei interesați se pot documenta, link-uri la laboratoare care comercializează moleculele necesare realizării unui proiect, kit-uri de laborator și documentații pentru experimente simple ce pot fi realizate (cu precauțiile de rigoare) acasă, la clasă sau în laborator. Voi încerca să mă adresez într-un limbaj cât mai apropiat de cel al inginerilor IT, chiar dacă acolo unde nu voi avea încotro vor apărea și simboluri chimice. Dacă cititorii lui PIN Magazine vor fi interesați de acest domeniu, voi realiza un mic serial, ca un soi de ghid pentru începători.
Figura 1 – Structura chimică a digiților (literelor) din codul genetic în genomul natural cu 4 litere (A,T/U,G,C) și în genomul sintetic cu 6 litere (A,T/U,G,C,X,Y)

Pentru început mă gândesc să descriu pe scurt elementele care țin de codarea și organizarea informației la nivelul unei celule. Spre deosebire de un calculator electronic, celula realizează operațiuni în baza 4 sau, după construcția genomului cu șase litere, în baza 6. De altfel, după ce s-a realizat modificarea unei celule de Escherichia Coli pentru a avea în genom 6 litere, putem vorbi despre posibilitatea teoretică de construcție a unui genom în orice bază pară. Paritatea este impusă de structura complementară a celor două catene ale ADN-ului. Cu alte cuvinte, bitul (care în cazul unui circuit digital poate avea două stări, 0 sau 1) are în cazul structurilor vii un număr par de stări, în mod natural acesta fiind 4 (adenină, timină, guanină și citozină), iar în cazul genomului modificat în acest an, 6 (adenină, timină, guanină, citozină, X și Y). Aceasta în cazul ADN-ului, în ARN timina fiind înlocuită de uracil. Stările bitului se numesc litere și ele sunt codificate chimic. Structura chimică a acestor digiți este prezentată în Figura 1. Complementaritatea digiților ține de modul în care ei interacționează electrostatic, prin legăturile de hidrogen. Astfel, vor exista doar următoarele complementarități: A-T/U, G-C și X-Y. Această complementaritate se manifestă în cazul celor două catene ale ADN-ului și generează cunoscuta geometrie spirală a acestuia. De menționat, și lucrul acesta se observă ușor privind structura chimică a digiților că legătura A-T/U conține două legături de hidrogen spre deosebire de și fiind mai slabă decât cea G-C care conține trei legături de hidrogen.
Aceștia sunt biții și stările lor în oricare genom. Evident, fiind obiecte chimice ei au nevoie de un suport material pe care să fie așezați. Coloana vertebrală a acestei structuri digitale are o formă simplă fiind o succesiune de molecule de fosfat și (dezoxi)riboză, atomul 1 de carbon al (dezoxi)ribozei legându-se de digit, iar atomii 3 și 5 ai ribozei legându-se de moleculele de fosfat adiacente. O asemenea structură permite înșiruirea digiților în lungul unei catene de ADN sau ARN și un control simplu al secvențelor prin eliminarea unei molecule de fosfat sau adăugarea unei secvențe care începe cu o moleculă de fosfat în capătul 3’ al catenei (Figura 2). O asemenea structură joacă rolul unei memorii permanente în care este stocată informația și ea permite copierea unor porțiuni din informația respectivă, duplicarea sa în totalitate, repararea sa (în cazul ADN-ului) prin redundanța asigurată de cele două catene complementare și o serie de alte funcționalități despre care vom vorbi mai târziu.
În anul 2003 s-a încheiat Human Genome Project în care a fost cartografiat în totalitate genomul uman. Între cartografiere și cunoașterea rolului fiecărei secvențe este un drum lung. De aceea, proiectul a fost urmat imediat de proiectul ENCODE, proiect care își propune să identifice toate elementele funcționale din genom, intrat în anul acesta în a patra etapă a sa.
Pornind de la cercetările făcute în cadrul ENCODE, se pare că structura funcțională a ADN-ului cunoscută azi este următoarea:

  • 1% din ADN codează proteine
  • 7.2% din ADN codează modul în care se exprimă 1% din ADN care codează proteine. Cu alte cuvinte, dacă proteina codată este sintetizată, cum și cât de des
  • Restul de 91.8% este deocamdată terra incognita. Probabil că nu codează direct nici proteine nici expresia genelor. O parte este compusă din ARN neimplicat în codarea proteinelor, secvențe implicate în transcriere, introni, telomeri, și alte obiecte despre care vom vorbi mai târziu și care necesită continuarea studiului ADN-ului pentru a fi înțelese.

În acest articol voi vorbi despre cea mai simplă parte din codul genetic și anume despre acel 1% care se referă la sinteza proteinelor.
Figura 2 – Structura unei catene de ADN sau ARN

DNA – Genome Editing – Abstract Illustration

Ca și în cazul circuitelor digitale unde biții sunt grupați logic (și în cazul circuitelor propriu-zise, fizic), digiții biologici sunt și ei grupați. Spre deosebire de circuitele digitale în care grupul elementar s-a încetățenit a fi octetul (8 biți), în cazul codului biologic grupare elementară este de 3 și poartă numele de codon.
Pentru a înțelege rolul codonilor în sinteza proteinelor, să spunem câte ceva despre proteine și rolul lor. Din tot ce știm până acum, scopul celulei este supraviețuirea. Aceasta presupune o serie de procese consumatoare de energie care îi permit menținerea formei structurii și funcționării celulei, multiplicarea acesteia și autodistrugerea sa atunci când informația conținută în ADN este compromisă. Toate aceste procese sunt realizate prin intermediul unor reacții chimice, proteinele jucând un rol esențial în realizarea lor fie ca participanți efectivi, fie având rol catalizator.
O proteină este structură simplă, dar a cărei complexitate poate fi foarte mare, constând într-o înșiruire de aminoacizi. Din punct de vedere structural, un aminoacid este o structură simplă formată dintr-o moleculă de amino (NH2), un radical (R) care personalizează aminoacidul și o moleculă de carboxil (COOH), toate trei legate prin intermediul unui atom de carbon. Structura aceasta permite înlănțuirea aminoacizilor. Astfel, molecula de hidroxil (OH) captează un atom de hidrogen al aminei (NH2) formând o moleculă de apă și generând o legătură între atomul de carbon al carboxilului și cel de azot al aminei. Această legătură poartă numele de legătură peptidică iar obiectul astfel obținut se numește proteină. Se pot genera în acest mod proteine complexe, conținând un număr mare de aminoacizi și având o geometrie extrem de sofisticată.
Ca orice lucru complex, geometria unei proteine se reduce însă la două mecanisme simple. Primul se referă la planeitatea conexiunii peptidice, planeitate care dă posibilitatea rotației radicalilor în jurul legăturilor C-C. Acest fapt permite ca orientarea în spațiu a radicalilor să poată să difere, aceasta fiind afectată de un al doilea mecanism, cel electrostatic, mecanism care conferă proteinelor o structurare de o complexitate deosebită. Geometria proteinelor joacă un rol extrem de important în felul în care ele acționează, fiind alături de compoziția chimică a lor un element determinant.
În interiorul celulei, proteinele sunt codate în ADN și produse de macromolecule numite ribozomi. Ribozomul a fost descoperit de către Emil Palade și el acționează ca un automat care înșiruie aminoacizii în funcție de informația pe care o primește.
Sigur, trei biți cu patru stări pe bit pot coda un număr între 0 și 63 (adică . Asta înseamnă că un codon poate coda 64 de instrucțiuni pe care urmează să le proceseze ribozomul. Dacă din cele 64 de coduri am scădea două (codul pentru START și cel pentru STOP), ar rămâne 62 pentru identificarea aminoacidului care urmează să fie sintetizat. În genom lucrurile nu stau însă așa. Există o redundanță mare și, în cazul genomului uman, proteinele sunt construite utilizând numai 20 de aminoacizi. Un codon format din doi biți ar fi insuficient, pentru că poate codifica doar cel mult 14 aminoacizi plus comenzile de start și stop, așa că avem de a face cu codoni pe trei biți. În am prezentat codificarea corespunzătoare celor 20 de aminoacizi din celula umană. Am înlocuit Timina cu Uracilul, pentru că reprezentarea am făcut-o din punctul de vedere al ribozomului care citește ARN-ul mesager, adică un ARN, dar tabelul arată identic pentru ADN dacă înlocuim înapoi U cu T. De exemplu, Alanina se poate coda în următoarele moduri: GUU, GUC, GUA sau GUG, în timp ce Arginina se codează în unul dintre modurile: CGU, CGC, CGA, CGG, AGA sau AGG, iar Triptofanul doar prin UGG.
Nu există o explicație pentru felul acesta destul de ineficient și de neregulat de codare al aminoacizilor și nici pentru faptul că sunt utilizați doar 20 de aminoacizi pentru generarea de proteine. Evident, nu este o limitare dată de codare.
Fiecăruia dintre cei 20 de aminoacizi îi corespunde o secvență de ARN (ARN-ul de transport sau tRNA) care atașează la capătul 3’ aminoacidul pe care îl transportă către ribozom. Codul care reprezintă succesiunea de aminoacizi este copiat la rândul lui din ADN într-o secvență de ARN (ARN-ul mesager sau mRNA) fixat de ribozom și parcurs de acesta. Secvențele de tRNA sunt procesate de la 5’ la 3’, ARN-ul de transport este detașat de aminoacid și eliberat în celulă iar aminoacidul obținut astfel atașat secvenței deja construite. Pentru ca întregul complex tRNA:aminoacid să poată fi astfel procesat, zona lui care conține codonul complementar trebuie să corespundă codonului curent procesat din ARN-ul mesager. Toate moleculele implicate în acest proces, adică tRNA-ul specific fiecărui aminoacid și ribozomul însuși sunt codate în ADN, o secvență ADN completă putând astfel genera toate procesele majore care au loc la nivel celular.
Aceasta este foarte pe scurt povestea codării și sintezei proteinelor. Vom vedea în următoarele articole că ea este esențială, alături de expresia genelor, pentru înțelegerea și abordarea bolilor, pentru procesele de anti îmbătrânire și inversarea îmbătrânirii, pentru sinteza de substanțe utile și pentru multe alte aplicații. Vom vedea cum poate fi genomul editat în celula vie și, mai ales, cât de la îndemână sunt procedeele de editare. Sigur, programarea viului a devenit un lucru relativ simplu. Problema nu este însă să tăiem în ADN și să înlocuim secvențe ci ce tăiem și cu ce înlocuim. Iar acesta este un subiect mult mai dificil.
Diferența dintre știința a ce tăiem și cu ce înlocuim și cum tăiem este oarecum similară cu diferența dintre arhitectul software și programator. În cazul biologiei sintetice vorbim însă de cel puțin 100 de ani asigurați pentru meseria de arhitect și cel puțin 30 pentru cea de programator.

Distribuie și tu:

RECOMANDATE

Articole similare

7 ani de #FabLab în Iași

Asociatia Fab Lab Iași sărbătorește 7 ani de la deschiderea primului său spațiu de coworking, timp în care a devenit un catalizator al inovației tehnologice,