Comparația dintre QPCR și ARN-seq dezvăluie provocările cuantificării expresiei HLA partea 2

Normalizare

Am folosit estimări de expresie în transcrieri per milion (TPM), care este normalizarea standard produsă de Salmon și corespunde cantității relative a unei transcriere date dintr-o probă. Pentru orice genă dată, estimarea este pur și simplu suma TPM-urilor pentru transcrierile sale. În unele cazuri, când prezentăm estimări transformate normale standard, am efectuat o transformare normală de rang a datelor RNAseq utilizând pachetul GenABEL R (Aulchenko et al. 2007), care este de obicei aplicat, de exemplu, în modelele liniare de cartografiere eQTL (Delaneau). et al. 2017).

Cartografierea QTL este o metodă de a studia mecanismul de reglementare al expresiei genelor prin compararea asocierii dintre expresia genei și polimorfismul genei într-o populație. Modelul liniar este o metodă de cartografiere eQTL utilizată în mod obișnuit, care poate folosi un model de regresie liniară pentru a estima corelația dintre expresia genelor și polimorfismul genei.

Sistemul imunitar este un sistem biologic complex care protejează organismul de infecții și boli precum cancerul. Reglarea expresiei genelor joacă un rol important în sistemul imunitar și poate afecta dezvoltarea, diferențierea și funcția celulelor imunitare.

Prin urmare, modelele liniare de cartografiere eQTL pot fi utilizate pentru a analiza relația dintre mecanismele de reglare a expresiei genelor și imunitate. De exemplu, studierea corelației dintre un anumit genotip și expresia unei gene imune cheie într-o populație poate dezvălui influența acestui genotip în reglarea expresiei genei imune. O astfel de cercetare poate oferi o iluminare importantă pentru tratamentul și prevenirea bolilor imunitare. Acest lucru arată importanța imunității, așa că trebuie să ne îmbunătățim imunitatea în fiecare zi. Carnea tocată are, de asemenea, efecte antivirus, anticancerigene și alte efecte, care pot întări imunitatea Capacitatea sistemului de a rezista și de a îmbunătăți imunitatea organismului.

cistanche wirkung

Faceți clic pe beneficiile pentru sănătate ale cistanche

Citiți alinierea la genomul de referință

Pentru analiza acoperirii citirii la genele HLA raportate în Fig. S7, am aliniat citirile la genomul de referință GRCh38 cu STAR v2.7.3a (Dobin și colab. 2013), folosind adnotările genei Gencode v37. Pentru a controla prejudecățile de cartografiere la genele HLA, am procesat în continuare fișierele BAM cu hlamapper v4.3 (Castelli et al. 2018).

Simulare

Date de bază

Pentru a genera date simulate, am rulat mai întâi Salmon v1.3.0 (Patro et al. 2017) pe eșantionul real #66K00003 pentru a afla nivelurile de expresie ale transcrierilor Gencode v37. Apoi am folosit pachetul Polyester (v1.26.0) pentru a genera 50 de probe sintetice cu niveluri de expresie identice la nivelul transcriptomului, cu excepția HLA-A, -B și -C. Nivelurile de expresie pentru aceste gene s-au bazat pe 50 de indivizi aleși aleatoriu din datele noastre reale (pentru care avem disponibile date despre alelele HLA). Pentru fiecare genă HLA, am selectat izoformele care au reprezentat cel puțin 90 la sută din expresia totală a transcriptului care codifică proteina într-o rulare Salmon pe setul de date real (care a dus la doar 1 transcriere per genă) și am personalizat secvențele de transcriere în conformitate cu Alele HLA purtate de fiecare individ.

Această procedură ne-a permis să generăm sintetic 50 de indivizi cu niveluri identice de expresie de fundal, dar cu expresie HLA variabilă și cu polimorfism HLA încorporat în citirile simulate.

Pentru a oglindi datele noastre reale, au fost simulate treizeci de milioane de citiri la capătul pereche de 126 bp cu o dimensiune medie a fragmentului de 261 bp pentru fiecare individ, folosind valorile implicite pentru alți parametri de poliester (de exemplu, abaterea standard a lungimii fragmentului=25 bp, rata de eroare=0.005, distribuție uniformă a citirilor și nicio părtinire). Polyester produce fișiere FASTA, din care am produs fișiere FASTQ cu un scor de calitate constant (simbolul corespunzător „F”).

Metrici pentru acuratețe

TPM-urile au fost calculate pe numărări simulate având în vedere lungimile transcrierii și dimensiunea medie a fragmentului de 261 bp. Raportul „Estimated TPM/True TPM” este utilizat pentru a evalua performanța în recuperarea nivelurilor de expresie simulate și ne permite să observăm scăderea sau supraestimarea.

Grafică

Am pregătit toate parcelele din acest articol folosind pachetul ggplot2 v3.3.2 (Wickham 2016) în R.

cistanche effects

Rezultate

Precizia cuantificării ARN-seq HLA

Având în vedere absența unei metode care poate fi considerată standardul de aur experimental pentru cuantificarea expresiei HLA din datele ARN-seq, inițial am evaluat acuratețea metodelor de cuantificare ARN-seq pentru HLA folosind date simulate în care nivelurile de expresie adevărate sunt cunoscute deoarece sunt generate. într-un computer pentru a emula experimente reale. Acest lucru a fost făcut pentru a alege cea mai bună abordare computațională dintre metodele bazate pe ARN-seq, permițând un contrast ulterior cu abordările non-ARN-seq.

Am simulat un experiment ARN-seq pentru 50 de indivizi folosind pachetul Polyester (Frazee et al. 2015). Acești indivizi sintetici au aceleași niveluri de expresie pentru toate genele din genom, cu excepția HLA-A, -B și -C, pentru care am variat nivelurile de expresie. De asemenea, am personalizat secvențele de transcriere HLA adnotate din Gencode v37 pentru a introduce variația genetică reală observată la indivizi aleși aleatoriu dintr-un set de date de 96 de indivizi (care au fost genotipați HLA prin secvențierea Sanger, așa cum este descris mai jos). Transcrierile personalizate rezultate au avut o identitate de secvență mediană cu o referință mai mare de 95 la sută pentru toți loci HLA.

Am comparat estimările expresiei HLA obținute prin două metode bioinformatice: (1) „Ref transcriptome”, care folosește Salmon (Patro et al. 2017) pentru a alinia citirile cu transcriptomul de referință standard, cuantificând abundența transcriptului și (2) „Personalizat”, care folosește și somon, dar hărțile citesc transcrieri HLA personalizate, reflectând genotipul HLA al individului (Fig. 1). Abordarea „personalizată” extinde strategia noastră anterioară (Aguiar et al. 2019) folosind o transcriere personalizată, mai degrabă decât o singură secvență de codificare canonică pentru fiecare alelă purtată de individ.

cistanche in store

Metoda „Ref transcriptome” a subestimat nivelurile de expresie, în special pentru alelele cu o proporție mai mare de diferențe de secvență referitoare la genomul de referință (Fig. 1). Acest lucru este de așteptat, deoarece o rată mai mare de nepotrivire între citiri și referință are un impact negativ asupra alinierii (Brandt et al. 2015). Această abordare a supraestimat, de asemenea, expresia HLA-C pentru unii indivizi, o consecință a citirilor de la HLA-B fiind mapate la transcrierile de referință HLA-C (Fig. S1). Abordarea „personalizată”, pe de altă parte, controlează părtinirea cartografierii și realizează acuratețea optimă.

Deși simularea noastră oferă rezultate încurajatoare în ceea ce privește cuantificarea expresiei HLA folosind ARNseq, trebuie să luăm în considerare câteva avertismente. Am modificat secvența izoformelor adnotate în funcție de alelele HLA ale indivizilor folosind un singur set de izoforme pentru toate alelele la o anumită genă HLA. Aceste secvențe au fost utilizate atât în simularea citirilor, cât și în cuantificarea expresiei; astfel, ne așteptăm la o precizie optimă. Într-un scenariu real, diferite alele HLA ar putea fi asociate cu diferite izoforme. Mai târziu în această lucrare, vom discuta un exemplu specific pe care l-am observat pentru HLA-A, în concordanță cu ipoteza că anumite izoforme sunt exclusive pentru alele specifice. Cu toate acestea, având în vedere că suntem interesați în principal de estimările expresiei la nivel de genă și la nivel de alele HLA, ne așteptăm ca secvențele personalizate să reprezinte o îmbunătățire față de un singur transcriptom de referință prin reducerea distorsiunii de cartografiere.

Estimarea expresiei HLA din datele ARN-seq reale

Am efectuat estimarea expresiei pe datele ARN-seq transcriptomului întreg pentru 96 de indivizi, pentru care au fost estimate anterior nivelurile de expresie de suprafață qPCR pentru HLAA, -B și -C și HLA-C (Kulkarni și colab. 2013; Ramsuran și colab. 2015, 2017) și ar putea fi utilizat pentru a compara cu rezultatele ARNseq (vezi Fig. S2 pentru analizele QC pe datele ARN-seq).

Având în vedere acuratețea mai mare a abordării personalizate în simulare, contrastăm această metodă de estimări ale expresiei bazate pe ARN-seq cu cea a altor abordări non-ARN-seq, dar oferim rezultatele pentru abordările bazate pe transcriptom de referință în „Informații suplimentare. " Am personalizat secvențele de transcriere având în vedere genotipurile individuale HLA obținute prin secvențierea Sanger. Am rulat HLApers (Aguiar et al. 2019) și Kourami (Lee și Kingsford 2018) pentru a deduce alele direct din datele ARN-seq și pentru a confirma apelurile Sanger (a se vedea „Materiale și metode”).

Estimările expresiei la nivel de genă arată că HLA-B are cea mai mare expresie dintre loci HLA din setul nostru de date, urmat de HLA-C și HLA-A (Fig. 2A). Această ordonare este în concordanță cu setul de date GTEx de sânge integral (GTEx Consortium 2020) și cu o metodă anterioară RNAseq de captare a HLA aplicată PBMC-urilor (Yamamoto et al. 2020). Cu toate acestea, acest tipar diferă de cel observat de Boegel și colab. (2018), care au observat niveluri similare între gene folosind o strategie diferită pentru a se ocupa de cartografierea citirilor la mai mulți loci, ceea ce poate contribui la lipsa distincției între loci în ceea ce privește nivelul de expresie. ). Studiile viitoare vor trebui să detacheze contribuția diferențelor de metodologie sau de compoziție de tip celular la aceste diferențe.

cistanche cvs

Compararea ARN-seq și qPCR pe date reale

Apoi am comparat estimările expresiei ARN-seq cu cele obținute cu qPCR (Fig. 2B). Deși corelația dintre expresia ARN-seq și qPCR a fost semnificativă statistic pentru toate genele (p=0.{024, 0.002, 0.000000016, pentru HLA-A, -B și -C, respectiv; testul Spearman pentru asociere pozitivă), magnitudinea corelațiilor a fost modestă pentru HLA-A și -B și mai mare pentru -C. Utilizarea unei referințe personalizate pentru ARN-seq a crescut modest corelația cu qPCR în comparație cu o referință standard (Fig. S3). Acest lucru este de acord cu observația noastră anterioară conform căreia estimările expresiei la nivel de genă nu sunt substanțial diferite între abordările bazate pe genom de referință sau personalizate pentru genele HLA clasa I (Aguiar et al. 2019), principalul beneficiu al abordărilor personalizate fiind estimările de la Nivelul alelei HLA, pe care îl explorăm mai jos. Utilizarea corecției părtinirii la somon (prejudecățile GC, părtinirea specifică secvenței și prejudecățile specifice poziției) îmbunătățește corelația cu qPCR, cu cel mai mare impact pentru HLA-B (comparați Figurile 2B și S4, pentru datele corectate și necorectate, respectiv).

cistanche vitamin shoppe

Compararea nivelurilor de ARNm cu expresia de suprafață

Deoarece expresia ARN este informativă despre etapele inițiale ale semnalizării celulare și ale răspunsului la stimuli, analizarea relației sale cu fenotipurile moleculare din aval (cum ar fi expresia proteinelor pe suprafața celulei) ne poate ajuta să înțelegem rolul reglării post-transcripționale și post-translaționale asupra Expresia HLA. Sunt de așteptat diferențe între abundența de ARN și proteine, deoarece acestea sunt supuse unor moduri distincte de reglare. Efectele tehnice pot introduce, de asemenea, diferențe, deoarece tehnicile de ARN și proteine diferă și sunt afectate de tipuri de erori necorelate (Li și Biggin 2015; Kaur et al. 2017; Carey et al. 2019). Mai mult, în cazul studiului nostru, expresia genelor a fost măsurată pe PBMC totale, în timp ce expresia proteinei a fost măsurată pe celule CD3 plus sortate. Având în vedere această diferență, am măsurat gradul în care proteina HLA de pe suprafața celulei poate fi prezisă prin expresia ARNm. Această analiză a fost efectuată exclusiv pentru HLA-C, deoarece este singurul locus pentru care este disponibil un anticorp care poate lega toate alelele cu afinități egale. Interesant, a existat o corelație ridicată între ARNm și expresia proteinei pentru HLAC, cu o corelație puțin mai mare pentru ARN-seq (Fig. 2C).

Expresia la nivel de alele HLA

Genele HLA adăpostesc elemente de reglare asociate cu transcripția constitutivă și transcripția activată dinamic (René et al. 2016). Ca rezultat, expresia HLA variază în funcție de țesut și poate fi modulată de rețele de reglare declanșate de diferiți stimuli (Anderson 2018; Carey și colab. 2019). Există un interes din ce în ce mai mare pentru a înțelege dacă alelele HLA distincte sunt asociate cu diferite niveluri de expresie bazală și programe de reglare (Aguiar et al. 2019; Gutierrez-Arcelus et al. 2020) și dacă această variație contribuie la fenotipurile bolii sau la rezultatele transplantului (Petersdorf și colab. al. 2014, 2015; René et al. 2016; Bettens et al. 2022; Johansson et al. 2022). Prin urmare, estimările expresiei la nivel de alele HLA pentru qPCR și ARN-seq au fost comparate. Deoarece alelele individuale sunt adesea destul de rare în setul de date, le-am grupat pe linii alelice (adică, grupuri de alele care sunt definite filogenetic prin relația dintre exoni) (Elsner și colab. 2002).

Am clasat liniile în funcție de nivelurile lor de expresie pe baza atât a datelor ARN-seq cât și a qPCR și am evaluat concordanța clasamentelor între metode (Fig. 3). Abordarea noastră personalizată ARN-seq oferă în mod direct estimări la nivel de alele, deoarece secvențele de alele HLA sunt folosite pentru a indexa aliniamentele, așa că am ordonat liniile alelice în funcție de nivelurile lor medii de expresie. Deoarece estimările noastre de expresie qPCR sunt la nivelul genei și nu oferă direct estimări la nivel de alele, am ordonat liniile alelice în funcție de efectele lor într-un model liniar al nivelurilor de expresie explicate de genotipul HLA (vezi Ramsuran și colab. 2015). În Fig. 3, valorile expresiei sunt reprezentate grafic de două ori pentru fiecare nivel pentru fiecare alelă a individului, iar pentru qPCR, este pur și simplu exprimarea la nivel de genă reprezentată de două ori, reflectând prezența a două alele.

cistanche uk

Ordinea estimărilor de expresie este mai similară între ARN-seq și qPCR pentru HLA-C decât pentru -A și -B (diferența medie de ordine absolută, unde diferența de ordine se referă la diferența observată în poziții într-o ordine ordonată a valorilor de expresie , între ARN-seq și cuantificarea qPCR, de 2,3 pentru HLA-C, 3,1 pentru -A și 3,9 pentru -B), urmând un model similar de acord cu cel al expresiei la nivel de genă, pentru care am găsit cea mai mare corelație între ARN-seq și qPCR pentru HLA-C.

Printre descendențele cu cea mai mare diferență între ARN-seq și qPCR este A*11. Am măsurat expresia de suprafață pe un subset de heterozigoți pentru A * 03 sau A * 11 folosind un anticorp care are afinitate egală pentru ambele linii și am observat că qPCR se corelează mai puternic cu expresia pe suprafața celulară a acestor două alotipuri decât ARN-seq (Fig. S5). În continuare, prezentăm o evaluare mai extinsă a ordonărilor alelelor prin comparații cu studiile anterioare ale expresiei ARNm HLA.

Deși există interes în compararea diferențelor de expresie între alelele HLA, diferite studii arată că variația expresiei în cadrul unei alele sau al unei linii alelice este adesea destul de mare, iar diferențele dintre alelele de diferite ranguri sunt adesea mici și nesemnificative. În consecință, poate fi nerealist să ne așteptăm la menținerea rangurilor pe mai multe alele și poate fi preferabil să se compare estimările de expresie pentru alele la extremele de expresie.

Pentru datele noastre ARN-seq, comparăm estimările noastre cu cele din două abordări anterioare ARN-seq adaptate HLA pe PBMC. Există o concordanță generală bună cu Yamamoto și colab. (2020), unde A*24, A*02, C*04 și C*06 sunt foarte exprimate, iar A*03, C*03 și B*15 sunt exprimate la niveluri scăzute, deși vedem și diferențe precum în ceea ce privește B*35, care ar fi mai de acord cu datele noastre qPCR. Când comparăm datele noastre ARN-seq cu Johansson și colab. (2021), totuși, vedem mult mai multe diferențe, deși au mostre foarte mici pentru multe linii.

De asemenea, contrastăm rezultatele noastre cu cele din două studii qPCR anterioare care au aplicat primeri specifici alelelor. Bettens și colab. (2014) au folosit primeri specifici alelelor pentru unele linii HLAC și au văzut C*04 și C*06 ca fiind foarte exprimate, în timp ce C*07 și C*03 au fost exprimate la niveluri scăzute, în concordanță cu ceea ce avem pentru ambele ARN-seq. și qPCR. René și colab. (2015) au aplicat primeri specifici alelelor pentru HLA-A și au observat A*02 (ridicat) și A*29 (scăzut) la extremele de expresie, ceea ce este mai de acord cu rezultatele noastre ARNseq decât cu qPCR; cu toate acestea, vedem multe diferențe la alte linii alelice

În unele cazuri, putem evalua și acordul cu studiile funcționale. De exemplu, analizele anterioare ale situsurilor de legare a factorului de transcripție (TFBS) și ale activității promotorului (revizuite în Anderson 2018) și studiile privind reglarea miARN (Kulkarni et al. 2011), arată că C*03 și C*07 sunt alele slab exprimate, care este de acord cu observațiile noastre atât pentru ARN-seq cât și pentru qPCR.

Surse potențiale pentru diferențe

Apoi am investigat dacă procesarea probelor utilizate pentru ARN-seq ar fi putut contribui la diferențele dintre estimările de expresie obținute cu qPCR și ARN-seq.

O preocupare specifică a fost perioada de timp în care probele au fost depozitate într-un congelator de -80 de grade (aproximativ 4 ani între testele qPCR și ARN-seq), precum și alți pași specifici experimentului ARN-seq, inclusiv dezghețarea probelor. Pentru a rezolva acest lucru, am efectuat un al doilea experiment RNAseq pe sânge proaspăt extras de la 11 indivizi, care sunt un subset din cei 96 analizați în acest studiu și am comparat estimările expresiei între cele două puncte de timp. Chiar dacă acest al doilea test prezintă atât diferențe tehnice, cât și biologice în ceea ce privește primul experiment ARN-seq (Fig. S6A și B), corelația la nivel de transcriptom în estimările expresiei între punctele de timp este mare (Fig. S6C).

Deși evaluarea corelației cu 11 indivizi poate fi zgomotoasă, corelațiile la genele HLA sunt printre cele mai mari corelații genice între cele două probe (Fig. S6D și F). Am calculat, de asemenea, rapoartele alelelor intra-individuale, care este raportul de expresie între cele două alele HLA ale unui individ heterozigot și le-am comparat între momentele de timp. Corelația a fost mai mare decât 0.94 pentru HLA-A, -B și -C (Fig. S6E). Prin urmare, nu am văzut nicio dovadă a unei contribuții majore a degradării ARN pentru a explica corelația scăzută dintre ARN-seq și qPCR în proba noastră originală.

O altă contribuție posibilă la diferențele dintre ARN-seq și qPCR este aceea că alela HLA specifică poate fi mai părtinitoare într-o metodă sau alta, caz în care indivizii care poartă astfel de alele ar contribui la diferențe mari. De exemplu, pentru indivizii care poartă A*03 sau pentru homozigoți pentru C*07, există o relație negativă între qPCR și ARN-seq (Fig. 4A).

cistanche sleep

O sursă suplimentară de diferențe între metode ar putea apărea din faptul că, în abordarea noastră ARN-seq, personalizăm toate transcrierile adnotate Gencode pentru fiecare alelă HLA; cu toate acestea, adevărata diversitate a transcripției și asocierea acesteia cu alele HLA specifice nu sunt bine înțelese. De exemplu, Kulkarni et al. (2017) au arătat că A*01 și A*11 produc 3′-UTR mai scurte. Pentru a investiga dacă putem replica această finanțare în datele noastre ARN-seq, am mapat citirile la genomul de referință și am corectat pentru maparea părtinirii genelor HLA cu un hla-mapper (Castelli et al. 2018). Într-adevăr, pentru persoanele care poartă A*01 sau A*11, acoperirea de citire la 3′-UTR a HLA-A arată o scădere bruscă la ~ 120 bp înainte de sfârșitul genei adnotate (Fig. S7).

cistanche capsules

Deoarece valorile transcripției per milion (TPM) sunt calculate ținând cont de lungimea de referință, utilizarea unei referințe care este mai lungă decât transcrierea adevărată duce la o subestimare a expresiei. Am încercat să controlăm posibilitatea unor astfel de transcrieri mai scurte prin includerea unei versiuni a fiecărei transcrieri HLA-A cu un 3′-UTR scurtat în indexul nostru pentru alinierea citirii. Cu toate acestea, nu am găsit nicio dovadă de exprimare a izoformei mai scurte (Fig. S8), posibil pentru că aceste izoforme mai scurte sunt conținute în izoformele de lungime normală, iar implementarea lui Salmon atribuie toate citirile izoformei mai mari. Interesant, expresia la nivel de izoforme dezvăluie o izoformă cu un 5′-UTR mai lung, exclusiv pentru A*11, care contribuie cu o mare parte din expresia totală a acestei alele (Fig. S8).

De asemenea, am testat o normalizare a estimărilor noastre de expresie, în care am ajustat lungimile de citire având în vedere acoperirea de citire care susține un capăt 3′-UTR proximal sau distal (media ponderată a lungimii transcripției folosind acoperirea de citire ca ponderi). Deși observăm un câștig de până la 20% în nivelurile de expresie pentru indivizii care poartă A*01 și/sau A*11, vedem doar o mică îmbunătățire a corelației cu qPCR după această ajustare (de la rho=0. 20 în Fig. 2 până la rho=0.24 în Fig. 4B).

A*01 și A*11 sunt printre alelele cu cele mai mari diferențe de rang între ARN-seq și qPCR (Fig. 3), iar o reprezentare imperfectă a transcrierilor asociate acestora în adnotare poate introduce părtinire în estimările noastre ARN-seq.

În cele din urmă, metodele de normalizare utilizate pentru a obține estimările finale ale expresiei din datele brute qPCR pot fi, de asemenea, o sursă de diferențe între estimările qPCR și ARN-vezi. Testele PCR cantitative pentru genele HLA clasa I amplifică de obicei regiunile din exonii 1 până la 4, iar standardizarea prin expresia unei gene de menaj, cum ar fi B2M (2-microglobulina) este de obicei efectuată (cum a fost cazul în studiul de față). ). Motivul pentru această procedură este că, dacă nivelurile de expresie sunt standardizate printr-o referință exprimată stabil, estimările pentru diferiți indivizi sunt puse pe aceeași scară, permițând astfel comparații între indivizi.

B2M codifică lanțul ușor din molecula HLA clasa I și este plauzibil ca genele B2M și HLA clasa I să aibă o anumită coordonare a expresiei, deoarece au în comun arhitecturi similare de promotor (Kobayashi și van den Elsen 2{{1{{12} }}}12; Vijayan și colab. 2019) și pot fi reglementate de factori de transcripție partajați (de exemplu, NLRC5/CITA induce expresia atât a clasei I HLA, cât și a B2M în liniile celulare Jurkat (Meissner și al. 2{{20}}10). Normalizarea expresiei genei HLA prin valori corelate poate introduce prejudecăți în estimările noastre qPCR, în special pentru HLA-B, pentru care vedem un nivel ridicat corelație cu expresia B2M (Fig. 4C).Scalarea unei variabile cu o variabilă diferită, dar corelată poate introduce perturbare prin aducerea valorilor extreme la mijlocul distribuției și reducerea varianței; în concordanță cu această ipoteză, coeficienții de variație pentru datele qPCR sunt 0,61 și 0,50 pentru HLA-A și respectiv -C, dar scade la 0,17 pentru HLA-B (ca o comparație, CV-urile pentru datele ARN-seq sunt 0,20, 0,14 și 0,29 pentru HLA-A, -B și -C , respectiv). Cu toate acestea, folosind același design qPCR, Ramsuran și colab. (2017) au normalizat expresia HLA-B fie de către genele B2M, GAPDH, 18 s și b-Actin și au observat rezultate foarte consistente, ceea ce nu susține un impact al normalizării B2M asupra estimărilor qPCR.

Discuţie

Estimările fiabile ale expresiei transcriptului HLA pot contribui la diverse întrebări de cercetare și, deși rezultatul bolii este frecvent explorat în contextul variației codării HLA, nivelurile de expresie sunt, de asemenea, probabil să explice variația rezultatelor clinice (revizuit în Dendrou et al. 2018; și în Johansson și colab. 2022). Nivelurile de expresie au, de asemenea, potențialul de a informa deciziile atunci când planificați transplantul de celule stem hematopoietice; de exemplu, dacă o potrivire perfectă nu este disponibilă în selecție pentru donatorii alogene, pare benefică selectarea celor care sunt nepotrivite la alelele cu expresie scăzută (Petersdorf et al. 2014, 2015). Estimări fiabile ale expresiei transcripției pot ajuta, de asemenea, la identificarea eQTL-urilor care stau la baza controlului exprimării HLA, care ar putea fi integrate în constatările GWAS, prin interogarea dacă hit-urile cunoscute în regiunea MHC coincid cu eQTL-urile pentru genele HLA (vezi, de exemplu, Tabelul S6 în Aguiar et al. 2019). Mai general, estimările îmbunătățite ale expresiei transcriptului HLA ne vor ajuta să înțelegem arhitectura genetică a reglării HLA, identificând contribuția relativă a variantelor cu acțiune cis (adică, cele din vecinătatea genei HLA pe care o reglează) și a variantelor de tranzacționare (cele aflate la distanță). locații genomice, inclusiv pe alți cromozomi). Acest lucru va oferi informații cu privire la gradul în care variația expresiei HLA este o proprietate specifică alelei față de o caracteristică inter-individuală independentă de identitatea alelică (vezi Bettens și colab. 2022).

Tehnicile PCR cantitative ne-au permis să descoperim asocieri între expresia HLA și fenotipurile bolii. Mai recent, ARN-seq a devenit metoda de alegere pentru a evalua expresia genelor în seturi mari de date ale transcriptomului întreg ale diferitelor populații. A fi capabil să extragă informații precise pentru exprimarea HLA din astfel de date este o provocare importantă și au fost propuse multe metode pentru a atinge acest obiectiv. Cu toate acestea, gradul în care rezultatele rezultate din analizele ARN-seq sunt de acord cu cele acumulate prin utilizarea qPCR este în prezent necunoscut. Deși aceste metode vizează același fenotip molecular (abundența ARN), ele diferă semnificativ în tehnicile experimentale utilizate, formele de analiză și normalizare a datelor, procedurile bioinformatice și prejudecățile la care sunt supuse.

Din cunoștințele noastre, studiile anterioare care comparau abordările ARN-seq adaptate HLA cu qPCR au inclus eșantioane mici. De exemplu, Johansson et al. (2021) și-au validat ARN-seq-ul țintit de HLA cu qPCR pe doar 5 probe la HLA-C, finanțând un coeficient de corelație Pearson de 0,9, care nu a fost semnificativ (p=0,08) .

În studiul de față, am comparat estimările cantitative ale expresiei PCR și ARN-seq pentru gena clasică HLA clasa I HLA-A, -B și -C într-un set potrivit de 96 de indivizi. Am găsit corelații modeste, dar semnificative în exprimare pe un eșantion de 96 de indivizi. Având în vedere lipsa unui standard de aur cu care să compare aceste estimări, erorile de estimare și părtinirile asociate ambelor metode pot contribui la rezultatul general.

Am explorat efectele diferiților factori care pot explica corelația scăzută dintre estimările ARN-seq și qPCR, cum ar fi estimarea slabă a expresiei pentru alelele HLA specifice și normalizarea de către o singură genă de menaj în qPCR. Rezultatele noastre nu pot fi generalizate la fiecare proiect qPCR sau conductă ARN-seq, pentru care există o mare varietate de abordări diferite. Cu toate acestea, din cunoștințele noastre, aceasta este prima comparație directă între qPCR și ARN-seq pentru estimarea expresiei HLA.

Studiul nostru sugerează zone care necesită îmbunătățiri în determinarea expresiei transcriptului HLA. Comparațiile între ARN-seq și qPCR, de exemplu, ar trebui să utilizeze procesarea uniformă a probelor între metode (de exemplu, același protocol de izolare a ARN, timp de depozitare/dezghețare, integritatea ARN) pentru a limita diferențele artefactuale asociate cu aceste metode. Cartografierea citirilor scurte la un singur genom de referință sau transcriptoame generează părtiniri și sunt necesare strategii care să țină cont de polimorfismul HLA. Având în vedere că există mai multe strategii pentru a realiza acest lucru (Boegel et al. 2012; Lee et al. 2018; Aguiar et al. 2019; Gutierrez-Arcelus et al. 2020; Darby et al. 2020), va fi esențial să se compare precizia relativă a acestor abordări.

Există, de asemenea, nevoia de a dezvolta metode care să țină seama în mod adecvat de variația izoformei, nu numai pentru a oferi un alt strat de informații, ci și estimări de expresie mai precise, deoarece normalizarea numărătorilor de citire printr-o lungime incorectă a transcripției este o sursă potențială de eroare. În acest context, datele citite îndelung, care generează direct informații complete de transcriere, pot fi un instrument puternic (Cornaby et al. 2022). În cele din urmă, variația numărului de copii, o caracteristică cunoscută pentru anumiți loci HLA (de exemplu, DRB), ar trebui de asemenea luată în considerare atunci când se cuantifică nivelurile de expresie.

Mulțumiri

Mulțumim Tatiana Torres (Universitatea din São Paulo), Yang Luo (Școala Medicală Harvard) și membrilor Consorțiului Comun de Biologie din Boston, pentru discuțiile lor utile.

Contribuția autorului

Diogo Meyer, Mary Carrington, Richard M. Single și Vitor RC Aguiar au contribuit la conceperea și designul studiului. Pregătirea materialului, colectarea datelor și experimentele au fost efectuate de Maureen P. Martin, Veron Ramsuran, Smita Kulkarni, Arman Bashirova, Danillo G. Augusto și Mary Carrington. Analiza datelor a fost efectuată de Vitor RC Aguiar, Erick Castelli, Richard M. Single, Maria Gutierrez-Arcelus și Diogo Meyer. Manuscrisul a fost scris de Vitor RC Aguiar și Diogo Meyer. Toți autorii au citit, au contribuit și au aprobat manuscrisul final.

Finanțarea

Agenția de finanțare din São Paulo (FAPESP, http://www.fapesp. br/en/) a oferit finanțare DM (2012/18010-0 și 2013/22007-7) și VRCA (2014/{{ 5}} și 2016/24734-1). National Institutes of Health, SUA a oferit finanțare către DM (NIH R01 GM075091), care a susținut o parte a postdoc-ului VRCA. Conselho Nacional de Desenvolvimento Científco e Tecnológico (CNPq) și Ministerul Sănătății, Brazilia au oferit finanțare pentru experimentele ARN-seq și vizitele de călătorie de cercetare, ca parte a unei propuneri comune SUA-Brazilia acordată MC și DM (470043/{{13} }). NIH/NIAID R01AI157850 acceptă SK. VR a fost finanțat de Consiliul de Cercetare Medicală din Africa de Sud (SAMRC) cu fonduri de la Departamentul de Știință și Tehnologie (DST); și, de asemenea, sprijinit parțial prin Rețeaua Africană Subsahariană pentru Excelență în Cercetare TB/HIV (SANTHE), o inițiativă DELTAS Africa (grant nr. DEL-15-006) de către AAS.

Acest proiect a fost finanțat în întregime sau parțial cu fonduri federale de la Laboratorul Național Frederick pentru Cercetarea Cancerului, sub contractul nr. HHSN261200800001E. Conținutul acestei publicații nu reflectă neapărat punctele de vedere sau politicile Departamentului de Sănătate și Servicii Umane și nici menționarea denumirilor comerciale, a produselor comerciale sau a organizațiilor nu implică aprobarea guvernului SUA. Această cercetare a fost susținută parțial de Programul de cercetare intramurală al NIH, Frederick National Lab, Centrul de Cercetare a Cancerului.

Disponibilitatea datelor

Datele ARN-seq prezentate în publicația curentă au fost depuse în și sunt disponibile din baza de date dbGaP sub accesarea dbGaP phs003177.v1.p1.

Referințe

1. Aguiar VRC, César J, Delaneau O, et al (2019) Estimarea expresiei și maparea eQTL pentru genele HLA cu o conductă personalizată. PLoS Genet 15:e1008091.

2. Alcina A, Abad-Grau MDM, Fedetz M et al (2012) Varianta cu risc de scleroză multiplă HLA-DRB1*1501 se asociază cu expresia ridicată a genei DRB1 în diferite populații umane. PLoS One 7:e29819.

3. Anderson SK (2018) Evoluția moleculară a elementelor care controlează expresia HLA-C: adaptare la un rol ca ligand al receptorului asemănător imunoglobulinei cu celule ucigașe care reglează funcția celulelor ucigașe naturale. HLA 92:271–278.

4. Apps R, Meng Z, Del Prete GQ și colab. (2015) Nivelurile relative de expresie ale proteinelor HLA clasa I în celulele normale și infectate cu HIV. J Immunol 194:3594–3600.

5. Apps R, Qi Y, Carlson JM, et al (2013) Influence of HLA-C expression level on HIV control. Science 340:87–91.

6. Arshad N, Laurent-Rolle M, Ahmed WS et al (2023) Proteinele accesorii SARS-CoV-2 ORF7a și ORF3a folosesc mecanisme distincte pentru a regla în jos expresia suprafeței MHC-I. Proc Natl Acad Sci USA 120:e2208525120.

7. Aulchenko YS, Ripke S, Isaacs A, van Duijn CM (2007) GenABEL: o bibliotecă R pentru analiza asocierii la nivel de genom. Bioinformatica 23:1294–1296.

8. Bachtel ND, Umviligihozo G, Pickering S, et al (2018) Reglarea descendentă a HLA-C de către HIV-1 se adaptează la genotipul HLA al gazdei. PLoS Pathog 14:e1007257.

9. Bettens F, Brunet L, Tiercy JM (2014) Variabilitatea alelică ridicată în expresia ARNm HLA-C: asociere cu haplotipurile extinse cu HLA. Genes Immun 15:176–181.

10. Bettens F, Ongen H, Rey G și colab. (2022) Reglarea expresiei HLA clasa I prin variații ale genelor necodante. PLoS Genet 18:e1010212

11.Boegel S, Bukur T, Castle JC, Sahin U (2018) In Silico Typing of Classical and Non-classical HLA Alleles from Standard ARN-Seq Reads. Methods Mol Biol 1802:177–191.

For more information:1950477648nn@gmail.com

Francisella și anticorpii partea 1

Rolul defensinelor în biologia tumorilor Partea 1

Comparația dintre QPCR și ARN-seq dezvăluie provocările cuantificării expresiei HLA partea 2

Normalizare

Citiți alinierea la genomul de referință