ROSAJANSKI DOLUNO - Dulïna se nalaža tu-w Reġuni Friuli-Venezia Giulia. Göra Ćanïnawa na dilä di mërä ta-mi to Laško anu to Buško nazijun.


IL SITO DEDICATO A TUTTO IL POPOLO RESIANO CHE TENACEMENTE CONTINUA A DIFENDERE LINGUA,CULTURA E TRADIZIONE


Il Popolo Resiano, lotta contro l'imposizione all'appartenenza alla Minoranza Nazionale Slovena

venerdì 24 aprile 2020

Caratterizzazione genetica degli isolati della popolazione italiana nord-orientale nel contesto di una più ampia diversità genetica europea

Astratto

Gli studi genetici sulla popolazione europea hanno evidenziato l'Italia come una delle regioni geneticamente più diverse. Ciò è probabilmente dovuto alla complessa storia demografica del paese e alla grande variabilità del terreno su tutto il territorio. Questo è il motivo per cui l'Italia è arricchita per gli isolati della popolazione, la Sardegna è l'esempio più noto. Poiché gli isolati della popolazione hanno un grande potenziale nell'identificazione delle varianti genetiche che causano malattie, abbiamo mirato a caratterizzare geneticamente una regione dell'Italia nord-orientale, nota per le comunità isolate. 
Un totale di 1310 campioni, raccolti da sei villaggi geograficamente isolati, sono stati genotipizzati in> 145000 posizioni di polimorfismo a singolo nucleotide. I dati di recente genotipizzazione sono stati analizzati congiuntamente ai set di dati disponibili in tutto il genoma di individui di origine europea, tra cui diversi isolati di popolazione. Nonostante le differenze linguistiche e l'isolamento geografico, le popolazioni dei villaggi mostrano ancora la più grande somiglianza genetica con altri campioni italiani. L'isolamento genetico e le dimensioni effettive ridotte della popolazione delle popolazioni del villaggio si manifestano con livelli più elevati di omozigosi genomica e elevato squilibrio del legame. Queste stime diventano ancora più sorprendenti se si tiene conto della sottostruttura rilevata. Il livello osservato di isolamento genetico nella regione Friuli-Venezia Giulia è più estremo secondo diverse misure di isolamento rispetto a sardi, baschi francesi e finlandesi del nord, dimostrando così lo stato di un isolato. Nonostante le differenze linguistiche e l'isolamento geografico, le popolazioni dei villaggi mostrano ancora la più grande somiglianza genetica con altri campioni italiani. L'isolamento genetico e le dimensioni effettive ridotte della popolazione delle popolazioni del villaggio si manifestano con livelli più elevati di omozigosi genomica e elevato squilibrio del legame. Queste stime diventano ancora più sorprendenti se si tiene conto della sottostruttura rilevata. Il livello osservato di isolamento genetico nella regione Friuli-Venezia Giulia è più estremo secondo diverse misure di isolamento rispetto a sardi, baschi francesi e finlandesi del nord, dimostrando così lo stato di un isolato. Nonostante le differenze linguistiche e l'isolamento geografico, le popolazioni dei villaggi mostrano ancora la più grande somiglianza genetica con altri campioni italiani. L'isolamento genetico e le dimensioni effettive ridotte della popolazione delle popolazioni del villaggio si manifestano con livelli più elevati di omozigosi genomica e elevato squilibrio del legame. Queste stime diventano ancora più sorprendenti se si tiene conto della sottostruttura rilevata. Il livello osservato di isolamento genetico nella regione Friuli-Venezia Giulia è più estremo secondo diverse misure di isolamento rispetto a sardi, baschi francesi e finlandesi del nord, dimostrando così lo stato di un isolato. Queste stime diventano ancora più sorprendenti se si tiene conto della sottostruttura rilevata. Il livello osservato di isolamento genetico nella regione Friuli-Venezia Giulia è più estremo secondo diverse misure di isolamento rispetto a sardi, baschi francesi e finlandesi del nord, dimostrando così lo stato di un isolato. Queste stime diventano ancora più sorprendenti se si tiene conto della sottostruttura rilevata. Il livello osservato di isolamento genetico nella regione Friuli-Venezia Giulia è più estremo secondo diverse misure di isolamento rispetto a sardi, baschi francesi e finlandesi del nord, dimostrando così lo stato di un isolato.

introduzione


I tratti complessi umani derivano dalle nuove mutazioni, nonché dall'interazione tra le varianti genetiche esistenti e l'esposizione alle condizioni ambientali. Ciò significa che è desiderabile studiare popolazioni con ridotta variabilità genetica, come popolazioni isolate  ,  e grandi popolazioni omogenee  ,  poiché si ottiene più potere per gli studi di mappatura delle associazioni genetiche.  isolati di popolazione sono per definizione caratterizzati da una piccola popolazione effettiva (Ne), che si traduce in effetti più forti della deriva genetica casuale che porta a una ridotta variabilità genetica. Questi processi possono essere temporalmente continui e / o intrecciati in una catena di eventi di collo di bottiglia discreti nella storia demografica di un isolato. Diversi isolati di popolazione, come i sardi,  finlandesi settentrionali,  amish  e islandesi  sono stati utilizzati con successo in entrambi gli studi di collegamento e di associazione a livello del genoma per individuare varianti di sequenza del DNA per predisposizioni di malattie (database OMIM: www.omim.org e NHGRI GWAS Catalogo ). Un altro aspetto favorevole degli isolati di popolazione è l'ambiente ampiamente condiviso. L'isolamento di solito deriva da barriere geografiche e quindi tutti sono esposti agli stessi fattori, che

Materiali e metodi

 consente di progettare efficacemente potenti studi di interazione gene-ambiente. 
Negli ultimi anni, diversi studi hanno iniziato a fare luce sulla struttura della variazione genetica su gruppi etnici globali,  ,  continentali,  ,  regionali,  ,  (come ebrei,  indiani,  brasiliani  ) e paese Livello  ,  ,  ,  , ma molto raramente sono i campioni rappresentati studiati per un intero paese.  ,  Le analisi a livello di sottopopolazione  , concentrarsi principalmente sugli isolati della popolazione e dimostrare una ridotta variabilità genetica all'interno, ma anche un'elevata diversità tra le regioni vicine e le popolazioni di origine.  ,  ,  ,  È importante caratterizzare qualsiasi isolato di popolazione putativa per eventi di recente mescolanza e presenza di sottostruttura in quanto questi potrebbero interrompere l'omogeneità genetica e portare a possibili associazioni spurie negli studi di mappatura genica.  Pertanto, una corretta strategia di campionamento è fondamentale.
Gli italiani, sull'esempio dei sardi, sono una delle popolazioni europee più studiate accanto ai saami e ai baschi, dove la struttura della popolazione è stata analizzata in profondità utilizzando sia i loci aploidi (mtDNA e cromosoma Y)  ,  sia i marker autosomici .  ,  Si ipotizza che l'Italia possa essere arricchita per gli isolati della popolazione a causa della complessa storia demografica e della variabilità topografica (Rete italiana di isolati genetici: http://www.netgene.it/ita/ingi.asp ).
Questo studio mira a verificare questa ipotesi caratterizzando geneticamente una parte collinare della regione Friuli-Venezia Giulia (FVG) situata nell'Italia nord-orientale. La regione è particolarmente interessante, mentre si estende su una superficie totale di soli 7858 km 2 si parlano diversi dialetti distinti e diversi villaggi sfoggiano tradizioni e / o cognomi che li collegano a gruppi etnici più lontani piuttosto che in FVG o in Italia per quella materia. Tutto sommato, sembra che l'area sia caratterizzata da una complessa storia demografica. Ad esempio, le persone nel villaggio di Resia parlano una lingua proto-slava arcaica, nota come resiano, ma i loro cognomi sono italiani o italianizzati. Nel villaggio di Illegio, non lontano da Resia, la gente parla un'altra lingua locale, chiamata friuliano- della sottofamiglia di lingua retoromantica, che nel Medioevo era molto diffusa - dalla Svizzera moderna alla Slovenia. Illego è inoltre caratterizzato da un numero limitato di cognomi, che potrebbero essere interpretati come prove dell'immigrazione marginale. Un altro strato di specifico patrimonio culturale è aggiunto da caratteristici simboli locali trovati incisi su case locali. Gli abitanti del villaggio di Sauris parlano un dialetto arcaico di origine tedesca e secondo le leggende i locali hanno le loro radici ancestrali vicino al Tirolo. Fino a 50 anni fa, prima che un'alluvione devastasse la valle d'origine, la principale lingua parlata nel villaggio di Erto era un dialetto latino chiamato ertano, mentre l'attuale popolazione è una mescolanza di ex abitanti di Erto e migranti dalle regioni vicine. Il villaggio di San Martino del Carso (SMC) è l'unico villaggio di lingua italiana nella regione del Carso di lingua slovena. Infine, il villaggio di Clauzetto si trova in una valle remota dove la gente parla friulano .
La ricca storia e la diversità linguistica di queste sei popolazioni consente di prevedere elevati livelli di omogeneità genetica infragruppo, una maggiore differenziazione intergruppo tra i villaggi e suggerisce almeno un certo grado di discendenza con le regioni limitrofe di Slovenia, Germania e Italia. In questo studio, analizziamo la variazione genetica all'interno della regione FVG al fine di comprendere (a) la relazione tra gli abitanti dei villaggi e gli altri italiani e gli europei nel loro insieme, che può offrire una visione unica della complessa storia demografica della regione e (b) valutare se una qualsiasi delle popolazioni del villaggio rappresenta un vero e proprio isolato di popolazione, poiché avrebbe un grande potenziale negli studi epidemiologici genetici. Per rispondere a queste domande, i dati genotipici ad alta densità di> ,  ,  ,  ,  Questo ci consente di contrastare direttamente le ipotetiche origini culturali dei villaggi della regione FVG con i modelli di somiglianza genetica basati sui dati. Inoltre, confrontiamo la diversità genetica e l'omogeneità genomica riscontrate nei sei villaggi FVG con altri noti isolati di popolazione geografica e culturale, come sardi, baschi francesi e finlandesi settentrionali.

Materiali e metodi


Campioni

Abbiamo genotipizzato 1310 campioni da sei villaggi geograficamente isolati nella regione italiana FVG. Abbiamo combinato questi dati con i 96 campioni sloveni di recente genotipizzazione e con cinque raccolte di popolazione  ,  ,  ,  ,  (vedi tabella supplementare 1 ), con un'enfasi sulle popolazioni di origine europea. Dopo il controllo della qualità dei dati e l'esclusione di parenti stretti, per l'analisi sono stati utilizzati 3091 campioni da 72 popolazioni ( Tabella supplementare 1 ). Questo set comprendeva 733 campioni di origini italiane di 11 popolazioni: (1) Valle Borbera (Italia nord-occidentale) e regione Puglia (Italia sud-orientale; Carlantino) e (2) sardi, toscani e italiani del nord del pannello  diversità genetica umana e (3) sei villaggi della regione FVG. Le figure 1a e b mostrano le valli e i villaggi isolati da cui sono stati raccolti i campioni italiani. Di seguito, il nome della nazione viene utilizzato per le popolazioni generali e un nome di villaggio o regione per le popolazioni più isolate.
Mappa che mostra la posizione approssimativa dei campioni italiani analizzati e ha rivelato la struttura della popolazione nelle popolazioni analizzate. a ) Una mappa geografica dell'Italia e mostrate sono le regioni di campionamento approssimative. b ) Una mappa geografica dettagliata di FVG e mostrata sono la posizione approssimativa dei sei villaggi. c ) Proporzioni ancestrali dei 1008 individui studiati da 39 popolazioni europee e del Vicino Oriente (incluse le sei popolazioni di villaggi FVG) come rivelato dal programma ADMIXTURE  con K = 2 a K = 10. Una colonna impilata della Kle proporzioni rappresentano ciascun individuo, con le frazioni indicate sull'asse y. Da tutte le popolazioni non FVG è stato utilizzato un sottoinsieme di 24 individui disegnati casualmente (se applicabile).

Un consenso informato scritto per la partecipazione è stato ottenuto da tutti i soggetti di recente genotipizzazione.

Genotipi a polimorfismo a singolo nucleotide (SNP) e controllo di qualità

Le sei coorti italiane sono state genotipizzate usando Human370CNV e il campione sloveno con le perline HumanOmniExpress secondo il protocollo del produttore (Illumina Inc., San Diego, California, USA). I set di dati pubblicati utilizzati nell'analisi sono stati genotipizzati con diverse versioni di perline Illumina.
I dati del genotipo provenienti da piattaforme diverse sono stati prima uniti e poi filtrati secondo le metriche standard di controllo della qualità del genotipo utilizzando il software PLINK v1.07.  Solo SNP dei 22 cromosomi autosomici con frequenza allele minore> 1%, equilibrio P di Hardy – Weinberg > 10 -6e sono stati inclusi tassi di successo di genotipizzazione> 95%, lasciando circa 145.000 marcatori SNP. Sono stati utilizzati solo gli individui con tasso di successo di genotipizzazione> 95%. La correlazione criptica è stata testata con lo stesso software e dalle coppie relative rilevate (fino ai cugini di secondo grado) solo una è stata scelta a caso per le successive analisi. A seconda delle analisi (ad es. Ottimizzazione computazionale e distorsione delle dimensioni dei campioni), sono stati esclusi gruppi etnici molto distanti e le dimensioni dei campioni di popolazione sono state ridotte a 50 o 24 campioni. Lo squilibrio del legame di fondo (LD) può indurre distorsioni nella componente principale  e analisi di tipo strutturale; pertanto l'insieme di 145000 SNP è stato diluito escludendo marcatori in LD forte (correlazione genotipo a coppie 2> 0.4) in una finestra di 200 SNP (la finestra scorrevole si sovrappone a 25 SNP alla volta) lasciando circa 101000 SNP per le analisi successive.

analisi statistiche

Un algoritmo di clustering senza supervisione, basato sulla massima verosimiglianza, assemblato nel software ADMIXTURE  , è stato applicato ai campioni di popolazione europea e del Medio Oriente (ebrei, palestinesi, adyghes e drusi) ( n = 1975) per identificare i cluster ancestrali putativi all'interno dei campioni come nonché per valutare l'estensione della miscela. Il clustering è stato eseguito 100 volte da K = 2 a K = 15 e il K più adatto è stato selezionato in base all'indice di convalida incrociata (CV) più basso ( Figura 1A supplementare ). Inoltre, abbiamo scelto di utilizzare un livello soglia di variazione nei punteggi di probabilità logaritmica (LL <1) entro una frazione (10%) delle corse con i LL più alti  (Figura complementare 1B ) come indicatore per presumere che sia stato raggiunto il massimo della probabilità globale, rendendo così il modello K dato una rappresentazione utile della struttura genetica del campione. Gli indici CV più bassi sono stati osservati a K = 9 mentre K = 10 ha mostrato valori solo leggermente peggiori. È probabile che il massimo della probabilità globale sia stato effettivamente raggiunto da K = 2 a K = 15.
Per diverse analisi, le popolazioni di FVG sono state suddivise in sottopopolazioni secondo le stime degli antenati a K = 10 (se applicabile) come segue: (1) insieme generale (GS), quando il carico degli antenati specifici del villaggio era inferiore al 30% e ( 2) set più isolato (IS), quando il caricamento ha superato il 30%. Scegliamo K = 10 per discernere tra gli insiemi perché oltre questo K (e fino a K = 15, vedi sopra) non sono sorti componenti aggiuntivi specifici del villaggio, rendendo questo K il più appropriato da scegliere per questo particolare compito. Questa scelta è stata supportata osservando che per K = 10, (1) il massimo della probabilità globale è stato effettivamente probabilmente raggiunto e (2) i valori dell'indice CV erano vicini a quelli più bassi aK = 9. Successivamente, un sottoinsieme di 24 individui è stato scelto a caso da ogni popolazione di origine europea e del Vicino Oriente per le seguenti analisi al fine di minimizzare gli effetti delle dimensioni del campione.  In tutti i casi, il campionamento è stato ripetuto cinque volte e le distanze Fst a coppie ottenute erano vicine all'unità, indicando che le serie casuali erano rappresentative dell'intero campione.
L'analisi dei componenti principali (PCA) con 101000 SNP è stata eseguita utilizzando il pacchetto EIGENSOFT  . Lo stesso software è stato utilizzato per calcolare i valori Fst a coppie che sono stati ulteriormente analizzati con il clustering agglomerativo gerarchico. Le analisi sono state eseguite su due set di campioni: (1) tutti i campioni disponibili ( n = 3091) e (2) solo le popolazioni di origini europee e del Vicino Oriente tagliate ( n = 1008). L'analisi degli antenati spaziali (SPA) è stata applicata su quest'ultimo set, per modellare esplicitamente la distribuzione spaziale di ciascun marker al fine di descrivere il grado di stratificazione della popolazione in ciascuno degli isolati putativi della popolazione nel background genetico europeo. 
Il pannello  marcatori informativi di origine principale (PCAIM) è stato costruito con 250 SNP (su 101000 SNP) mantenuti dai primi cinque PC (50 SNP ciascuno)  classificati in base ai punteggi di caricamento assoluti. Il pannello PCAIM è stato l'input di un approccio multivariato non basato su modello, un'analisi discriminante dei componenti principali (DAPC), che è implementata nel pacchetto R adegenet ver1.3-0.  Tutti i componenti principali sono stati inclusi nell'algoritmo di clustering k- medie da DAPC = 1 a DAPC = 14 e il DAPC più adattoè stato selezionato usando il criterio di informazione bayesiana. Il DAPC è stato utilizzato per assegnare gli individui nei cluster previsti e le popolazioni reali sono state utilizzate come identificatori. È stato evitato un eccesso di adattamento stimando la differenza tra la percentuale di riassegnazioni riuscite e i valori ottenuti usando il raggruppamento casuale.
L'estensione LD a coppie è stata calcolata come correlazione genotipica ( 2 ) tra coppie di marker <100 kb a parte utilizzando il software PLINK v1.07  . È stato applicato uno script Perl personalizzato per classificare i valori di 2 in base alle distanze inter-marker (0−5 kb, 5−10 kb e così via) e la 2 media è stata calcolata per ogni categoria. I calcoli erano limitati solo agli isolati di popolazione stabiliti, ai campioni della regione FVG e a una serie di popolazioni di riferimento geografico (estoni, sloveni e svizzeri).
Le serie genomiche di omozigosi (gROH) e il coefficiente di consanguineità ( in ) sono stati stimati utilizzando PLINK v1.07 con parametri stabiliti.  ROH è stato definito come una sequenza di almeno 25 SNP omozigoti consecutivi che si estendono per almeno 1500 kb, con uno spazio massimo di 100 kb tra i SNP adiacenti e una densità di SNP nel giro di non> 20 kb / SNP  (per ciascuno individuo il GROH è stato definito come la somma delle regioni genomiche sopra definite). La in è stata stimata per ciascun campione in base al rapporto tra il numero osservato e atteso dei genotipi omozigoti.

risultati

Regione di FVG nel contesto di una più ampia diversità genetica europea

Come primo passo per comprendere il posto delle popolazioni della regione FVG sulla tela genetica dell'Europa, abbiamo applicato un algoritmo simile a una struttura basato su modello assemblato in ADMIXTURE  per calcolare le stime quantitative per i singoli antenati nelle ipotetiche popolazioni ancestrali K. La migliore precisione predittiva è stata osservata per un modello con K = 9 ( Figura 1 aggiuntiva ). In generale, le distribuzioni delle proporzioni degli antenati tra i campioni dei villaggi di FVG erano molto simili ad altre popolazioni nella regione geografica, sebbene su K più elevatovalori quasi tutte le popolazioni di FVG sono state dominate da un singolo componente ampiamente specifico per ogni singolo villaggio. I risultati hanno rivelato un livello sostanziale della struttura intra-popolazione nella maggior parte delle popolazioni della regione FVG manifestate in un'elevata variabilità nell'adesione alla componente di origine specifica del villaggio ( Figura 1c ). È probabile che questa struttura rappresenti le differenze intra-popolazione nel livello di consanguineità piuttosto che di origine specifica. Questa interpretazione ottiene ulteriore supporto nelle successive analisi in cui si è scoperto che la presenza della componente ancestrale specifica del villaggio era altamente correlata con entrambi i range LD estesi e livelli elevati di gROH ( Figura 7 aggiuntiva;vedi sotto). Per ulteriori analisi, le popolazioni dei villaggi sono state suddivise in sottopopolazioni (indicate come GS e IS) in base alla prevalenza del componente ancestrale specifico del villaggio (descritto nella sezione Materiali e metodi) e considerate popolazioni indipendenti per rappresentare in modo più preciso la genetica diversità all'interno dei villaggi FVG.
Successivamente, abbiamo condotto un PCA sulle popolazioni di antenati dell'Europa e del Vicino Oriente (sul grafico globale del PCA  tutti i campioni di FVG raggruppati su europei; Figura complementare 2A ). I due primi componenti principali rappresentavano l'1,5% e lo 0,7% della variazione genetica, mentre separavano chiaramente gli isolati della popolazione, come i sardi,  baschi francesi  e finlandesi del nord,  ma anche le sottopopolazioni FVG più omogenee ( Figura 1 ; Supplementare Figura 2B ). Un quadro più dettagliato è emerso dalla SPA analizza come segue: (a) SMC ha la più ampia diffusione, raggruppandosi tra le popolazioni di lingua tedesca e parzialmente sovrapposte con gli sloveni, (b) le sotto-popolazioni GS di Clauzetto, Sauris e Illegio si raggruppano tra SMC e italiani del nord, da cui Borbera e toscani posizionati più lontano "a sud" e (c) le sotto-popolazioni GS di Erto e Resia sono spostate verso gli isolati della popolazione, ma si raggruppano meno distanti ( Figura 2 ). Il raggruppamento dei campioni della regione FVG nelle proiezioni PCA e SPA erano approssimativamente rappresentativi della loro posizione geografica.

Convergenza della mappatura basata su modelli con SPA. La posizione dell'etichetta indica i valori a ) specifici delle coordinate PC1 e PC2 per ciascun individuo e ( b ) i valori medi delle coordinate PC1 e PC2 per ogni popolazione. Per ( a, b ), i colori hanno il seguente significato: (1) colore blu scuro: una frazione omogenea della popolazione di FVG; un colore blu: frazione più generale della popolazione FVG; un colore rosso: altri campioni italiani; un colore viola: baschi; un colore arancione: sloveni; e colore verde: tutte le altre popolazioni. Per ( a, b), vengono utilizzate le seguenti etichette abbreviate della popolazione: AT, austriaci; BA, Baschi francesi; BG, bulgari; BO, Borbera; CA, Carlantino; CL, Clauzetto; CH, Svizzera; CZ, cechi; GR, tedeschi; ER, Erto; ES, spagnoli; FR, francese; HU, ungheresi; IL, Illegio; IT, italiani; JW_A, ebrei Ashkenazy; JW_S, ebrei sefarditi; OR, Orcadians; RE, Resia; RO, rumeni; SA, sardi; SA_, Sauris; SMC, San Martino del Carso; SI, sloveni; TU, toscani. Le abbreviazioni extra: N, nord; S, sud; Io, una sottopopolazione più omogenea; G, una sottopopolazione più generale.

Per minimizzare ulteriormente la distorsione dall'interno e massimizzare la varianza tra i gruppi, abbiamo applicato i DAPC  per identificare più precisamente le popolazioni geneticamente più vicine ai gruppi FVG. Per le popolazioni europee e del Vicino Oriente combinate, il pannello PCAIM SNP si è adattato meglio a DAPC = 7 ( Figura 3 aggiuntiva ) e il DAPC ha chiaramente superato le sotto-popolazioni IS di Illegio (C1), Sauris (C3) e Resia (C6), inclusi anche alcuni dei rispettivi campioni di sottopopolazione GS ( Figura 3). Il resto delle popolazioni FVG si raggruppava principalmente con C2 (dominato dagli europei centrali) e C5 (dominato virilmente dagli italiani), sebbene una piccola parte fosse assegnata anche a C4 (dominata dagli europei del nord), come Sauris e SMC, e C7 (dominata da popolazioni ancestrali del Vicino Oriente), come Clauzetto, Illegio e Sauris ma anche altri europei del sud ( Figura 3 ).
Appartenenza al cluster prevista per ogni individuo dai DAPC. Il modello ottimale è stato trovato su K = 7 e gli individui sono assegnati al cluster più adatto. La dimensione del rettangolo viene ridimensionata con il numero di campioni assegnati. In nomi di popolazione: N, settentrionale; S, sud; Io, una sottopopolazione più omogenea; G, una sottopopolazione più generale.

L'analisi gerarchica di raggruppamento agglomerativo basata sulle distanze Fst tra coppie di popolazioni ha rivelato che le sottopopolazioni di IS erano molto distanti da tutte le altre popolazioni ( Figura 4 aggiuntiva ). Le sottopopolazioni GS hanno mostrato distanze Fst molto ridotte in coppia rispetto alle popolazioni geograficamente vicine ( Figura 5 aggiuntiva ). Sono state fatte due osservazioni principali: (1) la SMC era ugualmente distante da Sauris e Clauzetto, nonché dai suoi vicini geografici, come gli sloveni, e (2) Sauris assomigliava di più a Clauzetto, ma anche agli svizzeri. Tutti gli altri insiemi di FVG assomigliavano a un elenco più ampio di popolazioni ( Figura 5 aggiuntiva ).

Popolazioni di villaggi FVG come isolati genetici

Alcuni dei villaggi FVG risiedono in valli molto remote e questo può portare all'isolamento genetico, quindi abbiamo successivamente studiato misure di diversità genetica che potrebbero riflettere una storia di relativo isolamento, elevati livelli di consanguineità e / o recenti colli di bottiglia storici. Per confrontare la profondità dell'isolamento nelle sottopopolazioni di villaggi FVG, abbiamo confrontato i valori osservati con gli isolati di popolazione stabiliti (come baschi francesi, sardi e finlandesi del Nord) ma anche con le altre popolazioni di riferimento.
Un alto livello di interno-struttura in popolazioni FVG stato rivelato mediante miscelazione ( figura 1c ), che è stata ulteriormente confermata dal PCA, SPA e DAPC ( complementare figura 2B ; figure 2 e e3).3 ). Ad esempio, nelle analisi PCA e SPA, le sottopopolazioni IS FVG (tranne Clauzetto) posizionate molto distanti dai loro vicini geografici ( Figura complementare 2B ). L'isolamento genetico delle popolazioni di FVG è stato ulteriormente evidenziato dal DAPC, che ha assegnato tre delle sottopopolazioni IS (Illegio, Sauris e Resia) esclusivamente ai rispettivi cluster specifici per singolo villaggio, mentre tutte le altre popolazioni di FVG sono state distribuite tra diversi cluster ( Figura 3).
Come ci si può aspettare dalla struttura genetica osservata, i valori Fst tra le popolazioni in coppia delle sottopopolazioni IS erano estremamente elevati rispetto a tutte le altre popolazioni (Fst medio complessivo: Resia 0,023 e Sauris 0,021 vs SMC 0,006) e elevati rispetto con gli isolati di popolazione precedentemente caratterizzati (media complessiva Fst: Sardegna 0,014; baschi francesi 0,013 e finlandesi del nord 0,18) ( figura 6 supplementare ).
I risultati dell'analisi LD hanno rivelato una notevole differenza tra le sottopopolazioni tratte da un singolo villaggio rispetto agli isolati di popolazione stabiliti, mentre persino la sottopopolazione (GS) di Resia e Illegio ha mostrato una forte deviazione del LD dal previsto sud declino  ( Figura 4 ). La lunghezza del blocco LD era la più breve per le sottopopolazioni GS di Clauzetto e Sauris, dove l'estensione era comparabile con i valori osservati per sloveni e svizzeri.

Lunghezza LD a tutto il genoma basata su 145000 SNP. Ogni riga rappresenta il decadimento LD mediato tra popolazioni e sottopopolazioni e LD ( 2 ) tra SNP mostrati in contenitori da 5 kb. Le sottopopolazioni tratte dalla stessa popolazione hanno lo stesso codice colore. Una linea tratteggiata rappresenta le sottopopolazioni più generali e la linea continua con rettangoli rappresenta rispettivamente le sottopopolazioni più omogenee. Una linea sottile e solida rappresenta le popolazioni di riferimento europee (estoni, sloveni e svizzeri). L'estensione LD negli isolati della popolazione di riferimento (sardi, baschi francesi e finlandesi del nord) è anche mostrata con una linea continua con rettangoli. In nomi di popolazione: I, una sottopopolazione più omogenea; G, una sottopopolazione più generale.

Infine, è stata osservata una grande deviazione simile dai valori previsti per la GROH media della popolazione nelle sottopopolazioni IS ( Figura 5 ). Ad esempio, la gROH media per quest'ultima serie era di 47 Mb, rispetto a 11 Mb nel cluster di isolati di popolazione, 5,5 Mb nelle sottopopolazioni GS e circa 2 Mb nelle popolazioni di riferimento europee ( Figura 5 ). Quest'ultimo è simile alle stime precedentemente pubblicate.  ,  La stessa tendenza è stata osservata dalle stime dei coefficienti di consanguineità raggruppate rispettivamente nei cluster sopra definiti: 0,04, 0,028, 0,009 e 0,011 ( Tabella supplementare 2). Queste due stime erano altamente correlate con le componenti ancestrali specifiche del villaggio (Figura complementare 7) e quindi è probabilmente la diversità ridotta a causa della piccola Ne nei sottogruppi di villaggi che si trova dietro la struttura impressionante.

Le serie genomiche di omozigosi (gROH) basate su 145000 SNP. ( a ) Distribuzione della popolazione media segmenti omozigoti e conteggio medio di gROH> 1,5 Mb per campione. ( b ) Zoom in vista per la regione indicata con un'ellisse tratteggiata su ( a ). Le sottopopolazioni di FVG sono indicate in grassetto. In nomi di popolazione: I, una sottopopolazione più omogenea; G, una sottopopolazione più generale.

Discussione

In questo studio, eravamo interessati a vedere come le popolazioni dei villaggi FVG si adattano al paradigma generale della struttura spaziale della variazione genetica delle popolazioni europee utilizzando 145.000 SNP autosomici. A tal fine, abbiamo confrontato la variazione genetica delle popolazioni di villaggi FVG con un pannello di riferimento composto da altri italiani, una più ampia gamma di popolazioni europee e un insieme di popolazioni del Vicino Oriente. Abbiamo osservato un notevole livello di struttura genetica tra le popolazioni di FVG ( Figura 1c), che probabilmente deriva da una maggiore somiglianza genetica all'interno di specifici sottogruppi di campioni provenienti dai rispettivi villaggi e non da differenze di origine genetica. I componenti specifici di FVG erano presenti nel profilo di fondo di tutti gli europei, il che è coerente con i componenti specifici di FVG che rappresentano una frazione della variabilità genetica complessiva in Europa.
Sulla base della composizione dei componenti ancestrali, le popolazioni di FVG sono state divise in due gruppi per le analisi successive: (1) più sottopopolazione generale (GS), che assomigliava ad altri italiani e popolazioni nelle immediate vicinanze, e (2) più diverse e molto set omogeneo (IS). I set GS sono stati usati per comprendere ulteriormente la posizione genetica delle popolazioni FVG sulla tela genetica europea e per cercare le radici genetiche delle differenze culturali. I due primi componenti sia nelle analisi PCA che SPA hanno posizionato i campioni di FVG vicini alla variazione delle popolazioni italiane come riportato da Li et al. Inoltre, la regione FVG ha mostrato le distanze Fst più piccole con le popolazioni in stretta vicinanza geografica. Ad esempio, la SMC, pur essendo l'unico villaggio di lingua italiana in una regione di lingua slovena, aveva valori Fst ugualmente distanti dagli sloveni e da altre popolazioni FVG, ma allo stesso tempo aveva un raggruppamento molto ampio nella ZPS ed era coerente con vari livello di miscela. Ciò suggerisce che i fondatori italiani originali del villaggio si sono geneticamente mescolati con i vicini sloveni e quindi sulla posizione del PC tra italiani e sloveni, ma hanno mantenuto il loro patrimonio culturale italiano.
Dalle analisi discriminanti dei componenti principali, che hanno minimizzato efficacemente la grande variabilità all'interno del gruppo,  abbiamo trovato alcuni suggerimenti per l'origine di Sauris, i cui fondatori storici sono ritenuti di lingua tedesca dalla regione adiacente al Tirolo ( Nota integrativa ) . Nel DAPC, i campioni Sauris sono stati posizionati in diversi cluster, principalmente C5 specifici per l'Italia e C2 specifici per l'Europa meridionale ma anche nel cluster C4 dell'Europa settentrionale (anch'esso leggermente presente solo per SMC), insieme a tedeschi e svizzeri. La minima distanza della prima con lo svizzero accanto a Clauzetto ha ulteriormente rafforzato il legame sauris con le popolazioni di lingua tedesca.
Oltre ad essere soggetti intriganti negli studi sulla storia della popolazione, la linguistica e l'etnogenesi, gli isolati di popolazione sono strumenti utili per gli studi di epidemiologia genetica nella ricerca di alleli di suscettibilità alle malattie. L'uso di isolati è vantaggioso a causa dell'esposizione molto simile a fattori ambientali ed effetti del piccolo arricchimento di Ne di alcune varianti di sequenze dannose a causa di una deriva genetica casuale più pronunciata, un livello più elevato di consanguineità e omogeneità genetica generale.  , In questo studio, abbiamo rilevato un forte segnale di isolamento genetico per sottoinsiemi delle popolazioni dei villaggi che poteva essere scoperto solo analizzando una frazione rappresentativa delle popolazioni dei villaggi. Le sottopopolazioni FVG più omogenee hanno mostrato valori più estremi per tutte le misure di isolamento considerate rispetto alla Sardegna,  ,  baschi francesi  ,  e finlandesi settentrionali. La maggior parte dell'ampia omogeneità genetica è spiegata dal Ne molto piccolo all'interno dei villaggi FVG (ad esempio 105 abitanti nel villaggio di Erto), che ha portato a livelli elevati ma variabili di consanguineità suggeriti anche dalla trice come grandi coefficienti di consanguineità in GS rispetto ai cluster di sotto-popolazione IS. Non sorprende anche che le sottopopolazioni più generali dell'FVG, ad eccezione di Clauzetto, abbiano dimostrato valori nella direzione indicativa di isolamento rispetto al set di riferimento europeo per le distanze Fst,  nella misura di LD  e livelli di omozigosi genomica di fondo.  ,  , 
Questo studio ha prodotto due risultati principali. Abbiamo profondamente caratterizzato e confermato lo stato dell'isolato genetico per altre quattro popolazioni, che forniscono uno strumento utile per gli studi di mappatura genica. In secondo luogo, l'analisi della struttura genetica evidenzia chiaramente la necessità di analizzare un campione ampio e rappresentativo per stimare con precisione la variabilità infragruppo in una popolazione. I nostri risultati mostrano l'entità della diversità e della variazione genetica all'interno e tra le popolazioni campionate dalla parte nord-orientale dell'Italia evidenziando un livello estremo di isolamento rispetto ad altri isolati genetici.







Nessun commento :

Posta un commento