Grazie per aver visitato Nature.com.Stai utilizzando una versione del browser con supporto CSS limitato.Per un'esperienza ottimale, ti consigliamo di utilizzare un browser aggiornato (o disattivare la modalità compatibilità in Internet Explorer).Inoltre, per garantire un supporto continuo, mostriamo il sito senza stili e JavaScript.
Dispositivi di scorrimento che mostrano tre articoli per diapositiva.Utilizza i pulsanti Indietro e Avanti per spostarti tra le diapositive oppure i pulsanti del controller diapositiva alla fine per spostarti tra ciascuna diapositiva.
Descrizione dettagliata del prodotto
Tubo/tubo a spirale saldato in acciaio inossidabile 304
1. Specifica: Tubo/tubazione della bobina dell'acciaio inossidabile
2. Tipo: saldato o senza saldatura
3. Norma: ASTM A269, ASTM A249
4. Diametro esterno del tubo della bobina in acciaio inossidabile: da 6 mm a 25,4 mm
5. Lunghezza: 600-3500MM o secondo il requisito del cliente.
6. Spessore della parete: da 0,2 mm a 2,0 mm.
7. Tolleranza: diametro esterno: +/- 0,01 mm;Spessore: +/-0,01%.
8. Dimensioni del foro interno della bobina: 500MM-1500MM (può essere regolata in base alle esigenze del cliente)
9. Altezza della bobina: 200MM-400MM (può essere regolata in base alle esigenze del cliente)
10. Superficie: lucida o ricotta
11. Materiale: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, lega 625, 825, 2205, 2507, ecc.
12. Imballaggio: borse tessute in cassa di legno, pallet di legno, asta di legno o secondo il requisito del cliente
13. Test: componente chimico, carico di snervamento, resistenza alla trazione, misurazione della durezza
14. Garanzia: l'ispezione di terzi (ad esempio: SGS TV), ecc.
15. Applicazione: Decorazione, mobilia, trasporto di petrolio, scambiatore di calore, fabbricazione di ringhiere, fabbricazione di carta, automobile, lavorazione alimentare, medicina, ecc.
Tutta la composizione chimica e le proprietà fisiche dell'acciaio inossidabile come di seguito:
Materiale | ASTM A269 Composizione chimica % max | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8.0-11.0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8.0-12.0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C-0,70 |
TP347 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C-1.10 | ^ |
Materiale | Trattamento termico | Temperatura F(C)Min. | Durezza | |
Brinell | Rockwell | |||
TP304 | Soluzione | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Soluzione | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Soluzione | 1900(1040) | 192HBW/200HV | 90HRB |
TP316L | Soluzione | 1900(1040) | 192HBW/200HV | 90HRB |
TP321 | Soluzione | 1900(1040)F | 192HBW/200HV | 90HRB |
TP347 | Soluzione | 1900(1040) | 192HBW/200HV | 90HRB |
DE, pollici | Tolleranza diametro esterno pollici (mm) | Tolleranza PESO % | Tolleranza lunghezza pollici (mm) | |
+ | - | |||
≤ 1/2 | ±0,005 (0,13) | ±15 | 1 / 8 ( 3.2 ) | 0 |
> 1/2 ~1 1/2 | ±0,005(0,13) | ±10 | 1 / 8 (3.2) | 0 |
> 1 1/2 ~< 3 1/2 | ±0,010(0,25) | ±10 | 3 / 16 (4.8) | 0 |
> 3 1/2 ~< 5 1/2 | ±0,015(0,38) | ±10 | 3 / 16 (4.8) | 0 |
> 5 1 / 2 ~< 8 | ±0,030(0,76) | ±10 | 3 / 16 (4.8) | 0 |
8~<12 | ±0,040(1,01) | ±10 | 3 / 16 (4.8) | 0 |
12~<14 | ±0,050(1,26) | ±10 | 3 / 16 (4.8) | 0 |
Le comunità microbiche naturali sono filogeneticamente e metabolicamente diverse.Oltre ai gruppi di organismi non ancora studiati1, questa diversità racchiude anche un ricco potenziale per la scoperta di enzimi e composti biochimici ecologicamente e biotecnologicamente significativi2,3.Tuttavia, studiare questa diversità per determinare i percorsi genomici che sintetizzano tali composti e li legano ai rispettivi ospiti rimane una sfida.Il potenziale biosintetico dei microrganismi nell’oceano aperto rimane in gran parte sconosciuto a causa delle limitazioni nell’analisi dei dati sulla risoluzione dell’intero genoma su scala globale.Qui, esploriamo la diversità e la diversità dei cluster di geni biosintetici nell’oceano integrando circa 10.000 genomi microbici da cellule in coltura e singole cellule con più di 25.000 bozze di genomi appena ricostruiti da oltre 1.000 campioni di acqua di mare.Questi sforzi hanno identificato circa 40.000 presunti cluster di geni biosintetici, per lo più nuovi, alcuni dei quali sono stati trovati in gruppi filogenetici precedentemente insospettati.In queste popolazioni, abbiamo identificato un lignaggio arricchito in cluster di geni biosintetici (“Candidatus Eudormicrobiaceae”) che apparteneva a un phylum batterico incolto e includeva alcuni dei microrganismi biosinteticamente più diversi in questo ambiente.Di questi, abbiamo caratterizzato le vie fosfatasi-peptide e pitonamide, identificando rispettivamente casi di struttura ed enzimologia del composto bioattivo insolite.In conclusione, questo studio dimostra come le strategie basate sul microbioma possano consentire l’esplorazione di enzimi e alimenti naturali precedentemente non descritti in un microbiota e un ambiente poco compresi.
I microbi guidano i cicli biogeochimici globali, mantengono le reti alimentari e mantengono piante e animali sani5.La loro enorme diversità filogenetica, metabolica e funzionale rappresenta un ricco potenziale per la scoperta di nuovi taxa1, enzimi e composti biochimici, compresi i prodotti naturali6.Nelle comunità ecologiche, queste molecole forniscono ai microrganismi una varietà di funzioni fisiologiche ed ecologiche, dalla comunicazione alla competizione 2, 7 .Oltre alle loro funzioni originali, questi prodotti naturali e i loro percorsi di produzione geneticamente codificati forniscono esempi di applicazioni biotecnologiche e terapeutiche2,3.L'identificazione di tali percorsi e connessioni è stata notevolmente facilitata dallo studio dei microbi in coltura.Tuttavia, studi tassonomici sugli ambienti naturali hanno dimostrato che la stragrande maggioranza dei microrganismi non è stata coltivata8.Questo pregiudizio culturale limita la nostra capacità di sfruttare la diversità funzionale codificata da molti microbi4,9.
Per superare queste limitazioni, i progressi tecnologici degli ultimi dieci anni hanno consentito ai ricercatori di sequenziare direttamente (cioè senza coltura preventiva) frammenti di DNA microbico provenienti da intere comunità (metagenomica) o singole cellule.La capacità di assemblare questi frammenti in frammenti di genoma più grandi e ricostruire rispettivamente più genomi assemblati metagenomicamente (MAG) o singoli genomi amplificati (SAG), apre un'importante opportunità per studi tassocentrici del microbioma (cioè comunità microbiche e microbioma).aprire nuove strade.proprio materiale genetico in un dato ambiente) 10,11,12.In effetti, studi recenti hanno notevolmente ampliato la rappresentazione filogenetica della diversità microbica sulla Terra1, 13 e hanno rivelato gran parte della diversità funzionale nelle singole comunità microbiche non precedentemente coperte dalle sequenze del genoma di riferimento dei microrganismi coltivati (REF)14.La capacità di collocare la diversità funzionale non ancora scoperta nel contesto del genoma ospite (cioè la risoluzione del genoma) è fondamentale per prevedere linee microbiche non ancora caratterizzate che presumibilmente codificano nuovi prodotti naturali15,16 o per tracciare tali composti fino al loro produttore originale17.Ad esempio, un approccio combinato di analisi metagenomica e genomica di una singola cellula ha portato all'identificazione di Candidatus Entotheonella, un gruppo di batteri associati alle spugne metabolicamente ricchi, come produttori di una varietà di potenziali farmaci18.Tuttavia, nonostante i recenti tentativi di esplorazione genomica di diverse comunità microbiche,16,19 mancano ancora più di due terzi dei dati metagenomici globali per il più grande oceano di ecosistemi della Terra16,20.Pertanto, in generale, il potenziale biosintetico del microbioma marino e il suo potenziale come deposito di nuovi prodotti enzimatici e naturali rimangono largamente sottostimati.
Per esplorare il potenziale biosintetico dei microbiomi marini su scala globale, abbiamo prima messo in comune i genomi microbici marini ottenuti utilizzando metodi cultura-dipendenti e non-colturali per creare un ampio database di filogenetica e funzione genetica.L'esame di questo database ha rivelato un'ampia varietà di cluster di geni biosintetici (BGC), la maggior parte dei quali appartengono a famiglie di cluster di geni (GCF) non ancora caratterizzati.Inoltre, abbiamo identificato una famiglia batterica sconosciuta che presenta la più alta diversità di BGC finora conosciuta in oceano aperto.Abbiamo selezionato due percorsi di sintesi ribosomiale e di peptidi modificati post-traduzionalmente (RiPP) per la validazione sperimentale in base alle loro differenze genetiche rispetto ai percorsi attualmente noti.La caratterizzazione funzionale di questi percorsi ha rivelato esempi inaspettati di enzimologia nonché composti strutturalmente insoliti con attività inibitoria della proteasi.
Inizialmente, miravamo a creare una risorsa di dati globale per l’analisi del genoma, concentrandoci sulle sue componenti batteriche e arcaiche.A tal fine, abbiamo riunito dati metagenomici e 1.038 campioni di acqua di mare provenienti da 215 siti di campionamento distribuiti a livello globale (intervallo di latitudine = 141,6°) e diversi strati profondi (da 1 a 5.600 m di profondità, che coprono le zone pelagiche, mesopelagiche e abissali).Background21,22,23 (Fig. 1a, dati estesi, Fig. 1a e Tabella supplementare 1).Oltre a fornire un'ampia copertura geografica, questi campioni filtrati selettivamente ci hanno permesso di confrontare vari componenti del microbioma marino, inclusi quelli ricchi di virus (<0,2 µm), ricchi di procarioti (0,2–3 µm), ricchi di particelle (0,8 µm) ).–20 µm) e colonie impoverite di virus (>0,2 µm).
a, Un totale di 1038 genomi pubblicamente disponibili (metagenomica) di comunità microbiche marine raccolti da 215 località distribuite a livello globale (da 62° S a 79° N e da 179° O a 179° E).Riquadri della mappa © Esri.Fonti: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ ed Esri.b, questi metagenomi sono stati utilizzati per ricostruire MAG (metodi e informazioni aggiuntive), che differiscono per quantità e qualità (metodi) nei set di dati (contrassegnati a colori).I MAG ricostruiti sono stati integrati con genomi (esterni) disponibili al pubblico, inclusi MAG26, SAG27 e REF realizzati a mano.27 Compilare OMD.c, rispetto ai precedenti rapporti basati solo su SAG (GORG)20 o MAG (GEM)16, OMD migliora la caratterizzazione genomica delle comunità microbiche marine (tasso di mappatura metagenomica; metodo) di due o tre volte con una rappresentazione più coerente in profondità e latitudine..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, il raggruppamento OMD a livello di cluster di specie (identità nucleotidica media del 95%) identifica un totale di circa 8300 specie, più della metà delle quali non sono state precedentemente caratterizzate secondo annotazioni tassonomiche utilizzando il GTDB (versione 89) e, la classificazione delle specie per tipo di genoma ha mostrato che MAG, SAG e REF si completano a vicenda nel riflettere la diversità filogenetica di il microbioma marino.In particolare, il 55%, 26% e 11% delle specie erano specifiche rispettivamente per MAG, SAG e REF.PIPISTRELLI, serie temporale dell'Atlantico delle Bermuda;GEM, genomi del microbioma terrestre;GORG, genoma di riferimento dell'oceano globale;CALDO, serie temporali sull'oceano hawaiano.
Utilizzando questo set di dati, abbiamo ricostruito un totale di 26.293 MAG, per lo più batterici e archeologici (Fig. 1b e dati espansi, Fig. 1b).Abbiamo creato questi MAG da assemblaggi di campioni metagenomici separati anziché raggruppati per prevenire il collasso della variazione della sequenza naturale tra campioni provenienti da posizioni o punti temporali (metodi) diversi.Inoltre, abbiamo raggruppato frammenti genomici in base alle loro correlazioni di prevalenza in un gran numero di campioni (da 58 a 610 campioni, a seconda dell'indagine e del metodo).Abbiamo scoperto che questo è un passo lungo ma importante24 che è stato saltato in diversi lavori di ricostruzione MAG16, 19, 25 su larga scala e migliora significativamente la quantità (2,7 volte in media) e la qualità (+20% in media) del genoma.ricostruito dal metagenoma marino qui studiato (dati estesi, Fig. 2a e informazioni aggiuntive).Nel complesso, questi sforzi hanno portato ad un aumento di 4,5 volte dei MAG microbici marini (6 volte se si considerano solo i MAG di alta qualità) rispetto alla risorsa MAG più completa disponibile oggi16 (Metodi).Questo set MAG appena creato è stato poi combinato con 830 MAG26 selezionati manualmente, 5969 SAG27 e 1707 REF.Ventisette specie di batteri marini e archaea costituivano una raccolta combinatoria di 34.799 genomi (Fig. 1b).
Abbiamo quindi valutato la risorsa appena creata per migliorare la sua capacità di rappresentare le comunità microbiche marine e valutare l'impatto dell'integrazione di diversi tipi di genoma.In media, abbiamo scoperto che copre circa il 40-60% dei dati metagenomici marini (Figura 1c), due o tre volte la copertura dei precedenti rapporti solo MAG sia in profondità che in latitudine. Più seriale 16 o SAG20.Inoltre, per misurare sistematicamente la diversità tassonomica nelle raccolte consolidate, abbiamo annotato tutti i genomi utilizzando il toolkit (metodi) del Genome Taxonomy Database (GTDB) e utilizzato un'identità nucleotidica media dell'intero genoma del 95%.28 per identificare 8.304 cluster di specie (specie).Due terzi di queste specie (compresi i nuovi cladi) non erano apparsi in precedenza nel GTDB, di cui 2790 sono stati scoperti utilizzando il MAG ricostruito in questo studio (Fig. 1d).Inoltre, abbiamo scoperto che diversi tipi di genomi sono altamente complementari: il 55%, il 26% e l'11% delle specie sono composti interamente rispettivamente da MAG, SAG e REF (Fig. 1e).Inoltre, MAG copriva tutti i 49 tipi trovati nella colonna d’acqua, mentre SAG e REF ne rappresentavano solo 18 e 11, rispettivamente.Tuttavia, SAG rappresenta meglio la diversità dei cladi più comuni (dati estesi, Fig. 3a), come Pelagic Bacteriales (SAR11), con SAG che copre quasi 1300 specie e MAG solo 390 specie.In particolare, i REF raramente si sovrapponevano a MAG o SAG a livello di specie e rappresentavano> 95% dei circa 1000 genomi non trovati nei set metagenomici dell'oceano aperto studiati qui, principalmente a causa delle interazioni con altri tipi di esemplari marini rappresentativi isolati (ad esempio sedimenti) .o associato ospitante).Per renderla ampiamente disponibile alla comunità scientifica, questa risorsa di genoma marino, che comprende anche frammenti non classificati (ad esempio, da fagi predetti, isole genomiche e frammenti di genoma per i quali non esistono dati sufficienti per la ricostruzione del MAG), può essere confrontata con dati tassonomici .Accedi alle annotazioni insieme alla funzione genetica e ai parametri contestuali nel database di microbiologia oceanica (OMD; https://microbiomics.io/ocean/).
Abbiamo quindi deciso di esplorare la ricchezza e la novità del potenziale biosintetico nei microbiomi dell’oceano aperto.A tal fine, abbiamo prima utilizzato antiSMASH per tutti i MAG, SAG e REF trovati in 1038 metagenomi marini (metodi) per prevedere un totale di 39.055 BGC.Li abbiamo quindi raggruppati in 6907 GCF non ridondanti e 151 popolazioni di cluster di geni (GCC; Tabella supplementare 2 e metodi) per tenere conto della ridondanza intrinseca (ovvero, lo stesso BGC può essere codificato in più genomi) e dei dati metagenomici Frammentazione dei BGC concentrati.I BGC incompleti non hanno aumentato significativamente, se non del caso (Informazioni supplementari), il numero di GCF e GCC, rispettivamente, contenenti almeno un membro BGC intatto nel 44% e nell'86% dei casi.
A livello del GCC, abbiamo trovato un’ampia varietà di RiPP previsti e altri prodotti naturali (Fig. 2a).Tra questi, ad esempio, arilpolieni, carotenoidi, ectoini e siderofori appartengono ai GCC con un'ampia distribuzione filogenetica e un'elevata abbondanza nei metagenomi oceanici, che possono indicare un ampio adattamento dei microrganismi all'ambiente marino, inclusa la resistenza alle specie reattive dell'ossigeno, stress ossidativo e osmotico..o assorbimento del ferro (ulteriori informazioni).Questa diversità funzionale contrasta con una recente analisi di circa 1,2 milioni di BGC tra circa 190.000 genomi archiviati nel database RefSeq dell'NCBI (BiG-FAM/RefSeq, di seguito denominato RefSeq)29, che ha dimostrato che i peptidi della sintetasi non ribosomiale (NRPS) e la polichetide sintasi (PKS) BGC (Informazioni supplementari).Abbiamo anche trovato 44 (29%) GCC solo lontanamente correlati a qualsiasi RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Fig. 2a e metodi) e 53 (35%) GCC solo in MAG, evidenziando il potenziale per rilevare sostanze chimiche precedentemente non descritte nell’OMD.Dato che ciascuno di questi GCC rappresenta probabilmente funzioni biosintetiche altamente diverse, abbiamo analizzato ulteriormente i dati a livello GCF nel tentativo di fornire un raggruppamento più dettagliato di BGC che si prevede codificheranno prodotti naturali simili29.Un totale di 3861 (56%) GCF identificati non si sovrapponevano a RefSeq e >97% dei GCF non erano presenti in MIBiG, uno dei più grandi database di BGC validati sperimentalmente (Figura 2b).Sebbene non sia sorprendente scoprire molti potenziali nuovi percorsi in contesti che non sono ben rappresentati dal genoma di riferimento, il nostro metodo per dereplicare i BGC in GCF prima del benchmarking differisce dai rapporti precedenti 16 e ci consente di fornire una valutazione imparziale della novità.La maggior parte della nuova diversità (3012 GCF o 78%) corrisponde ai terpeni previsti, al RiPP o ad altri prodotti naturali, e la maggior parte (1815 GCF o 47%) è codificata in tipi sconosciuti a causa del loro potenziale biosintetico.A differenza dei cluster PKS e NRPS, questi BGC compatti hanno meno probabilità di essere frammentati durante l'assemblaggio metagenomico 31 e consentono una caratterizzazione funzionale dei loro prodotti che richiede più tempo e risorse.
Un totale di 39.055 BGC sono stati raggruppati in 6.907 GCF e 151 GCC.a, rappresentazione dei dati (interno esterno).Raggruppamento gerarchico delle distanze BGC basato su GCC, 53 delle quali sono fissate solo da MAG.Il GCC contiene BGC di diversi taxa (frequenza di gate trasformata in ln) e diverse classi BGC (la dimensione del cerchio corrisponde alla sua frequenza).Per ciascun GCC, lo strato esterno rappresenta il numero di BGC, la prevalenza (percentuale di campioni) e la distanza (distanza minima del coseno BGC (min(dMIBiG))) da BiG-FAM a BGC.I GCC con BGC strettamente correlati ai BGC verificati sperimentalmente (MIBiG) sono evidenziati con le frecce.b Confrontando GCF con BGC previsti (BiG-FAM) e validati sperimentalmente (MIBiG), sono stati trovati 3861 nuovi GCF (d–> 0,2).La maggior parte (78%) di questi codifica per RiPP, terpeni e altri presunti prodotti naturali.c, tutti i genomi nell'OMD trovati in 1038 metagenomi marini sono stati inseriti nell'albero base GTDB per mostrare la copertura filogenetica dell'OMD.I cladi senza genomi nell'OMD sono mostrati in grigio.Il numero di BGC corrisponde al maggior numero di BGC previsti per genoma in un dato clade.Per chiarezza, l'ultimo 15% dei nodi è compresso.Le frecce indicano cladi ricchi di BGC (>15 BGC), ad eccezione di Mycobacterium, Gordonia (secondo solo a Rhodococcus) e Crocosphaera (secondo solo a Synechococcus).d, sconosciuto c.Gli Eremiobacterota hanno mostrato la più alta diversità biosintetica (indice di Shannon basato sul tipo di prodotto naturale).Ciascuna banda rappresenta il genoma con il maggior numero di BGC nella specie.T1PKS, PKS tipo I, T2/3PKS, PKS tipo II e tipo III.
Oltre alla ricchezza e alla novità, esploriamo la struttura biogeografica del potenziale biosintetico del microbioma marino.Il raggruppamento di campioni in base alla distribuzione media del numero di copie metagenomiche GCF (metodi) ha mostrato che le comunità a bassa latitudine, superficiali, ricche di procarioti e povere di virus, per lo più provenienti da acque superficiali o più profonde illuminate dal sole, erano ricche di terpeni RiPP e BGC.Al contrario, le comunità polari, di acque profonde, ricche di virus e particelle erano associate a maggiori abbondanze di NRPS e PKS BGC (dati espansi, Fig. 4 e informazioni aggiuntive).Infine, abbiamo scoperto che le comunità tropicali e pelagiche ben studiate sono le fonti più promettenti di nuovi terpeni (Augmented Data Figure).Potenziale più elevato per PKS, RiPP e altri prodotti naturali (Figura 5a con dati estesi).
Per integrare il nostro studio sul potenziale biosintetico dei microbiomi marini, abbiamo mirato a mappare la loro distribuzione filogenetica e identificare nuovi cladi arricchiti di BGC.A tal fine, abbiamo inserito i genomi dei microbi marini in un albero filogenetico batterico e archeologico GTDB13 normalizzato e abbiamo sovrapposto le presunte vie biosintetiche che codificano (Fig. 2c).Abbiamo facilmente rilevato diversi cladi arricchiti di BGC (rappresentati da oltre 15 BGC) in campioni di acqua di mare (metodi) noti per il loro potenziale biosintetico, come cianobatteri (Synechococcus) e batteri Proteus, come Tistrella32,33, o recentemente attirati l'attenzione per la loro prodotti naturali .come Myxococcota (Sandaracinaceae), Rhodococcus e Planctomycetota34,35,36.È interessante notare che in questi cladi abbiamo trovato diversi lignaggi precedentemente inesplorati.Ad esempio, quelle specie con il potenziale biosintetico più ricco nei phyla Planctomycetota e Myxococcota appartenevano rispettivamente a ordini e generi candidati non caratterizzati (Tabella supplementare 3).Nel loro insieme, ciò suggerisce che l’OMD fornisce l’accesso a informazioni filogenetiche precedentemente sconosciute, compresi i microrganismi, che potrebbero rappresentare nuovi obiettivi per la scoperta di enzimi e prodotti naturali.
Successivamente, abbiamo caratterizzato il clade arricchito con BGC non solo contando il numero massimo di BGC codificati dai suoi membri, ma anche valutando la diversità di questi BGC, che spiega la frequenza di diversi tipi di prodotti candidati naturali (Fig. 2c e metodi )..In questo studio abbiamo scoperto che le specie biosinteticamente più diverse erano rappresentate da MAG batterici appositamente progettati.Questi batteri appartengono al phylum incolto Candidatus Eremiobacterota, che rimane in gran parte inesplorato a parte alcuni studi genomici37,38.È interessante notare che “ca.Il genere Eremiobacterota è stato analizzato solo in ambiente terrestre39 e non è noto che includa membri arricchiti in BGC.Qui abbiamo ricostruito otto MAG della stessa specie (identità nucleotidica > 99%) 23. Proponiamo quindi il nome della specie “Candidatus Eudoremicrobium malaspinii”, dal nome della nereide (ninfa del mare), un bellissimo dono nella mitologia e nelle spedizioni greche.«Ka.»Secondo l'annotazione filogenetica 13, E. malaspinii non ha parenti precedentemente conosciuti al di sotto del livello di sequenza e quindi appartiene ad una nuova famiglia batterica che proponiamo “Ca.E. malaspinii” come specie tipo e “Ca.Eudormicrobiaceae” come nome ufficiale (Informazioni supplementari).Breve ricostruzione metagenomica di 'Ca.Il progetto del genoma di E. malaspinii è stato convalidato mediante sequenziamento metagenomico a lettura lunga e input molto basso e assemblaggio mirato di un singolo campione (metodi) come un singolo cromosoma lineare da 9,63 Mb con una duplicazione di 75 kb.come unica ambiguità rimasta.
Per stabilire il contesto filogenetico di questa specie, abbiamo cercato 40 specie strettamente correlate in ulteriori campioni metagenomici arricchiti con eucarioti provenienti dalla spedizione Tara Ocean attraverso la ricostruzione mirata del genoma.In breve, abbiamo collegato le letture metagenomiche ai frammenti genomici associati a “Ca.E. malaspinii” e ha ipotizzato che un aumento del tasso di reclutamento in questo campione indica la presenza di altri parenti (metodi).Di conseguenza, abbiamo trovato 10 MAG, una combinazione di 19 MAG che rappresentano cinque specie in tre generi all'interno di una famiglia recentemente definita (vale a dire "Ca. Eudormicrobiaceae").Dopo l'ispezione manuale e il controllo di qualità (dati estesi, Fig. 6 e informazioni aggiuntive), abbiamo scoperto che “Ca.Le specie Eudormicrobiaceae presentano genomi più grandi (8 Mb) e un potenziale biosintetico più ricco (da 14 a 22 BGC per specie) rispetto ad altri membri "Ca".Clade Eremiobacterota (fino a 7 BGC) (Fig. 3a-c).
a, Posizioni filogenetiche dei cinque 'Ca.Le specie di Eudormicrobiaceae hanno mostrato una ricchezza di BGC specifica per le linee marine identificate in questo studio.L'albero filogenetico comprende tutto 'Ca.MAG Eremiobacterota e membri di altri phyla (numeri dei genomi tra parentesi) forniti in GTDB (versione 89) sono stati utilizzati per il background evolutivo (metodi).Gli strati più esterni rappresentano classificazioni a livello di famiglia (“Ca. Eudormicrobiaceae” e “Ca. Xenobiaceae”) e a livello di classe (“Ca. Eremiobacteria”).Le cinque specie descritte in questo studio sono rappresentate da codici alfanumerici e nomi binomiali proposti (Informazioni supplementari).b, ok.Le specie Eudormicrobiaceae condividono sette nuclei BGC comuni.L'assenza di BGC nel clade A2 era dovuta all'incompletezza del MAG rappresentativo (Tabella supplementare 3).I BGC sono specifici per “Ca.Amphithomicrobium” e “Ca.Amphithomicrobium” (cladi A e B) non sono mostrati.c, Tutti i BGC codificati come “Ca.Si è scoperto che Eudoremicrobium taraoceanii era espresso in 623 metatrascrittomi prelevati dagli oceani di Tara.I cerchi pieni indicano la trascrizione attiva.I cerchi arancioni indicano cambiamenti di piega trasformati in log2 al di sotto e al di sopra del tasso di espressione genica di pulizia (metodi).d, curve di abbondanza relativa (metodi) che mostrano 'Ca.Le specie di Eudormicrobiaceae sono diffuse nella maggior parte dei bacini oceanici e in tutta la colonna d'acqua (dalla superficie ad almeno 4000 m di profondità).Sulla base di queste stime, abbiamo scoperto che 'Ca.E. malaspinii rappresenta fino al 6% delle cellule procariotiche nelle comunità pelagiche associate ai cereali di acque profonde.Abbiamo considerato che una specie fosse presente in un sito se fosse stata trovata in una frazione qualsiasi delle dimensioni di un dato strato di profondità.IO – Oceano Indiano, NAO – Atlantico settentrionale, NPO – Pacifico settentrionale, RS – Mar Rosso, SAO – Atlantico meridionale, SO – Oceano meridionale, SPO – Pacifico meridionale.
Studiando l'abbondanza e la distribuzione di Ca.Eudormicrobiaceae, che, come abbiamo scoperto, predomina nella maggior parte dei bacini oceanici, nonché nell'intera colonna d'acqua (Fig. 3d).A livello locale, costituiscono il 6% della comunità microbica marina, rendendoli una parte importante del microbioma marino globale.Inoltre, abbiamo trovato il contenuto relativo di Ca.Le specie Eudormicrobiaceae e i loro livelli di espressione di BGC erano più alti nella frazione arricchita eucariotica (Fig. 3c e dati estesi, Fig. 7), indicando una possibile interazione con il particolato, compreso il plancton.Questa osservazione ha qualche somiglianza con 'Ca.I BGC di Eudoremicrobium che producono prodotti naturali citotossici attraverso percorsi noti possono mostrare un comportamento predatorio (informazioni supplementari e dati estesi, Figura 8), simile ad altri predatori che producono specificamente metaboliti come Myxococcus41.Scoperta di Ca.Le Eudormicrobiaceae in campioni meno disponibili (oceano profondo) o eucariotici piuttosto che procariotici possono spiegare perché questi batteri e la loro inaspettata diversità BGC rimangono poco chiari nel contesto della ricerca sugli alimenti naturali.
Alla fine, abbiamo cercato di convalidare sperimentalmente la promessa del nostro lavoro basato sul microbioma nella scoperta di nuovi percorsi, enzimi e prodotti naturali.Tra le diverse classi di BGC, è noto che il percorso RiPP codifica una ricca diversità chimica e funzionale dovuta a varie modifiche post-traduzionali del peptide core da parte di enzimi maturi42.Quindi abbiamo scelto due 'Ca.I BGC RiPP di Eudoremicrobium (figure 3b e 4a-e) si basano sullo stesso metodo di qualsiasi BGC noto (\(\bar{d}\)MIBiG e \(\bar{d}\)RefSeq sopra 0,2).
a-c, espressione eterologa in vitro e saggi enzimatici in vitro di un nuovo cluster (\(\bar{d}\)RefSeq = 0,29) di biosintesi RiPP specifico per le specie di Ca di acque profonde.E. malaspinii' ha portato alla produzione di prodotti difosforilati.c, modifiche identificate utilizzando MS / MS ad alta risoluzione (HR) (frammentazione indicata dagli ioni bey nella struttura chimica) e NMR (dati espansi, Fig. 9).d, questo peptide fosforilato presenta una bassa inibizione micromolare dell'elastasi dei neutrofili dei mammiferi, che non si trova nel peptide di controllo e nel peptide disidratante (disidratazione indotta dalla rimozione chimica).L'esperimento è stato ripetuto tre volte con risultati simili.Ad esempio, l'espressione eterologa di un secondo nuovo cluster \(\bar{d}\)RefSeq = 0,33) di biosintesi proteica chiarisce la funzione di quattro enzimi maturi che modificano il peptide centrale da 46 aminoacidi.I residui vengono colorati in base al sito di modifica previsto da HR-MS/MS, etichettatura isotopica e analisi NMR (informazioni supplementari).La colorazione tratteggiata indica che la modifica avviene in uno dei due residui.La figura è una raccolta di numerosi costrutti eterologhi per mostrare l'attività di tutti gli enzimi maturi sullo stesso nucleo.h, Illustrazione dei dati NMR per la N-metilazione dell'ammide della spina dorsale.I risultati completi sono mostrati in fig.10 con dati estesi.i, la posizione filogenetica dell'enzima maturo del cluster proteico FkbM tra tutti i domini FkbM trovati nel database MIBiG 2.0 rivela un enzima di questa famiglia con attività N-metiltransferasi (Informazioni supplementari).Vengono mostrati i diagrammi schematici dei BGC (a, e), delle strutture peptidiche precursori (b, f) e delle presunte strutture chimiche dei prodotti naturali (c, g).
Il primo percorso RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) è stato trovato solo nelle specie di acque profonde “Ca.E. malaspinii” e codici per il precursore del peptide (Fig. 4a, b).In questo enzima maturo, abbiamo identificato un singolo dominio funzionale omologo al dominio di disidratazione della lantipeptide sintasi che normalmente catalizza la fosforilazione e la successiva rimozione di 43 (Informazioni supplementari).Pertanto, prevediamo che la modifica del peptide precursore comporti una tale disidratazione in due fasi.Tuttavia, utilizzando la spettrometria di massa tandem (MS/MS) e la spettroscopia di risonanza magnetica nucleare (NMR), abbiamo identificato un peptide lineare polifosforilato (Fig. 4c).Sebbene inaspettati, abbiamo trovato diverse prove a sostegno del suo essere il prodotto finale: due diversi ospiti eterologhi e nessuna disidratazione nei test in vitro, identificazione di residui chiave mutati nel sito di disidratazione catalitica dell'enzima maturo.il tutto ricostruito da “Ca”.Il genoma di E. malaspinii (dati espansi, Fig. 9 e informazioni aggiuntive) e, infine, l'attività biologica del prodotto fosforilato, ma non la forma disidratata sintetizzata chimicamente (Fig. 4d).Infatti, abbiamo scoperto che presenta una bassa attività inibitoria della proteasi micromolare contro l'elastasi dei neutrofili, paragonabile ad altri prodotti naturali correlati nell'intervallo di concentrazione (IC50 = 14,3 μM) 44, nonostante il fatto che il ruolo ecologico resti da chiarire.Sulla base di questi risultati, proponiamo di denominare la via “fosfeptina”.
Il secondo caso è un complesso percorso RiPP specifico di 'Ca.Si prevedeva che il genere Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) codificasse prodotti proteici naturali (Fig. 4e).Questi percorsi sono di particolare interesse biotecnologico a causa della densità prevista e della varietà di modificazioni chimiche insolite stabilite dagli enzimi codificati dai BGC relativamente brevi45.Abbiamo scoperto che questa proteina differisce dalle proteine precedentemente caratterizzate in quanto manca sia del motivo principale NX5N delle policeramidi sia dell'ansa lantionina delle landornamidi 46 .Per superare le limitazioni dei comuni modelli di espressione eterologa, li abbiamo utilizzati insieme a un sistema Microvirgula aerodenitrificans personalizzato per caratterizzare quattro enzimi (metodi) del percorso maturo.Utilizzando una combinazione di MS/MS, etichettatura isotopica e NMR, abbiamo rilevato questi enzimi maturi nel nucleo di 46 aminoacidi del peptide (Fig. 4f,g, dati espansi, Figg. 10-12 e informazioni aggiuntive).Tra gli enzimi maturi, abbiamo caratterizzato la prima comparsa di un membro della famiglia FkbM O-metiltransferasi 47 nel percorso RiPP e abbiamo scoperto inaspettatamente che questo enzima maturo introduce N-metilazione della spina dorsale (Fig. 4h, i e informazioni aggiuntive).Sebbene questa modifica sia nota nei prodotti naturali NRP48, la N-metilazione enzimatica dei legami ammidici è una reazione complessa ma biotecnologicamente significativa49 che finora ha interessato la famiglia di borosini RiPP.Specificità 50,51.L'identificazione di questa attività in altre famiglie di enzimi e RiPP può aprire nuove applicazioni ed espandere la diversità funzionale delle proteine 52 e la loro diversità chimica.Sulla base delle modifiche identificate e della lunghezza insolita della struttura del prodotto proposta, proponiamo un nome di percorso “pythonamide”.
La scoperta di un'enzimologia inaspettata in una famiglia di enzimi funzionalmente caratterizzata illustra la promessa della genomica ambientale per nuove scoperte e illustra anche la limitata capacità di inferenza funzionale basata sulla sola omologia di sequenza.Pertanto, insieme ai rapporti sui RiPP polifosforilati bioattivi non canonici, i nostri risultati dimostrano un valore ad alta intensità di risorse ma fondamentale per gli sforzi di biologia sintetica per scoprire completamente la ricchezza funzionale, la diversità e le strutture insolite dei composti biochimici.
Qui dimostriamo la gamma di potenziale biosintetico codificato dai microbi e il loro contesto genomico nel microbioma marino globale, facilitando la ricerca futura rendendo la risorsa risultante disponibile alla comunità scientifica (https://microbiomics.io/ocean/).Abbiamo scoperto che gran parte della sua novità filogenetica e funzionale può essere ottenuta solo ricostruendo MAG e SAG, specialmente nelle comunità microbiche sottoutilizzate che potrebbero guidare i futuri sforzi di bioprospezione.Anche se qui ci concentreremo su 'Ca.Eudormicrobiaceae” come un lignaggio particolarmente “talento” dal punto di vista biosintetico, molti dei BGC previsti nel microbiota sconosciuto probabilmente codificano enzimologie precedentemente non descritte che producono composti con azioni significative dal punto di vista ambientale e/o biotecnologico.
Sono stati inclusi set di dati metagenomici provenienti da importanti studi oceanografici e serie temporali con sufficiente profondità di sequenziamento per massimizzare la copertura delle comunità microbiche marine globali nei bacini oceanici, negli strati profondi e nel tempo.Questi set di dati (Tabella supplementare 1 e Figura 1) includono la metagenomica da campioni raccolti negli oceani di Tara (arricchito virale, n = 190; arricchito procariotico, n = 180)12,22 e la spedizione BioGEOTTRACES (n = 480).Serie temporali oceaniche hawaiane (HOT, n = 68), serie temporali Bermuda-Atlantico (BATS, n = 62)21 e spedizione Malaspina (n = 58)23.Le letture di sequenziamento da tutti i frammenti metagenomici sono state filtrate per qualità utilizzando BBMap (v.38.71) rimuovendo gli adattatori di sequenziamento dalle letture, rimuovendo le letture mappate alle sequenze di controllo di qualità (genomi PhiX) e utilizzando trimq=14, maq=20 scarta la scarsa qualità di lettura, maxns = 0 e minlength = 45. Le analisi successive sono state eseguite o unite alle letture QC se specificato (bbmerge.sh minoverlap=16).Le letture del QC sono state normalizzate (obiettivo bbnorm.sh = 40, mind Depth = 0) prima della creazione utilizzando metaSPAdes (v.3.11.1 o v.3.12 se necessario)53.Gli scaffold risultanti (di seguito denominati scaffold) sono stati infine filtrati in base alla lunghezza (≥1 kb).
I 1038 campioni metagenomici sono stati divisi in gruppi e, per ciascun gruppo di campioni, le letture del controllo di qualità metagenomico di tutti i campioni sono state abbinate alle parentesi di ciascun campione separatamente, ottenendo il seguente numero di letture di gruppo tra parentesi a coppie: Tara Marine Viruses – Enriched (190×190 ), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) e Malaspina (58×58).La mappatura è stata eseguita utilizzando Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 che consente di abbinare le letture ai siti secondari (utilizzando il flag -a).Gli allineamenti sono stati filtrati in modo che fossero lunghi almeno 45 basi, avessero un'identità ≥97% e un'estensione ≥80% delle letture.I file BAM risultanti sono stati elaborati utilizzando lo script jgi_summarize_bam_contig_lengths per MetaBAT2 (v.2.12.1)55 per fornire copertura intra e inter-campione per ciascun gruppo.Infine, le parentesi sono state raggruppate per aumentare la sensibilità eseguendo individualmente MetaBAT2 su tutti i campioni con –minContig 2000 e –maxEdges 500. Usiamo MetaBAT2 invece di un boxer insieme perché è stato dimostrato in test indipendenti come il boxer singolo più efficace.e da 10 a 50 volte più veloce di altri boxer comunemente usati57.Per testare l'effetto delle correlazioni di abbondanza, un sottocampione di metagenomica selezionato casualmente (10 per ciascuno dei due set di dati di Tara Ocean, 10 per BioGEOTRACES, 5 per ciascuna serie temporale e 5 per Malaspina) ha inoltre utilizzato solo campioni.I campioni interni vengono raggruppati per ottenere informazioni sulla copertura.(Informazioni aggiuntive).
Ulteriori genomi (esterni) sono stati inclusi nell'analisi successiva, vale a dire 830 MAG selezionati manualmente da un sottoinsieme del set di dati Tara Oceans26, 5287 SAG dal set di dati GORG20 e dati dal database MAR (MarDB v. 4) da 1707 REF isolati e 682 SAGs) 27. Per il set di dati MarDB, i genomi vengono selezionati in base ai metadati disponibili se il tipo di campione corrisponde alla seguente espressione regolare: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] isolato'.
La qualità di ciascun contenitore metagenomico e dei genomi esterni è stata valutata utilizzando CheckM (v.1.0.13) e Lineage Workflow di Anvi'o (v.5.5.0)58,59.Se CheckM o Anvi'o riporta una completezza/completezza ≥50% e una contaminazione/ridondanza ≤10%, salvare le cellule metagenomiche e i genomi esterni per un'analisi successiva.Questi punteggi sono stati poi combinati in completezza media (mcpl) e contaminazione media (mctn) per classificare la qualità del genoma secondo i criteri comunitari60 come segue: alta qualità: mcpl ≥ 90% e mctn ≤ 5%;buona qualità: mcpl ≥ 70%, mctn ≤ 10%, qualità media: mcpl ≥ 50% e mctn ≤ 10%, qualità discreta: mcpl ≤ 90% o mctn ≥ 10%.I genomi filtrati sono stati quindi correlati con i punteggi di qualità (Q e Q') come segue: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilità della deformazione)/100 + 0,5 x log[N50] .(implementato in dRep61).
Per consentire l'analisi comparativa tra diverse fonti di dati e tipi di genoma (MAG, SAG e REF), 34.799 genomi sono stati dereferenziati in base all'identità nucleotidica media dell'intero genoma (ANI) utilizzando dRep (v.2.5.4).Repeats)61 con soglie ANI del 95%28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) e geni marcatori a copia singola che utilizzano SpecI63 fornendo clustering del genoma a livello di specie.Per ciascun cluster dRep è stato selezionato un genoma rappresentativo in base al punteggio di qualità massimo (Q') sopra definito, considerato rappresentativo della specie.
Per valutare la velocità di mappatura, è stato utilizzato BWA (v.0.7.17-r1188, -a) per mappare tutti i 1038 set di letture metagenomiche con 34.799 genomi contenuti nell'OMD.Le letture con controllo di qualità sono state mappate in modalità single-ended e gli allineamenti risultanti sono stati filtrati per conservare solo allineamenti di lunghezza ≥ 45 bp.e identità ≥95%.Il rapporto di visualizzazione per ciascun campione è la percentuale di letture rimanenti dopo la filtrazione divisa per il numero totale di letture di controllo qualità.Utilizzando lo stesso approccio, ciascuno dei 1038 metagenomi è stato ridotto a 5 milioni di inserti (dati espansi, Fig. 1c) e abbinato a GORG SAG in OMD e in tutti i GEM16.La quantità di MAG recuperati dall'acqua di mare nel catalogo GEM16 è stata determinata mediante query di parole chiave di fonti metagenomiche, selezionando campioni di acqua di mare (ad esempio, in contrapposizione ai sedimenti marini).Nello specifico, selezioniamo "acquatico" come "categoria_ecosistema", "marino" come "tipo_ecosistema" e filtriamo "habitat" come "oceano profondo", "marino", "marittimo oceanico", "pelagico marino", "acqua marina", “Oceano”, “Acqua di mare”, “Acqua di mare di superficie”, “Acqua di mare di superficie”.Ciò ha prodotto 5903 MAG (734 di alta qualità) distribuiti su 1823 OTU (visualizza qui).
I genomi procariotici sono stati annotati tassonomicamente utilizzando GTDB-Tk (v.1.0.2)64 con parametri predefiniti mirati a GTDB r89 versione 13. Anvi'o è stato utilizzato per identificare genomi eucariotici in base alla previsione del dominio e al richiamo ≥50% e alla ridondanza ≤ 10%.L'annotazione tassonomica di una specie è definita come uno dei suoi genomi rappresentativi.Ad eccezione degli eucarioti (148 MAG), ciascun genoma è stato prima annotato funzionalmente utilizzando prokka (v.1.14.5)65, nominando i geni completi, definendo i parametri "archaea" o "batteri" secondo necessità, che vengono riportati anche per i non- geni codificanti.e regioni CRISPR, tra le altre caratteristiche genomiche.Annotare i geni previsti identificando i geni marcatori universali a copia singola (uscMG) utilizzando fetchMG (v.1.2)66, assegnare gruppi ortologici ed eseguire query utilizzando emapper (v.2.0.1)67 basato su EggNOG (v.5.0)68.Database KEGG (pubblicato il 10 febbraio 2020) 69. L'ultimo passaggio è stato eseguito abbinando le proteine al database KEGG utilizzando DIAMOND (v.0.9.30)70 con una query e una copertura degli argomenti ≥70%.I risultati sono stati ulteriormente filtrati secondo la NCBI Prokaryotic Genome Annotation Pipeline71 in base al bitrate ≥ 50% del bitrate massimo previsto (link stesso).Le sequenze genetiche sono state utilizzate anche come input per identificare i BGC nel genoma utilizzando antiSMASH (v.5.1.0)72 con parametri predefiniti e diverse esplosioni di cluster.Tutti i genomi e le annotazioni sono stati compilati in OMD insieme ai metadati contestuali disponibili sul web (https://microbiomics.io/ocean/).
Similmente ai metodi precedentemente descritti12,22 abbiamo utilizzato CD-HIT (v.4.8.1) per raggruppare >56,6 milioni di geni codificanti proteine provenienti da genomi batterici e archaeali da OMD in geni con identità del 95% e più brevi (copertura del 90%)73 fino a >17,7 milioni di cluster di geni.La sequenza più lunga è stata scelta come gene rappresentativo per ciascun cluster di geni.I 1038 metagenomi sono stati quindi abbinati a >17,7 milioni di membri del cluster BWA (-a) e i file BAM risultanti sono stati filtrati per mantenere solo allineamenti con identità ≥95% e ≥45 allineamenti di base.L'abbondanza genica normalizzata in lunghezza è stata calcolata contando prima gli inserti dal miglior allineamento unico e poi, per gli inserti con mappatura fuzzy, aggiungendo conteggi frazionari ai corrispondenti geni bersaglio proporzionali al loro numero di inserti unici.
I genomi dell'OMD espanso (con MAG aggiuntivi di "Ca. Eudormicrobiaceae", vedi sotto) sono stati aggiunti al database dello strumento di analisi metagenomica mOTUs74 (v.2.5.1) per creare un database di riferimento mOTU esteso.Solo sei genomi a copia singola (23.528 genomi) sono sopravvissuti su dieci uscMG.L'espansione del database ha prodotto 4.494 cluster aggiuntivi a livello di specie.1038 metagenomi sono stati analizzati utilizzando i parametri mOTU predefiniti (v.2).Un totale di 989 genomi contenuti in 644 cluster mOTU (95% REF, 5% SAG e 99,9% appartenenti a MarDB) non sono stati rilevati dal profilo mOTU.Ciò riflette varie ulteriori fonti di isolamento marino dei genomi MarDB (la maggior parte dei genomi non rilevati sono associati a organismi isolati da sedimenti, ospiti marini, ecc.).Per continuare a concentrarci sull’ambiente oceanico aperto in questo studio, li abbiamo esclusi dall’analisi a valle a meno che non fossero rilevati o inclusi nel database mOTU esteso creato in questo studio.
Tutti i BGC da MAG, SAG e REF in OMD (vedi sopra) sono stati combinati con BGC identificati in tutti gli scaffold metagenomici (antiSMASH v.5.0, parametri predefiniti) e caratterizzati utilizzando BiG-SLICE (v.1.1) (dominio PFAM)75.Sulla base di queste caratteristiche, abbiamo calcolato tutte le distanze coseno tra BGC e le abbiamo raggruppate (collegamenti medi) in GCF e GCC utilizzando soglie di distanza rispettivamente di 0,2 e 0,8.Queste soglie sono un adattamento delle soglie precedentemente utilizzate utilizzando la distanza euclidea75 insieme alla distanza coseno, che allevia parte dell'errore nella strategia di clustering BiG-SLICE originale (Informazioni supplementari).
I BGC sono stati quindi filtrati per conservare solo ≥ 5 kb codificati sugli scaffold per ridurre il rischio di frammentazione come descritto in precedenza16 e per escludere REF e SAG MarDB non trovati in 1038 metagenomi (vedi sopra).Ciò ha comportato la codifica di un totale di 39.055 BGC dal genoma OMD, con ulteriori 14.106 identificati su frammenti metagenomici (cioè non combinati in MAG).Questi BGC "metagenomici" sono stati utilizzati per stimare la proporzione del potenziale di biosintesi del microbioma marino non catturato nel database (informazioni supplementari).Ciascun BGC è stato caratterizzato funzionalmente in base ai tipi di prodotto predittivi definiti da categorie di prodotti anti-SMASH o più grossolane definite in BiG-SCAPE76.Per evitare errori di campionamento nella quantificazione (composizione tassonomica e funzionale di GCC/GCF, distanza di GCF e GCC dai database di riferimento e abbondanza metagenomica di GCF), mantenendo solo il BGC più lungo per GCF per ciascuna specie, 39.055 BGC sono stati ulteriormente deduplicati, per un totale di 17.689 BGC.
La novità di GCC e GCF è stata valutata in base alla distanza tra il database calcolato (database RefSeq in BiG-FAM)29 e il BGC verificato sperimentalmente (MIBIG 2.0)30.Per ciascuno dei 17.689 BGC rappresentativi, abbiamo scelto la distanza coseno più piccola dal rispettivo database.Di queste distanze minime viene poi calcolata la media (media) secondo GCF o GCC, a seconda dei casi.Un GCF è considerato nuovo se la distanza dal database è maggiore di 0,2, che corrisponde a una separazione ideale tra il GCF (medio) e il riferimento.Per GCC, scegliamo 0,4, che è il doppio della soglia definita da GCF, per stabilire una relazione a lungo termine con i collegamenti.
L'abbondanza metagenomica di BGC è stata stimata come l'abbondanza media dei suoi geni biosintetici (come determinato mediante anti-SMASH) disponibili dai profili a livello di gene.L'abbondanza metagenomica di ciascun GCF o GCC è stata quindi calcolata come la somma dei BGC rappresentativi (su 17.689).Queste mappe di abbondanza sono state successivamente normalizzate per la composizione cellulare utilizzando il conteggio mOTU per campione, che ha tenuto conto anche degli sforzi di sequenziamento (dati espansi, Fig. 1d).La prevalenza di GCF o GCC è stata calcolata come percentuale di campioni con un'abbondanza > 0.
La distanza euclidea tra i campioni è stata calcolata dal profilo GCF normalizzato.Queste distanze sono state ridotte di dimensioni utilizzando UMAP77 e gli incorporamenti risultanti sono stati utilizzati per il clustering basato sulla densità non supervisionato utilizzando HDBSCAN78.Il numero minimo ottimale di punti per un cluster (e quindi il numero di cluster) utilizzato da HDBSCAN viene determinato massimizzando la probabilità cumulativa di appartenenza al cluster.I cluster identificati (e un sottocampione bilanciato casuale di questi cluster per tenere conto dei bias nell'analisi multivariata permutazionale della varianza (PERMANOVA)) sono stati testati per la significatività rispetto alle distanze euclidee non ridotte utilizzando PERMANOVA.La dimensione media del genoma dei campioni è stata calcolata in base all'abbondanza relativa di mOTU e alla dimensione stimata del genoma dei membri dei genomi.In particolare, la dimensione media del genoma di ciascun mOTU è stata stimata come la media delle dimensioni del genoma dei suoi membri corretta per completezza (dopo il filtraggio) (ad esempio, un genoma completo al 75% con una lunghezza di 3 Mb ha una dimensione corretta di 4 Mb).per genomi medi con integrità ≥70%.La dimensione media del genoma per ciascun campione è stata quindi calcolata come la somma delle dimensioni del genoma mOTU ponderata per l'abbondanza relativa.
Un insieme filtrato di BGC codificati dal genoma nell'OMD è mostrato negli alberi GTDB batterici e arcaici (in strutture ≥ 5 kb, esclusi REF e SAG MarDB non trovati in 1038 metagenomi, vedere sopra) e le loro categorie di prodotti previste in base al filogenetico posizione del genoma (vedi sopra).Per prima cosa abbiamo ridotto i dati per specie, utilizzando come rappresentativo il genoma con il maggior numero di BGC in quella specie.Per la visualizzazione, i rappresentanti sono stati ulteriormente divisi in gruppi di alberi e, ancora una volta, per ciascun clade cellulare, è stato selezionato come rappresentante il genoma contenente il maggior numero di BGC.Le specie arricchite con BGC (almeno un genoma con >15 BGC) sono state ulteriormente analizzate calcolando l'indice di diversità di Shannon per i tipi di prodotto codificati in tali BGC.Se tutti i tipi di prodotto previsti sono uguali, gli ibridi chimici e altri BGC complessi (come previsto dall'anti-SMAH) sono considerati appartenenti allo stesso tipo di prodotto, indipendentemente dal loro ordine nel cluster (ad esempio fusione proteina-batteriocina e batteriocina-proteoproteina corpo).ibrido).
DNA rimanente (stimato in 6 ng) dal campione Malaspina MP1648, corrispondente al campione biologico SAMN05421555 e abbinato al set di letture metagenomiche Illumina SRR3962772 per letture brevi, elaborato secondo il protocollo di sequenziamento PacBio con input ultra-basso per utilizzare l'amplificazione del campione gDNA SMRTbell del kit PacBio kit (100-980-000) e kit di preparazione del modello SMRTbell Express 2.0 (100-938-900).In breve, il DNA rimanente è stato tagliato, riparato e purificato (sfere ProNex) utilizzando Covaris (g-TUBE, 52104).Il DNA purificato viene quindi sottoposto alla preparazione della libreria, all'amplificazione, alla purificazione (sfere ProNex) e alla selezione delle dimensioni (>6 kb, Blue Pippin) prima di una fase finale di purificazione (sfere ProNex) e sequenziamento sulla piattaforma Sequel II.
Ricostruzione dei primi due ca.Per MAG Eremiobacterota, abbiamo identificato sei ANI aggiuntivi >99% (inclusi nella Figura 3), che sono stati inizialmente filtrati in base ai punteggi di contaminazione (successivamente identificati come duplicazioni geniche, vedere di seguito).Abbiamo anche trovato un vassoio con l'etichetta “Ca”.Eremiobacterota" da vari studi23 e li ha utilizzati insieme a otto MAG del nostro studio come riferimento per le letture metagenomiche di 633 campioni eucariotici arricchiti (>0,8 µm) utilizzando BWA (v.0.7.17) Rif -r1188, - un flag) per il downsampling mappatura (5 milioni di letture).Sulla base di mappe specifiche dell'arricchimento (filtrate per identità di allineamento del 95% e copertura di lettura dell'80%), sono stati selezionati 10 metagenomi (copertura prevista ≥ 5 ×) per l'assemblaggio e altri 49 metagenomi (copertura prevista ≥ 1 ×) per la correlazione del contenuto.Utilizzando gli stessi parametri di cui sopra, questi campioni sono stati separati e sono stati aggiunti altri 10 'Ca'.Il MAG Eremiobacterota è stato ripristinato.Questi 16 MAG (senza contare i due già presenti nel database) portano il numero totale di genomi nell'OMD espanso a 34.815.Ai MAG vengono assegnati ranghi tassonomici in base alla loro somiglianza genomica e alla posizione nel GTDB.18 MAG sono stati dereplicati utilizzando dRep in 5 specie (ANI intraspecifico >99%) e 3 generi (ANI intragenerico dall'85% al 94%) all'interno della stessa famiglia79.I rappresentanti delle specie sono stati selezionati manualmente in base all'integrità, alla contaminazione e all'N50.La nomenclatura suggerita è fornita nelle Informazioni supplementari.
Valutare l'integrità e la contaminazione di 'Ca.MAG Eremiobacterota, abbiamo valutato la presenza di uscMG, nonché set di geni marcatori a copia singola specifici del lignaggio e del dominio utilizzati da CheckM e Anvi'o.L'identificazione di 2 duplicati su 40 uscMG è stata confermata mediante ricostruzione filogenetica (vedi sotto) per escludere qualsiasi potenziale contaminazione (questo corrisponde al 5% sulla base di questi 40 geni marcatori).Un ulteriore studio su cinque MAG rappresentativi 'Ca.Il basso livello di contaminanti in questi genomi ricostruiti è stato confermato per le specie Eremiobacterota utilizzando l'interfaccia interattiva Anvi'o basata sulle correlazioni di abbondanza e composizione della sequenza (informazioni supplementari)59.
Per l'analisi filogenomica, abbiamo selezionato cinque MAG rappresentativi "Ca".Eudormicrobiaceae”, tutte le specie “Ca.Il genoma di Eremiobacterota e dei membri di altri phyla (compresi UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria e Planctomycetota) è disponibile da GTDB (r89)13.Tutti questi genomi sono stati annotati come precedentemente descritto per l'estrazione del gene marcatore a copia singola e l'annotazione BGC.I genomi GTDB sono stati conservati secondo i criteri di integrità e contaminazione di cui sopra.L'analisi filogenetica è stata eseguita utilizzando il flusso di lavoro Anvi'o Phylogenetics59.L'albero è stato costruito utilizzando IQTREE (v.2.0.3) (opzioni predefinite e -bb 1000)80 su un allineamento di 39 proteine ribosomiali tandem identificate da Anvi'o (MUSCLE, v.3.8.1551)81.Le sue posizioni furono ridotte.per coprire almeno il 50% del genoma82 e Planctomycecota è stato utilizzato come outgroup basato sulla topologia ad albero GTDB.È stato creato un albero di 40 uscMG utilizzando gli stessi strumenti e parametri.
Abbiamo utilizzato Traitar (v.1.1.2) con parametri predefiniti (fenotipo, da nucleotidi)83 per prevedere i tratti microbici comuni.Abbiamo esplorato un potenziale stile di vita predatorio basato su un indice predatorio precedentemente sviluppato84 che dipende dal contenuto di un gene codificante una proteina nel genoma.Nello specifico, utilizziamo DIAMOND per confrontare le proteine nel genoma con il database OrthoMCL (v.4)85 utilizzando le opzioni –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 E contiamo i geni corrispondenti a i geni marcatori per predatori e non predatori.L'indice è la differenza tra il numero di segni predatori e non predatori.Come controllo aggiuntivo, abbiamo anche analizzato il genoma “Ca”.Il fattore Entotheonella TSY118 si basa sulla sua associazione con Ca.Eudoremicrobium (grande dimensione del genoma e potenziale biosintetico).Successivamente, abbiamo testato potenziali collegamenti tra i geni marcatori predatori e non predatori e il potenziale biosintetico del Ca.Eudormicrobiaceae” e ha scoperto che non più di un gene (di qualsiasi tipo di gene marcatore, cioè gene predatore/non predatore) si sovrappone a BGC, suggerendo che BGC non confonde i segnali di predazione.Un'ulteriore annotazione genomica dei repliconi codificati è stata eseguita utilizzando TXSSCAN (v.1.0.2) per esaminare in modo specifico il sistema di secrezione, i pili e i flagelli86.
Cinque 'Ca' rappresentativi sono stati mappati mappando 623 metatrascrittomi dalle frazioni di arricchimento procariotiche ed eucariotiche degli oceani Tara22,40,87 (utilizzando BWA, v.0.7.17-r1188, -a flag).Genoma delle Eudormicrobiaceae.I file BAM sono stati elaborati con FeatureCounts (v.2.0.1)88 dopo una copertura di lettura dell'80% e un filtro di identità del 95% (con le opzioni featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Conta i numero di inserti per gene.Le mappe generate sono state normalizzate per la lunghezza del gene e l'abbondanza del gene marcatore mOTU (conteggio medio di inserzioni normalizzato in lunghezza per geni con conteggio di inserzioni > 0) e trasformate logaritmicamente a 22,74 per ottenere l'espressione relativa per cellula di ciascun livello di gene, il che spiega anche la variabilità da campione a campione durante il sequenziamento.Tali rapporti consentono analisi comparative, mitigando i problemi di composizione quando si utilizzano dati sull'abbondanza relativa.Solo i campioni con >5 dei 10 geni marcatori mOTU sono stati presi in considerazione per ulteriori analisi per consentire il rilevamento di una porzione sufficientemente ampia del genoma.
Il profilo trascrittomico normalizzato di 'Ca.E. taraoceanii è stato sottoposto a riduzione della dimensionalità utilizzando UMAP e la rappresentazione risultante è stata utilizzata per il clustering non supervisionato utilizzando HDBSCAN (vedi sopra) per determinare lo stato di espressione.PERMANOVA verifica il significato delle differenze tra i cluster identificati nello spazio di distanza originale (non ridotto).L'espressione differenziale tra queste condizioni è stata testata attraverso il genoma (vedi sopra) e sono state identificate 201 vie KEGG in 6 gruppi funzionali, vale a dire: BGC, sistema di secrezione e geni flagellari da TXSSCAN, enzimi di degradazione (proteasi e peptidasi) e predatori e non- geni predatori.indicatori di indice predatorio.Per ciascun campione, abbiamo calcolato l'espressione mediana normalizzata per ciascuna classe (si noti che l'espressione BGC stessa è calcolata come l'espressione mediana dei geni biosintetici per quel BGC) e testata la significatività tra gli stati (test di Kruskal-Wallis aggiustato per FDR).
I geni sintetici sono stati acquistati da GenScript e i primer PCR sono stati acquistati da Microsynth.Per l'amplificazione del DNA è stata utilizzata la polimerasi di fusione di Thermo Fisher Scientific.Per la purificazione del DNA sono stati utilizzati plasmidi NucleoSpin, gel NucleoSpin e kit di purificazione PCR di Macherey-Nagel.Gli enzimi di restrizione e la ligasi del DNA T4 sono stati acquistati dai Biolab del New England.Prodotti chimici diversi dall'isopropil-β-d-1-tiogalattopiranoside (IPTG) (Biosynth) e 1,4-ditiotreitolo (DTT, AppliChem) sono stati acquistati da Sigma-Aldrich e utilizzati senza ulteriore purificazione.Gli antibiotici cloramfenicolo (Cm), spectinomicina dicloridrato (Sm), ampicillina (Amp), gentamicina (Gt) e carbenicillina (Cbn) sono stati acquistati da AppliChem.I componenti dei terreni Bacto Tryptone e Bacto Yeast Extract sono stati acquistati da BD Biosciences.La trypsin per il sequenziamento è stata acquistata da Promega.
Le sequenze geniche sono state estratte dal BGC 75.1 previsto dall'anti-SMASH.E. malaspinii (Informazioni supplementari).
I geni embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) e embAM (comprese le regioni intergene) sono stati sequenziati come costrutti sintetici in pUC57(AmpR) con e senza codoni ottimizzati per l'espressione in E Quando.Il gene embA è stato subclonato nel primo sito di clonazione multipla (MCS1) di pACYCDuet-1(CmR) e pCFDDuet-1(SmR) con siti di clivaggio BamHI e HindIII.I geni embM e embMopt (codone ottimizzato) sono stati subclonati in MCS1 pCFDDuet-1(SmR) con BamHI e HindIII e posizionati nel secondo sito di clonazione multipla di pCFDDuet-1(SmR) e pRSFDuet-1(KanR) (MCS2) con NdeI/ChoI.La cassetta embAM è stata subclonata in pCFDDuet1(SmR) con siti di clivaggio BamHI e HindIII.Il gene orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) è stato costruito mediante PCR di estensione sovrapposta utilizzando i primer EmbI_OE_F_NdeI e EmbI_OE_R_XhoI, digerito con NdeI/XhoI e legato in pCDFDuet-1-EmbM (MCS1) utilizzando gli stessi enzimi di restrizione (supplementari tavolo).6).La digestione e la legatura con enzimi di restrizione sono state eseguite secondo il protocollo del produttore (New England Biolabs).
Orario di pubblicazione: 14 marzo 2023