Argomenti di oggi
Analisi di reti in ambito genomico: esempi di applicazione
L'abbondanza di dati high-throughput insieme a perfezionamento tecnico e diffusione delle teorie dei grafi hanno permesso all'analisi delle reti di diventare un approccio efficace per la visualizzazione e interpretazione di risultati sperimentali in vari campi della biologia e medicina. Esistono diversi metodi di costruzione delle reti adottati in bio-medicina, tra cui co-espressione, contatti intra- e inter-molecolari e interazioni regolative (es. miRNA-gene target; TF - target gene).
La visualizzazione di dati bio-medici in forma di rete apre la strada a metodi di analisi statistica mirati a cogliere elementi distintivi nella topologia di tali reti.
Applicazioni correnti dell'analisi topologica di reti in bio-medicina includono l'individuazione di biomarcatori da reti di espressione e l'integrazione di dati omici multilivello.
Cytoscape:
piattaforma software open source per la visualizzazione di reti complesse e la loro integrazione con dati di annotazione.
Cytoscape è un software open source per la visualizzazione di reti di interazione molecolare e pathways biologici, e per l'integrazione di queste reti con annotazioni, profili di espressione genica e altre tipologie di dati.
Le immagini che seguono propongono un tour che illustra concetti e funzioni di base di Cytoscape, prese e tradotte da questo tutorial e quest'altro tutorial introduttivo di Cytoscape.
Reti
Cytoscape accetta dati di interazioni in diversi formati (più o meno comuni) e da varie fonti (file locali o URLs):
Excel, TSV, CSV
XGMML: eXtensible Graph Markup and Modelling Language
SBML (Systems Biology Markup Language)
BioPAX
PSI-MI
SIF (Simple Interaction Format)
GML (Graph Markup Language)
... e altri
Analogamente, Cytoscape accetta annotazioni sulle reti (tabelle) da diversi formati e fonti:
Excel, TSV, CSV (files o URLs)
Banche dati pubbliche (es. BioMart)
... e altri
Cytoscape accetta dati di rete in diversi formati e da diverse fonti, tra cui molti database pubblici di interazioni e reti (ad esempio il database STRING, dove si può trovare una rete che rappresenta i geni associati al tumore al seno (immagine qui accanto). Ma anche WikiPathways, Reactome, ...
Le reti possono essere filtrate, e i nodi possono essere selezionati in base ai dati associati o alle proprietà della rete.
Ad esempio, possiamo utilizzare il valore di un attributo (es. fold change) per selezionare i nodi più connessi in una rete (detti hubs), e poi selezionare i primi vicini di questi.
Si può anche creare una nuova rete, o sottorete, a partire da un insieme di nodi selezionati. Per farlo (con i nodi ancora selezionati) andare su File → New Network → From selected nodes, all edges.
La figura qui accanto mostra una selezione dei geni più mutati nel tumore al seno e dei loro primi vicini (nodi in giallo).
A questo link un tutorial (in inglese) per approfondire come selezionare i nodi di una rete in Cytoscape.
Uno dei punti di forza di Cytoscape nella visualizzazione delle reti è la possibilità di personalizzare la resa grafica di qualsiasi dato di una tabella (es. nome, tipo, grado, peso, livello di espressione, ecc.) come proprietà (es. colore, dimensione del nodo, trasparenza o tipo di carattere) della rete. L'insieme delle scelte stilistiche adottate per la rete è chiamato Stile.
Salvataggio dei dati (sessione di lavoro, rete, annotazioni)
Una intera sessione di lavoro di Cytoscape può essere salvata (e ripresa successivamente) in files di formato .cys, che contengono:
Reti, Tabelle di annotazione, Stili definiti per la rete, ...
Una rete può essere esportata singolarmente in diversi formati:
SIF, GML, XGMML, BioPAX, JSON
Le tabelle di annotazione possono essere esportate singolarmente in file di formato .CSV
Immagini ad alta risoluzione delle reti prodotte in cytoscape, come pure di altri grafici, possono essere esportate in vari formati grafici di file:
PDF, SVG, PNG, o JPEG
SIF (Simple Interaction Format)
formato contenente l'informazione minima per costruire una rete.
Esempio di file in formato SIF (Simple Interaction File)
Il formato SIF è un file di testo semplice con almeno 2 colonne: una colonna contiene il nome di un nodo, una seconda colonna il nome dell'altro nodo, e la terza colonna (che è opzionale) il tipo di interazione che li lega. L'ordine in cui compaiono queste 2 o 3 colonne nel file SIF non è importante. In questo file, ogni riga specifica una interazione (cioé, due nodi legati da una linea) della rete che verrà visualizzata in Cytoscape. Infatti, il numero delle righe del file coincide con il numero di interazioni che verranno visualizzate nella rete corrispondente costruita in Cytoscape.
Tutorial Cytoscape
(Installa, se non già presente sul tuo PC, e poi) lancia Cytoscape.
SCOPO DEL TUTORIAL
Questo tutorial svolto con Cytoscape mira ad integrare dati di espressione di miRNA in una rete di interazioni miRNA-target (MTI). Il flusso di lavoro prevede i seguenti punti:
Caricamento di una rete di interazioni miRNA-target (MTI) convalidate, derivate da database pubblici.
Individuazione di un insieme di miRNA differenzialmente espressi in un set di dati di interesse.
Integrazione e visualizzazione dei dati sperimentali nella rete MTI
Integrazione delle annotazioni dei nodi da database pubblici
Filtraggio della rete in base al livello di significatività dell'espressione differenziale e al log-fold change
Analisi dell'arricchimento funzionale della rete su nodi target selezionati
Analisi di base della rete
PRONTI, PARTENZA, ...VIA!
N.B.: Volendo, puoi saltare i primi due punti del tutorial (1.1 e 1.2) e prendere direttamente il risultato di questi primi due punti da qui.
1 IMPORTARE UNA RETE IN Cytoscape
1.1 Ottenere una rete di interazioni miRNA-target validati
Per ottenere le interazioni di miRNA umani con i geni da loro regolati (target) fai quanto segue:
apri una pagina di browser sul sito di miRTarBase
dal menù in alto, fai click su Download
scorri in basso la pagina dei file disponibili per il download fino alla sessione intitolata "Catalog by Experimental Evidences"
scarica sul tuo PC il file excel intitolato " miRTarBase_SE_R.xlsx" corrispondente alla descrizione "Supported by strong experimental evidences (Reporter assay)"
apri il file con un editor adatto (esempio, Libreoffice)
1.2 Limitare i dati di miRNA-target validati a interazioni umane
Il file che hai appena scaricato contiene su ogni riga una interazione funzionale validata sperimentalmente (cioé confermata con un esperimento che ne ha provato l'efficacia), e dunque considerata un dato affidabile.
Questo file contiene tutte le interazioni validati di tutti i miRNA noti e per tutte le specie. Poiché noi siamo invece interessati in questo nostro tutorial a lavorare con miRNA umani e loro target, dobbiamo limitare il file alle sole interazioni relative all'uomo (specie Homo sapiens). Per farlo fai quanto segue:
Seleziona tutti i dati. A questo scopo, fai click sulla casellina che si trova tutto in alto a sinistra, sulla cornice delle caselle del file (quella casella che ha accanto le lettere che identificano le colonne, mentre sotto le caselle numerate che identificano l'indice progressivo delle righe).
Dal menù in alto, seleziona il percorso Data → Autofilter (nota che le esatte parole dovrai adattarle se hai sul PC selezionata la lingua italiana). Compariranno delle freccette accanto a ciascuna intestazione delle colonne.
Premi la freccetta in basso comparsa in corrispondenza della colonna C "Species (miRNA)"
Dal menù che compare, deseleziona tutti i valori (togli la spunta alla parola "all" in cima al menù a tendina)
Ora scorri nel menù a tendina fino a trovare Homo sapiens e selezionalo.
Premi OK in basso al menù a tendina per applicare la selezione e chiudere il menù.
Di nuovo, seleziona tutte le caselle (ora limitate alla specie Homo sapiens) con la stessa combinazione di tasti che hai usato al punto (1.)
Copia (combinazione di tasti CTRL + C) le righe selezionate
Apri un nuovo file di tipo calcolo e salvalo con il nome miRTarBase_hsa_functional.xlsx
Incolla nel nuovo foglio che compare le righe (combinazione di tasti CTRL + V) che avevi precedentemente selezionato e copiato
Salva il file (che ora contiene un foglio con le interazioni miRNA-target trovate in Homo sapiens e supportate da solida evidenza sperimentale).
La selezione di interazioni miRNA-target umani che hai appena creato si presta ad essere visualizzata come una rete, dove i nodi sono rappresentati da miRNA oppure da geni target dei miRNA, mentre la loro interazione è di tipo regolatorio (in particolare, un miRNA regola di norma negativamente l'espressione dei suoi geni target).
In particolare, ci riferiamo a questo specifico tipo di rete anche come rete MTI (iniziali dell'inglese miRNA-Target Interactions).
La rete con cui lavoreremo in questo tutorial è proprio il file excel che avete precedentemente creato e salvato con il nome "miRTarBase_hsa_functional.xlsx" (oppure che avete scaricato direttamente da qui)
Riferimenti
[presentazione] tour guidato delle funzioni di base di Cytoscape https://cytoscape.org/cytoscape-tutorials/protocols/basic-data-visualization/#/