Una grande quantità di dati viene ora generata attraverso il sequenziamento ad alta velocità, gli studi di espressione genica, l'identificazione dei siti di legame delle proteine in tutto il genoma e, più recentemente, le misure che indicano la probabilità di due sistemi che si incontrano nello spazio in 3D. Questi grandi insiemi di dati richiedono nuovi metodi analitici per identificare modelli significativi, e i risultati possono essere correlati con quelli ottenuti da tecniche complementari. Per esempio, si può studiare la correlazione tra una data proteina legante il DNA e la probabilità che un gene sia espresso in prossimità. Un modello significativo è uno che ha una bassa probabilità di essere creato per caso e può essere associato a un fenotipo specifico, o a una proprietà cellulare osservabile, e quindi portare informazioni su questioni come la risposta cellulare ad un cambiamento di ambiente.
I nostri collaboratori, che sono fisici e matematici, creano modelli teorici dei complessi sistemi biologici che studiamo per aiutarci a capire meglio i nostri risultati e fare previsioni per gli esperimenti futuri.