De un genoma podemos obtener datos del probable fenotipo que tenga la cepa bactariana. Para esto podemos usar el programa traitar.
Analizar que fenotipos tienen unos genomas debe partir de contigs ya ensamblados y es necesario conocer los genes que tiene cada genoma y su secuencia de aminoácidos. Aunque traitar puede obtener los genes de cada genoma, es mejor hacerlo un mismo con prodigal. Asumiendo que los genomas los tenemos ya en formato fasta de nucleótidos, podemos hacer un for loop para extraer los genes a cada uno:
$ for f in *.fasta; do prodigal -i $f -a $f; doneEste comando nos creará nuevos archivos con la terminación .faa pero incluyendo también .fasta (*.fasta.faa) por lo que habrá que limpiarlos:
$ rename 's/.fasta.faa/.faa/' *.faaDebemos poner todos estos archivos en un nuevo directorio para poderlo llamar desde traitar:
$ mkdir faa$ mv *.faa faa/Ahora debemos crear un archivo con los nombres de los archivos de los genomas en la columna 1 y un nombre del genoma en la columna 2. Podemos poner una tercer columna si sabemos queremos agrupar los genomas por algún motivo. Las columnas deben estar delimitadas por tabuladores y tener un encabezado en la primer linea. Podemos llamar a este archivo genome.list
sample_file_name sample_name categoryANC419_LTYK01.faa ANC419_LTYK01 Clade_1ARGOS108.faa ARGOS108 Clade_1ATCC17749_LOSN02.faa ATCC17749_LOSN02 Clade_2ATCC33787.faa ATCC33787 Clade_3Nota. La tercer columna es opcional. Pero la primer linea es obligatoria y con ese texto exacto, salvo el category si no hay esa información.
Ahora si podemos correr traitar:
$ traitar phenotype faa genome.list from_genes traitar -c8Donde
phenotype indica que obtendremos fenotiposfaa es el directorio donde están los archivos con los genes en secuencia de aminoácidosgenome.list es el archivo generado anteriormentefrom_genes especifica que es a partir de genestraitar es el directorio de salida en donde va a escribir los resultados-c 8 usaremos 8 núcleos del servidorTraitar puede tardar mucho en correr por lo que es aconsejable correrlo con screen.