cat P06780.fasta13 Análisis de dominios con InterProScan
En este módulo aprenderás cómo identificar dominios conservados en proteínas utilizando la herramienta en línea InterProScan, enfocándonos especialmente en la obtención de dominios Pfam.
13.1 🧬 InterProScan en línea
Accede al sitio web de InterProScan desde el siguiente enlace:
🔗 https://www.ebi.ac.uk/interpro/search/sequence/
13.1.1 📥 Ingreso de secuencia
Primero, visualiza o imprime en terminal la secuencia que deseas analizar:
- Copia la secuencia desde tu archivo
.fasta. - Pega la secuencia en la caja de búsqueda del sitio web.
- Ejecuta el análisis.
- Descarga los resultados en formato .tsv una vez completado.
13.1.2 📂 Organización de resultados
Renombra y filtra el archivo descargado para enfocarte únicamente en los dominios Pfam:
# Mueve el archivo descargado a tu directorio de trabajo
mv $HOME/Downloads/iprscan5-*.tsv iprscan_pfam.tsv
# Filtra y extrae columnas clave relacionadas con Pfam
grep "Pfam" iprscan_pfam.tsv | cut -f 4,5- La columna 4 corresponde al ID del dominio (por ejemplo, PF00069).
- La columna 5 corresponde al nombre o descripción del dominio.
13.1.3 📝 Nota
Además de Pfam, InterProScan puede detectar otros tipos de anotaciones como SMART, ProSite, TIGRFAMs y más. Si deseas ampliar el análisis, puedes conservar todas las filas del archivo .tsv y usar herramientas como Excel, LibreOffice Calc o R para filtrar y explorar los datos.