Análisis de Secuencias

Author

David Alberto García Estrada

BioCode Academy

Información general

¡Bienvenido a este nuevo viaje bioinformático! 🌟 Este curso integra el análisis de secuencias biológicas con el manejo de bases de datos y herramientas especializadas.

📚 ¿Qué aprenderás?

🧰 Instalar herramientas bioinformáticas
🔍 Buscar similitud entre secuencias
🧬 Alinear secuencias biológicas
🌿 Construir árboles filogenéticos
🧩 Analizar dominios funcionales
🎨 Visualizar la conservación de secuencias
👁 Explorar visualmente datos biológicos

✅ Todo esto a través de ejemplos prácticos, con orientación paso a paso, en un entorno Linux.

⌛ Duración: 8 horas (2 horas diarias)
💬 Idioma: Español
📍 Ubicación: Virtual (Teams)
📝 Modalidad: Práctico (80%) + Teórico (20%)
Requerimientos:
- 💻 Laptop
- 🌐 Conexión a internet
- 🐧 Ambiente Unix/WSL

SE REQUIERE CONOCIMIENTO PREVIO EN PROGRAMACIÓN

📘 Día 1

🔧 Módulo 1: Instalación de herramientas y obtención de secuencias

🎯 Objetivo: Preparar el entorno computacional e introducir la obtención de secuencias desde bases de datos públicas.

Actividades:

🔥 Bienvenida e introducción
- Presentación del curso y del instructor
- Código de conducta y dinámica rápida de presentación
💻 Instalación de herramientas bioinformáticas
- ncbi-blast+, seqkit, muscle, clustalo, mafft, trimal, fasttree, iqtree
- Visualizadores: jalview, figtree
- Utilidad adicional: weblogo
🌐 Bases de datos biológicas y descarga de secuencias
- Navegación en UniProt y NCBI
- Descarga y visualización de secuencias FASTA

📙 Día 2

🧬 Módulo 2: Alineamientos locales mediante BLAST

🎯 Objetivo: Aplicar BLAST para realizar búsquedas de similitud, tanto en línea como localmente.

Actividades:

🧾 Homología
- Definición de homología, ortologos, parálogos
- Herramientas para búsqueda de homología
🌍 Uso de BLAST en línea
- Búsqueda contra UniProt y NCBI
- Descarga e interpretación de resultados
🧾 BLAST local en terminal
- Creación de bases de datos locales con makeblastdb
- Ejecución de blastp y tblastn
- Recuperación de secuencias relevantes con seqkit
📂 Filtrado y organización de resultados
- Selección de los mejores hits
- Unión y clasificación de secuencias para análisis posterior

📗 Día 3

🌳 Módulo 3: Alineamiento múltiple y análisis filogenético

🎯 Objetivo: Generar alineamientos múltiples y construir árboles filogenéticos básicos.

Actividades:

🧬 Alineamiento de secuencias
- Uso de MAFFT, Clustal Omega y Muscle
- Comparación de resultados y calidad
✂️ Recorte de alineamientos
- Uso de trimal para limpiar alineamientos
- Identificación de regiones conservadas
🎨 Visualización de conservación con WebLogo
- Generación de logos a partir de alineamientos recortados
- Interpretación de regiones altamente conservada
🌿 Construcción de árboles filogenéticos
- Generación de árboles con fasttree
- Discusión de conceptos filogenéticos básicos
👁 Visualización de arboles
- Alineamientos en Jalview
- Árboles en FigTree

📕 Día 4

🧩 Módulo 4: Análisis de dominios y conservación de secuencias

🎯 Objetivo: Identificar dominios funcionales en secuencias y visualizar su conservación.

Actividades:

🔍 Análisis de dominios con InterProScan
- Envío de secuencias y descarga de resultados .tsv
- Extracción de dominios Pfam
🧠 Búsqueda de dominios con HMMER
- Preparación de la base de datos Pfam-A
- Ejecución de hmmscan, hmmfetch, hmmsearch

📕 Día 5

🧬 Módulo 5: Modelado proteico y análisis estructural

🎯 Objetivo: Predecir estructuras de proteínas con herramientas de inteligencia artificial, visualizarlas y compararlas estructuralmente.

Actividades:

🧠 Introducción al modelado estructural
- Tipos de estructura: primaria a cuaternaria
- Principios del modelado con IA: AlphaFold, Boltz-1, entre otras
⚙️ Predicción de estructuras
- Entrada de secuencia FASTA
- Interpretación de resultados: pLDDT, PAE
🧩 Visualización y análisis en ChimeraX
- Carga y exploración de archivos .pdb
- Coloreado por confianza estructural
- Identificación de regiones funcionales
🔄 Alineamiento de modelos estructurales
- Superposición de estructuras con ChimeraX
- Evaluación visual de similitudes y diferencias

David Alberto García Estrada

Candidato a Doctor en Biología Integrativa, UGA, Cinvestav.
Co-fundador de BioCode Academy
Contacto
- 🔗 Github
- 📨 albert_dge@hotmail.com
- 📨 david.garcia.e@cinvestav.mx
- 📨 biocodeacademy@gmail.com