Análisis de Secuencias

Author

David Alberto García Estrada

BioCode Academy

Información general

¡Bienvenido a este nuevo viaje bioinformático! 🌟 Este curso integra el análisis de secuencias biológicas con el manejo de bases de datos y herramientas especializadas.

📚 ¿Qué aprenderás?

  • 🧰 Instalar herramientas bioinformáticas
  • 🔍 Buscar similitud entre secuencias
  • 🧬 Alinear secuencias biológicas
  • 🌿 Construir árboles filogenéticos
  • 🧩 Analizar dominios funcionales
  • 🎨 Visualizar la conservación de secuencias
  • 👁 Explorar visualmente datos biológicos

✅ Todo esto a través de ejemplos prácticos, con orientación paso a paso, en un entorno Linux.

  • Duración: 8 horas (2 horas diarias)
  • 💬 Idioma: Español
  • 📍 Ubicación: Virtual (Teams)
  • 📝 Modalidad: Práctico (80%) + Teórico (20%)
  • Requerimientos:
    • 💻 Laptop
    • 🌐 Conexión a internet
    • 🐧 Ambiente Unix/WSL

SE REQUIERE CONOCIMIENTO PREVIO EN PROGRAMACIÓN

📘 Día 1

🔧 Módulo 1: Instalación de herramientas y obtención de secuencias

🎯 Objetivo: Preparar el entorno computacional e introducir la obtención de secuencias desde bases de datos públicas.

Actividades:

  • 🔥 Bienvenida e introducción
    • Presentación del curso y del instructor
    • Código de conducta y dinámica rápida de presentación
  • 💻 Instalación de herramientas bioinformáticas
    • ncbi-blast+, seqkit, muscle, clustalo, mafft, trimal, fasttree, iqtree
    • Visualizadores: jalview, figtree
    • Utilidad adicional: weblogo
  • 🌐 Bases de datos biológicas y descarga de secuencias
    • Navegación en UniProt y NCBI
    • Descarga y visualización de secuencias FASTA

📙 Día 2

🧬 Módulo 2: Alineamientos locales mediante BLAST

🎯 Objetivo: Aplicar BLAST para realizar búsquedas de similitud, tanto en línea como localmente.

Actividades:

  • 🧾 Homología
    • Definición de homología, ortologos, parálogos
    • Herramientas para búsqueda de homología
  • 🌍 Uso de BLAST en línea
    • Búsqueda contra UniProt y NCBI
    • Descarga e interpretación de resultados
  • 🧾 BLAST local en terminal
    • Creación de bases de datos locales con makeblastdb
    • Ejecución de blastp y tblastn
    • Recuperación de secuencias relevantes con seqkit
  • 📂 Filtrado y organización de resultados
    • Selección de los mejores hits
    • Unión y clasificación de secuencias para análisis posterior

📗 Día 3

🌳 Módulo 3: Alineamiento múltiple y análisis filogenético

🎯 Objetivo: Generar alineamientos múltiples y construir árboles filogenéticos básicos.

Actividades:

  • 🧬 Alineamiento de secuencias
    • Uso de MAFFT, Clustal Omega y Muscle
    • Comparación de resultados y calidad
  • ✂️ Recorte de alineamientos
    • Uso de trimal para limpiar alineamientos
    • Identificación de regiones conservadas
  • 🎨 Visualización de conservación con WebLogo
    • Generación de logos a partir de alineamientos recortados
    • Interpretación de regiones altamente conservada
  • 🌿 Construcción de árboles filogenéticos
    • Generación de árboles con fasttree
    • Discusión de conceptos filogenéticos básicos
  • 👁 Visualización de arboles
    • Alineamientos en Jalview
    • Árboles en FigTree

📕 Día 4

🧩 Módulo 4: Análisis de dominios y conservación de secuencias

🎯 Objetivo: Identificar dominios funcionales en secuencias y visualizar su conservación.

Actividades:

  • 🔍 Análisis de dominios con InterProScan
    • Envío de secuencias y descarga de resultados .tsv
    • Extracción de dominios Pfam
  • 🧠 Búsqueda de dominios con HMMER
    • Preparación de la base de datos Pfam-A
    • Ejecución de hmmscan, hmmfetch, hmmsearch

📕 Día 5

🧬 Módulo 5: Modelado proteico y análisis estructural

🎯 Objetivo: Predecir estructuras de proteínas con herramientas de inteligencia artificial, visualizarlas y compararlas estructuralmente.

Actividades:

  • 🧠 Introducción al modelado estructural
    • Tipos de estructura: primaria a cuaternaria
    • Principios del modelado con IA: AlphaFold, Boltz-1, entre otras
  • ⚙️ Predicción de estructuras
    • Entrada de secuencia FASTA
    • Interpretación de resultados: pLDDT, PAE
  • 🧩 Visualización y análisis en ChimeraX
    • Carga y exploración de archivos .pdb
    • Coloreado por confianza estructural
    • Identificación de regiones funcionales
  • 🔄 Alineamiento de modelos estructurales
    • Superposición de estructuras con ChimeraX
    • Evaluación visual de similitudes y diferencias

David Alberto García Estrada