Pablo's research and teaching areas Anaga mountains in Tenerife, Canary Islands

Página informativa sobre el curso de Introducción a la Bioinformática

Presentación
Con el fin de racionalizar y eficientizar el uso de recursos humanos e instalaciones en el Campus Morelos de la UNAM, hemos organizado este curso de doctorado de manera conjunta para los Programas de Doctorado en Ciencias Bioquímicas (PDCBioq) y Biomédicas (PDCBiomed) de la Universidad Nacional Autónoma de México. Puedes descargar desde aquí la convocatoria oficial del tópico. Este curso se imparte de manera regular cada semestre par, en alternancia con nuestro curso complementario de Introducción a la Programación en Perl para Bioinformática.
Objetivos
Lograr que el alumno conozca los fundamentos básicos de las metodologías más comunes utilizadas en el área de bioinformática y tenga la capacidad de usar eficiente y adecuadamente las herramientas computacionales disponibles públicamente en la red, así como algunas desde instalaciones locales del software.
Fechas, horario y lugar de celebración del curso
El curso se impartirá del 14 de Agosto al 27 de Noviembre de 2015, cada viernes, de 10:00-13:00 hrs en el auditorio del Centro de Ciencias Genómicas de la UNAM ver mapa.
Sitio web del curso
Una versión actualizada y mucho más extensa y avanzada de esta introducción al biocómputo en sistemas Linux está disponible en este sitio GitHub.
Se abrirá una cuenta en un sitio moodle para los alumnos de doctorado formalmente registrados en el curso a través de sus respectivas entidades. Desde este sitio podrán acceder a todo el material didáctico del curso.

Programa final

Tema 1.- Introducción al sistema operativo Linux/UNIX (Pablo Vinuesa CCG) 14 Ago
 1.1 Principios básicos del shell
 1.2 Archivos y directorios
 1.3 Navegar los directorios
 1.4 Permisos
 1.5 Mover y renombrar
 1.6 Copiar y borrar
 1.8 Ligas simbólicas
 1.9 Despliegue de procesos
 1.10 Comandos para visualizar y manipular el contenido de un archivo

Tema 2.- Introducción a las bases de datos (Enrique Merino Pérez  IBT-UNAM) 21 Ago
 2.1. Secuencias de nucleótidos: EMBL y Gene Bank   
 2.2. Secuencias de aminoácidos: SWISSPROT 
 2.3. Estructuras de proteínas y su clasificación: PDB, CATH, SCOP 

Tema 3. Alineamientos pareados y BLAST (Esteban Peguero Sánchez  IBT-UNAM) 28 Ago 
 3.1. Las matrices de calificación: BLOSUM, PAM, y matrices basadas en   clasificaciones de aminoácidos.
 3.2 Alineamiento en pares: Smith-waterman, Needleman-Wunsch.
 3.3. Programación dinámica y criterios de penalización.
 3.4. Búsqueda por similitud usando FASTA.


Tema 4. Alineamientos múltiples (Pablo Vinuesa, CCG-UNAM) 4 Sep
 4.1. Alineamiento multiples progresivos
 4.2     Practicas con clustalw, clustalo y muscle


Tema 5.- Filogenia Molecular (Pablo Vinuesa  CCG-UNAM) 2 y 9 Oct
 5.1. Conceptos básicos de evolución molecular. Estima de distancias evolutivas, modelos de  sustitución empíricos y paramétricos. Reconstrucción de filogenias usando matrices de distancias 
 5.2. Inferencia filogenética usando el criterio de máxima verosimilitud

Tema 6.- Búsqueda de Motivos  de proteínas y motivos de regulación (Enrique Merino Pérez  IBT-UNAM) 11, 18 y 25 de Sep
 6.1. Motivos: descripción y construcción: Matrices de Peso
 6.2. Búsqueda de motivos mediante de Modelos de Markov Escondidos
 6.3. Bases de datos y Herramientas: Programas de predicción: Motivos, Prosite, MEME, Wconsensus, DyadDetector, PFAM, BLOCKS, PROSITE, 
 6.4. Usos d e los motivos. Predicción de función y búsqueda de homólogos remotos


Tema 7. Introducción a la secuenciación masiva (Karel Estrada IBT-UNAM) 16 y 23 Oct
 7.1. Introducción a las metodologias de Secuenciación Masiva (Illumina, Ion torrent, etc.)
 7.2. Formatos estándares para el manejo de secuencias
 7.3. Teoría del ensamblado de reads (cobertura, sobrelape, consenso)
 7.4. Resumen de estrategias de alineamiento de secuencias cortas
 7.5. Características de RNA-seq
 7.6. Metodologías de ensambles de transcritos. (ejemplo de ensamble de Novo)

Tema 8. Análisis de expresión diferencial en RNA-seq (Esteban Peguero Sánchez IBT-UNAM) 30 Oct y 6 Nov
 8.1 Introducción a R 
 8.2 Introducción al análisis de expresión diferencial y edgeR.
 8.3 Mapeo de lecturas
 8.4 Matriz de conteo
 8.5 Normalización
 8.6 Detección de genes expresados diferencialmente
 8.7 Análisis de enriquecimiento GO

Tema 9. Estructura de Proteínas y Función (Enrique Merino Pérez  IBT-UNAM) 13 y 20 Nov
 9.1. Identificación de dominios en proteínas: Superfamily, PFAM
 9.2. Predicción de estructura secundaria: nnPredict, Predator, PHD, Psipred.
 9.3. Programas para la visualización de estructuras de proteínas
     

Preguntas frecuentes

¿Tengo que formalizar mi inscripción al curso, y cómo lo hago?
Sí, deberán de formalizar el registro del curso como la actividad académica del semestre en sus respectivas entidades de posgrado. Deberán traer constancia de registro de la actividad para que se les abra cuenta en el servidor, dar acceso al material didáctico y finalmente evaluar su actividad al final del semestre.
¿Habrá disponibilidad de videoconferencia?
NO. Experiencias anteriores han mostrado que los alumnos que tratan de tomar el curso por videoconferencia no pueden aprovecharlo adecuadamente, quedando rezagados.
¿Necesito saber UNIX/Linux?
Es recomendable tener alguna experiencia previa de trabajo con el Shell de UNIX/Linux. En cualquier caso les recomendamos mucho estudiar este tutorial de introducción al biocómputo y consultar alguno de los tutoriales listados en las pestañas de la cabecera de la página, acorde a sus conocimientos previos. Para los que empiezan, remomendamos este tutorial de introducción a UNIX/Linux. En la primera sesión se dará una introducción a los aspectos básicos de manejo del sistema.
¿Necesito conocimientos previos de Perl, Python, R u otros lenguajes de programación?
No, se trata de un curso introductorio, pero para trabajar eficientemente en bioinformática será necesario, a la postre, poder programar al menos en algún lenguaje de scripting como Perl, Python o R. Les recomendamos leer tutorales de introducción a Perl. También existen libros de Perl libremente disponibles en la web Además ofrecemos un curso complementario y alternado sobre introducción a la programación en Perl y se dará una introducción a R y al proyecto Bioconductor escrito en R para el análisis de datos de RNA-Seq. Les sugerimos mucho estudien alguno de los diversos tutoriales que podrán encontrar en la web. Les sugerimos vean Turoriales de R en CRAN.
¿Necesito llevar mi computadora?
Sí, es necesario traer tu laptop con tarjeta de red inalábrica. Si es una máquina Windows, deberán instalar PuTTY y WinSCP para poderse loguear al servidor usando el protocolo ssh (secure shell) y transferir datos entre sus máquinas y el servidor usando scp ("secure copy"). Les recomendamos leer este turorial de SSH para Windows, en el que se explica muy bien el uso e instalación de PuTTY y WinSCP.
Mi compu corre Windows. ¿Debo instalar Linux?
No, aunque sería muy recomendable hacerlo si tienes una máquina Windows (recomendamos Ubuntu. Tiene incluso un instalador para Windows que hace trivial la instalación o desinstalación de Ubuntu de máquinas Windows. Ubuntu se instala en otra partición, dejando intacto tu Windows, como se explica en la liga anterior). El trabajo en biocómputo se hace esencialmente en el ambiente UNIX/Linux, como se describe en este artículo de PLoS Computational Biology titulado A Quick Guide for Developing Effective Bioinformatics Programming Skills.
Pues yo tengo una MAC, ¿Debo instalar Linux?
No! Tal vez no lo sepas, pero el sistema operativo MAC OS X es Unix, derivado de BSD! Solo tienes que abrir la terminal y tendrás acceso directo a todas las utilerías de Unix, incluyendo Perl.
Ups, no encuentro la terminal en mi MAC, ¿dónde está?
1. en Finder, del menú Go, busca Utilities -> Terminal. 2. Si no lo encuentras, tienes que instalar el paquete de "Developer Tools", que encontrarás en /Applications/Installers/Developer Tools/Developer.mpkg. Pueden ver este tutoral en YouTube
2. O mira este otro introducción a la línea de comandos en MacOSX
¿Qué más recomiendan ir estudiando para llegar bien preparados al curso?
Sin duda algo esencial es saber usar bien un editor de texto potente para programar. El editor por excelencia en el ambiente Linux/UNIX es vim. Pueden ver un breve tutorial aquí o un tutorial ineractivo. Otra opción conveniente es el editor gráfico nedit.
¿Dónde está ubicado el CCG?
Puedes consultar este mapa de baja resolución, o busca "Center for Genomic Sciences UNAM" en GoogleMaps

Anuncios

14 de Agosto de 2015: se aplaza la sesión no. 1 al viernes 21 (11:23 am)
Debido a un derrame de gasolina ocurrido en la tarde-noche del 13 de Agosto de un ducto de Pemex que corre en las inmediaciones del Campus Morelos, tuvieron que suspenderse clases en el campus. La sesión no. 1 se aplaza por tanto al siguiente viernes, a la hora regular (10:00-13:00 hrs). Sentimos mucho el inconveniente. Por favor, los que no estén familiarizados con el sistema operativo Linux, revisen este tutoral También revisen la lista de preguntas frequentes listada arriba, instalen Ubuntu (o al menos PuTTY y WinSCP para poderse loguear al servidor usando el protocolo ssh) en sus computadoras y revisen alguno de los tutoriales de vim arriba enlistados.
29 de Julio 2015: Saturación del curso
Sentimos mucho informarles que ya no podemos aceptar más solicitudes. Les recordamos que este curso se impartirá cada segundo semestre (semestre par), en alternancia con nuestro curso complementario de Introducción a la Programación en Perl para Bioinformática, el cual ofrecemos los semestres impares.
29 de Julio de Enero 2015: publicación del programa final (04:51)
Algunos paquetes de software para descargar
clustal omega. multiplataforma
clustalw2 y clustalx. multiplataforma
muscle. multiplataforma
DAMBE. Windows
MEGA6. Windows, MacOSX BioEdit. Windows
SeaView. Multiplataforma
phyml3.1 binaries. Multiplataforma
jmodeltest2. Multiplataforma
prottest3. Multiplataforma