Principios de Estadística. Feb-Jun 2009 (original) (raw)
LCG (English)
This course was taught at the Undergraduate Program on Genomic Sciences (LCG in Spanish) from the National Autonomous University of Mexico (UNAM in Spanish). It was directed at the second semester students from the sixth generation. It was a part of the Principles of Statistics topic and was meant as an introductory R course. It had an official length of 16 class hours. For more information on this undergraduate program visit LCG's main page. For example, the sections on Development of the Genomic Sciences in Mexico and LCG's International Evaluation could be of your interest.
LCG
Este curso fue impartido en la Licenciatura en Ciencias Genómicas (LCG) de la Universidad Nacional Autónoma de México (UNAM). Fue dirigido a los alumnos de segundo semestre de la sexta generación. Fue parte de la materia de Principios de Estadística y sirvió como un curso introductorio de R. Su duración oficial fue de 16 horas de clase. Para mayor información sobre la licenciatura visita la página principal de la LCG. Por ejemplo, las secciones de Desarrollo de las Ciencias Genómicas en México y de Evaluación internacional de la LCG pueden ser de tu interés.
inicio
Está página es el soporte para el curso de Principios de Estadística impartido por Julio Martínez a la 6ta generación de la LCG. Nosotros somos los ayudantes de dicho curso y tenemos varios objetivos. Uno de ellos es que aprendan a usar R a la par del curso de estadística, pues la gran mayoría de la gente utiliza algún paquete estadístico (Excel, MATLAB, Minitab, R, ...) en vez de hacer los cálculos a mano. Además, queremos que la página sea útil como referencia para dichos alumnos y otros de diversas generaciones. Aparte, queremos aprender más de estadística nosotros mismos y ayudar en la formación de la nueva generación.
Durante la duración del curso, tendremos aproximadamente 30 minutos por clase para dar una cápsula de estadística y R, que equivale a un cuarto del curso. Vamos a preparar ejemplos sencillos, unos de índole genómica y ejercicios para que reafirmen los conceptos que vean con Julio Martínez. Nosotros, María y Leonardo, aprendimos R con un curso impartido por James Bullard del laboratorio de Sandrine Dudoit y lo hemos utilizado en áreas diferentes: la diversidad genómica humana y la de bacteríofagos.
A lo largo del curso esperamos cubrir las presentaciones (conceptos básicos, ejemplos sencillos, unos complejos, ejercicios) de acuerdo al programa tentativo que pueden ver aquí. Además, esperamos que nos pregunten y hagan comentarios a través del foro del curso. De esta forma, si hay preguntas repetidas solo las respondemos una vez y respetan nuestro tiempo... pues también tenemos que trabajar :P Finalmente tenemos que evaluar el 25% de la materia, lo cual pensamos hacerlo a través de ejercicios.
Para los ejercicios, tendremos 2 tipos. Para el primero, que serán la mayoría, se los damos en una clase. Para la siguiente nos entregan sus respuestas vía la página de cursos y les damos las respuestas correctas vía un código documentado. Para estos ejercicios simplemente contaremos que los entreguen a tiempo y completos -- es muy fácil darse cuenta si se están copiando. Para el segundo tipo de ejercicio, los evaluaremos a detalle y estos serán ejercicios extensos. Haremos uno de estos cada mes. Los regulares valdrán 10% y los otros el 15%, lo cual nos da nuestro 25% de evaluación.
En sí, no nos preocupa la parte de la evaluación, pero queremos dejarla clara. Nuestro interés primordial es que aprendan y disfruten de la clase ^^.
presentaciones
En esta sección pueden encontrar una pequeña descripción de cada presentación. Además, pueden bajar las presentaciones en formato PDF y/o el código R.
Introducción a R [código]
En esta presentación vamos a conocer el lenguaje de programación R. Veremos un poco de su historia y aprenderemos lo básico para usar R. Algo muy importante que vamos a revisar es como obtener ayuda. Además, vamos a ver como movernos en los vectores.
Introducción a R - parte 2 [código]
En esta presentación vamos a continuar con la introducción a R básico. Vamos a ver las estructuras de control, como leer archivos y generar matrices. Además, conoceremos a los objetos tipo list y factor.
Letras y Universo [código]
Vamos a resolver un problema curioso de letras y universo o números y muestreo... como lo quieran ver ;). Aprenderemos a usar la función plot y utilizaremos los ciclos for.
Gráficas sobre RNAs [código]
Vamos a aprender a usar tres funciones gráficas: pie, barplot y mosaicplot. Usaremos datos de una artículo sobre RNAs del cual imitaremos gráficas. Además, haremos una mejor de las que publicaron ;)
Simulaciones sobre "letras y universo" [versión completa] [código]
Aprenderemos a muestrar usando sample, lo cual nos va a servir para hacer unas simulaciones. Graficaremos con plot los resultados.
Más sobre números al azar [código]
Entenderemos un poco más de como sacar números al azar y como comparar diferentes distribuciones visualmente usando boxplot.
Histogramas y similares [código]
Veremos como hacer histogramas, qqplots, qqnorms y otras gráficas para visualizar y comparar distribuciones.
Boxplots [código]
Son unas diapositivas de James Bullard sobre los boxplots.
Htest [código]
Bases del uso de las pruebas de hipótesis y los objetos de clase htest.
ANOVA [código]
Intro a ANOVAs sencillas usando oneway.test y aov. Incluye 3 problemas a resolver.
ANOVA.ppt
ANOVA.ppt -- presentación de María
pareadasYnoParametricas.ppt
pareadasYnoParametricas.ppt -- presentación de María
cuestionarios y ejercicios
Aquí encontrarán cuestionarios y ejercicios para poner a prueba sus conocimientos y habilidades de estadística y R ^^.
Ejercicio 1 [código]
Las preguntas en este archivo servirán para reafirmar conocimiento básicos vistos en la introducción.
Ejercicio 2 [código]
Vamos a terminar de redondear unos conceptos de la introducción. Además, haremos un ejercicio de combinaciones y otro de probabilidades condicionales.
Examen de Ji^2
Son las instrucciones para el examen de Ji Cuadrada.
respuestas
Aquí encontrarán las respuestas a los ejercicios en forma de códigos documentados. Si no entienden algo, por favor háganlo saber a través del foro. Gracias!
ej1_respuestas.R
Archivo con las respuestas al Ejercicio 1.
ej2_respuestas.R
Archivo con las respuestas al Ejercicio 2.
resultado.R
Archivo con la respuesta esperada al examen de Ji Cuadrada.
ejercicioPoissonSAGE_respuestas.R
Archivo con las respuestas a los problemas con SAGE.
datos
En esta sección puedes encontrar los archivos de datos que vamos a usar en el curso y en diversos ejercicios.
Contiene los tamaño del genoma de 10 fagos.
Es una tabla con información de los 10 fagos más grandes. Los nombres de las columnas (separadas por tabs) vienen especificados en la primera línea.
Es un archivo derivado de la tabla suplementaria 1 del artículo que usamos en la clase de rnas.pdf Está en formato csv y listo para ser usado con R.
Es un archivo derivado de la tabla suplementaria 2 del artículo que usamos en la clase de rnas.pdf Está en formato csv y listo para ser usado con R. Vean el original por las notas que le pusieron.
Es una tabla con datos de SAGE para un ejercicio. Parte 1.
Es una tabla con datos de SAGE para un ejercicio. Parte 2.
gorriones.txt
lobos.txt
oncillas.txt
polluelo.txt
garcetaRobaTuristas.txt
gorrionesPantaneros.txt
mapaches.txt
El formato de la página y de las presentaciones de la clase están basados en uno creado por y con permiso de James Bullard. Él impartió un curso de Bioconductor y R en Enero del 2008 en la LCG, lo pueden checar aquí.