ANÁLISIS DE DATOS

Segundo curso del grado de Biología (2011/12)

REQUISITOS PREVIOS
Conocer y comprender los contenidos de las asignaturas Matemáticas y Bioestadística.

ORGANIZACIÓN DEL CURSO
Tres horas a la semana (aproximadamente) se dedicarán a las clases habituales para explicar los conceptos y herramientas fundamentales de la asignatura, así como para aplicar estos conceptos y herramientas a numerosos ejercicios.

Una hora a la semana (aproximadamente) se dedicará a diversas actividades (Seminario) que podrán incluir: tutorías en grupo o talleres (donde los alumnos trabajarán resolviendo ejercicios bajo la tutela del profesor), clases prácticas en aulas de informática, realización de controles intermedios para la evaluación continua, resolución adicional de ejercicios, etc.
PLANTEAMIENTO Y OBJETIVOS
El propósito de esta asignatura es el aprender a proponer, analizar y discutir modelos estadísticos, en particular, modelos de diseño de experimentos y modelos de regresión. El objetivo principal es que el estudiante desarrolle un espíritu crítico ante el análisis cuantitativo de datos y sea capaz de proponer modelos estadísticos para explicar distintos fenómenos relacionados con la Biología. Paralelamente, se enseña la utilización de programas informáticos de estadística (SPSS, Excel, Gnumeric, R). 
PROGRAMA
Tema 1. Modelo de diseño de experimentos de un factor. Planteamiento del modelo. Metodología. Estimación de los parámetros del modelo. Tabla ANOVA. Comparación de medias. Comparaciones múltiples: correción de Bonferroni. Diagnosis de las hipótesis del modelo mediante el análisis de residuos. Tratamiento informático de datos.

Tema 2. Modelos de diseño de experimentos de varios factores. Planteamiento del modelo con dos factores sin interacción. Metodología. Estimación de parámetros. Tabla ANOVA. Comparación de medias. Comparaciones múltiples, método de Bonferroni. Interacción: planteamiento y análisis del modelo con dos factores e interacción. Diagnosis del modelo mediante el análisis de residuos. Extensión a un número mayor de factores. Cuadrados latinos. Tratamiento informático de conjuntos de datos con información sobre un número elevado de factores. Análisis mediante SPSS, Excel, Gnumeric y/o R.

Tema 3. Modelo de regresión simple. Planteamiento del modelo de regresión lineal simple. Metodología. Estimación de los parámetros. Tabla ANOVA. Evaluación del ajuste: coeficiente de correlación y coeficiente de determinación. Estimación de valores esperados y predicción de respuestas. Diagnosis de las hipótesis del modelo por medio del análisis de los residuos. Observaciones atípicas. Extensión a otros modelos de regresión simple: modelos linealizables.  Análisis mediante SPSS, Excel, Gnumeric y/o R.

Tema 4. Modelo de regresión múltiple. Planteamiento y análisis del modelo de regresión lineal múltiple. Interpretación de los parámetros. Estimación y contrastes sobre los parámetros. Coeficiente de determinación. Tabla ANOVA. Multicolinealidad.  Incorporación al modelo de una variable dicotómica. Extensión al modelo de regresión logística. Interpretación de las salidas de SPSS. Predicción. Análisis de los residuos.
BIBLIOGRAFÍA
  • Milton, J. Susan; Estadística para la biología y las ciencias de la salud; Interamericana-McGraw-Hill (2007).
  • Moore, David S. & McCabe, George P.Introduction to the Practice of Statistics, third edition; Freeman (1999).
  • Peña, D.; Regresión y Diseño de Experimentos; Alianza Universidad (2002).
  • Ross, Sheldon M.Introducción a la Estadística; Reverté (2007).
  • Selvin, S.Practical Biostatistics Methods; Duxbury Press (1995).
  • Townend, J. ; Practical Statistics for Environmental and Biological Scientists; Wiley, (2002).
  • Vicente, M. L., Girón, P., Nieto, C y Pérez, T.Diseño de experimentos (soluciones con SAS y SPSS); Pearson-Prentice Hall (2005).
  • Coakes, S. & Steed, L.; SPSS Analysis without Anguish; Wiley (1997).
EVALUACIÓN DEL CURSO

La evaluación del curso se llevará a cabo de forma continuada combinando los siguientes dos tipos de evaluación:

Controles intermedios: Durante el curso, se efectuarán 2 controles (voluntarios, aunque muy recomendables). Su objetivo fundamental es incentivar la preparación continua de la asignatura. La puntuación de cada control será sobre 1 punto.

El primer control se efectuará al finalizar el primer tema (alrededor de la 4ª semana).

El segundo control se efectuará al finalizar el tercer tema (alrededor de la 11ª semana).

Evaluación final: Al final del curso, se efectuará una evaluación final (obligatoria). Su objetivo fundamental es incentivar la comprensión global de la asignatura. La puntuación de la evaluación final será sobre 10 puntos.

Calificación final: La calificación final se obtendrá a partir de la puntuación de los controles (C1 y C2) y de la puntuación de la evaluación final (EF), siempre que se haya obtenido al menos un 4 en dicha evaluación final:

Si EF<4: Calificación final=EF
Si EF≥4: Calificación final=5+5·(C1+C2+EF−5) / 7

La idea de este sistema de calificación es incentivar tanto la preparación continua como la comprensión global, pero permitiendo la recuperación al final del curso si los resultados de los controles intermedios no son buenos.

Resultados del primer control.
  • Respuestas a las cuestiones del Control 1.
  • Respuestas a las cuestiones del Control 2.
  • Calificaciones de los controles.  Ordenadas por número de NIA.  Los  valores C1 y C2 de la fórmula  que da la calificación final se calculan dividiendo por 100 las calificaciones que aparecen en el listado.
  • Calificaciones finales
EJERCICIOS
Lista de ejercicios
Instrucciones para utilizar el módulo de Análisis de datos de Excel
Algunos ejercicios resueltos
Ejercicio 1-02
Ejercicio 1-04
Ejercicio 1-05 cuentas

Ejercicio 2-01
Ejercicio 2-04
Ejercicio 2-12

Ejercicio 3-01
Ejercicio 3-05
Ejercicio 3-10

Ejercicios de regresión logística
EXÁMENES DE ASIGNATURAS CON PROGRAMA ANÁLOGO
Estadística CC. AA. 2007-02
Estadística CC. AA. 2007-09
Métodos Estadísticos 2007-02
Métodos Estadísticos 2007-09

Febrero 2008: examen y soluciones
PRÁCTICAS
Práctica 1
Práctica 2
Práctica 3
Práctica 4
FORMULARIOS
Formulario de Bioestadística
Formulario de Análisis de Datos.
GRUPO 122
Aula: 02.PP.AU.S06; horario: LM 11:30-12:30, X 11:30-13:30;
Profesor: Patricio Cifuentes; Edif. Ciencias, módulo 17, despacho 404.
Horas de consulta: LMXJ 15:30-16:30; tel.: 91-497-5002.
<patricio.cifuentes(arroba)uam.es>  
<http://www.uam.es/patricio.cifuentes>
ENLACES DE INTERÉS
Página web del coordinador de la asignatura
The R Project for Statistical Computing
Portal de la Estadística (statsci.org)