ANÁLISIS DE DATOS
Segundo curso del grado de Biología (2011/12)
REQUISITOS PREVIOS
Conocer y comprender los contenidos de las asignaturas Matemáticas y
Bioestadística.
ORGANIZACIÓN DEL CURSO
Tres horas a la semana (aproximadamente) se dedicarán a las clases
habituales para explicar los conceptos y herramientas fundamentales de
la asignatura, así como para aplicar estos conceptos y herramientas a
numerosos ejercicios.
Una hora a la semana (aproximadamente) se dedicará a diversas
actividades (Seminario) que podrán incluir: tutorías en grupo o
talleres (donde los alumnos trabajarán resolviendo ejercicios bajo la
tutela del profesor), clases prácticas en aulas de informática,
realización de controles intermedios para la evaluación continua,
resolución adicional de ejercicios, etc.
PLANTEAMIENTO Y OBJETIVOS
El
propósito de esta asignatura es el aprender a proponer, analizar y
discutir modelos estadísticos, en particular, modelos de diseño de
experimentos y modelos de regresión. El objetivo principal es que el
estudiante desarrolle un espíritu crítico ante el análisis cuantitativo
de datos y sea capaz de proponer modelos estadísticos para explicar
distintos fenómenos relacionados con la Biología. Paralelamente, se
enseña la utilización de programas informáticos de estadística (SPSS,
Excel, Gnumeric, R).
PROGRAMA
Tema 1. Modelo de diseño de
experimentos de un factor.
Planteamiento del modelo. Metodología. Estimación de los parámetros del
modelo. Tabla ANOVA. Comparación de medias. Comparaciones múltiples:
correción de Bonferroni. Diagnosis de las hipótesis del modelo mediante
el análisis de residuos. Tratamiento informático de datos.
Tema 2. Modelos de diseño de
experimentos de varios factores.
Planteamiento del modelo con dos factores sin interacción. Metodología.
Estimación de parámetros. Tabla ANOVA. Comparación de medias.
Comparaciones múltiples, método de Bonferroni. Interacción:
planteamiento y análisis del
modelo con dos factores e interacción. Diagnosis del modelo mediante el
análisis de residuos. Extensión a un número mayor de factores.
Cuadrados latinos. Tratamiento informático de conjuntos de datos con
información sobre un número elevado de factores. Análisis mediante
SPSS, Excel, Gnumeric y/o R.
Tema 3. Modelo de regresión
simple.
Planteamiento del modelo de regresión lineal simple. Metodología.
Estimación de los parámetros. Tabla ANOVA. Evaluación del ajuste:
coeficiente de correlación y coeficiente de determinación. Estimación
de valores esperados y predicción de respuestas. Diagnosis de
las hipótesis del modelo por medio del análisis de los residuos.
Observaciones atípicas. Extensión a otros modelos de regresión simple:
modelos linealizables. Análisis mediante SPSS, Excel, Gnumeric
y/o R.
Tema 4. Modelo de regresión
múltiple.
Planteamiento y análisis del modelo de regresión lineal múltiple.
Interpretación de los parámetros. Estimación y contrastes sobre los
parámetros. Coeficiente de
determinación. Tabla ANOVA. Multicolinealidad. Incorporación al
modelo de una variable dicotómica. Extensión al modelo de regresión
logística. Interpretación de las salidas de SPSS. Predicción.
Análisis de los residuos.
BIBLIOGRAFÍA
- Milton, J. Susan; Estadística para la biología y las
ciencias de la salud; Interamericana-McGraw-Hill (2007).
- Moore, David S. & McCabe, George P.; Introduction
to the Practice of Statistics, third edition; Freeman (1999).
- Peña, D.; Regresión y Diseño de Experimentos;
Alianza Universidad (2002).
- Ross, Sheldon M.; Introducción a la
Estadística; Reverté (2007).
- Selvin, S.; Practical Biostatistics Methods;
Duxbury Press (1995).
- Townend, J. ; Practical Statistics for
Environmental and Biological Scientists; Wiley, (2002).
- Vicente, M. L., Girón, P., Nieto, C y Pérez, T.;
Diseño de experimentos (soluciones con SAS y SPSS);
Pearson-Prentice Hall (2005).
- Coakes, S. & Steed, L.; SPSS Analysis
without Anguish; Wiley (1997).
EVALUACIÓN DEL CURSO
La evaluación del curso se llevará
a
cabo de forma continuada combinando los siguientes dos tipos de
evaluación:
Controles intermedios:
Durante el
curso,
se efectuarán 2 controles (voluntarios, aunque muy recomendables).
Su objetivo fundamental es incentivar la preparación continua de la
asignatura. La puntuación de cada control será sobre 1 punto.
El primer control se efectuará al
finalizar el primer tema (alrededor de la 4ª semana).
El segundo control se efectuará al
finalizar el tercer tema (alrededor de la 11ª semana).
Evaluación final: Al final
del
curso, se efectuará una evaluación final (obligatoria). Su objetivo
fundamental es incentivar la comprensión global de la asignatura. La
puntuación de la evaluación final será sobre 10 puntos.
Calificación final: La
calificación final se obtendrá a partir de la puntuación de los
controles (C1 y C2) y de la puntuación de la evaluación final
(EF), siempre que se haya obtenido al menos un 4 en dicha evaluación
final:
Si EF<4: Calificación final=EF
Si EF≥4: Calificación
final=5+5·(C1+C2+EF−5) / 7
La idea de este sistema de
calificación
es incentivar tanto la preparación continua como la comprensión
global, pero permitiendo la recuperación al final del curso si los
resultados de los controles intermedios no son buenos.
Resultados del primer
control.
- Respuestas a las
cuestiones del Control 1.
- Respuestas a las cuestiones del Control 2.
- Calificaciones
de los controles. Ordenadas por número de NIA. Los
valores C1 y C2 de la fórmula que da la calificación final se
calculan dividiendo por 100 las calificaciones que aparecen en el
listado.
- Calificaciones finales
EJERCICIOS
Lista
de ejercicios
Instrucciones
para utilizar el módulo de Análisis de datos de Excel
Algunos ejercicios resueltos
Ejercicio 1-02
Ejercicio
1-04
Ejercicio 1-05 cuentas
Ejercicio 2-01
Ejercicio 2-04
Ejercicio 2-12
Ejercicio 3-01
Ejercicio 3-05
Ejercicio 3-10
Ejercicios de regresión logística
EXÁMENES
DE ASIGNATURAS CON PROGRAMA ANÁLOGO
Estadística
CC. AA. 2007-02
Estadística
CC. AA. 2007-09
Métodos
Estadísticos 2007-02
Métodos
Estadísticos 2007-09
Febrero
2008: examen y
soluciones
PRÁCTICAS
Práctica 1
Práctica 2
Práctica 3
Práctica 4
FORMULARIOS
Formulario de Bioestadística
Formulario de Análisis de Datos.
GRUPO 122
Aula: 02.PP.AU.S06;
horario:
LM 11:30-12:30, X 11:30-13:30;
Profesor: Patricio Cifuentes; Edif. Ciencias, módulo 17, despacho 404.
Horas de consulta:
LMXJ 15:30-16:30; tel.: 91-497-5002.
<patricio.cifuentes(arroba)uam.es>
<http://www.uam.es/patricio.cifuentes>
ENLACES DE INTERÉS
Página
web del coordinador de la asignatura
The R Project for Statistical
Computing
Portal de la
Estadística (statsci.org)
|