Datos para las clases

Páginas útiles para encontrar datos

Ácidos grasos en aceitunas de Italia

  • Descripción: Porcentaje de ocho ácidos grasos en la fracción lipídica de aceitunas procedentes de tres regiones: norte de Italia, Cerdeña y sur de Italia. Son 572 observaciones de 10 variables: la zona de Italia, el área y los ocho porcentajes correspondientes a los correspondientes ácidos grasos.
  • Datos: aceitunas.RData (R) | aceitunas.omv (jamovi)
  • Usos: Análisis exploratorio, regresión (con atípicos), ANOVA, clasificación, datos composicionales.
  • Fuente: Los datos están incluidos en el paquete dslabs (Data Science Labs) de R, que es una coleccion de conjuntos de datos y funciones que se pueden utilizar para prácticas en ciencia de datos y estadística. Los autores son Rafael A. Irizarry y Amy Gill. En la página web del curso Data Science for Statisticians se puede encontrar bastante material interesante para la docencia.

Concentración de colesterol y triglicéridos

  • Descripción: Concentración de colesterol y triglicéridos (mg/dl) en pacientes evaluados por tener un dolor en el pecho. De ellos, 51 no presentaron evidencia de enfermedad cardiaca mientras que 320 sí la presentaron.
  • Datos: lipidos.RData (R) | lipidos.osv (jamovi)
  • Usos: Análisis exploratorio, clasificación, regresión.
  • Fuente: Scott, D.W. (2015). Multivariate density estimation: theory, practice, and visualization. John Wiley & Sons. Los datos se pueden encontrar en la página 305 y proceden de un estudio y análisis descrito en Scott et al. (1978).

Dolor de garganta tras cirugía

  • Descripción: Datos correspondientes a 35 pacientes que han sido sometidos a cirugía: la variable D corresponde a la duración en minutos de la cirugía; la variable T corresponde al medio para garantizar la respiración (T=0 máscara laríngea, T=1 tubo traqueal) y la variable D corresponde a si el paciente experimentó dolor de garganta al despertar (D=0 no, D=1 sí).
  • Datos: garganta.csv | garganta.omv
  • Usos: análisis de tablas de contingencia, regresión logística.
  • Fuente Los datos se encuentran en la página 132 de Agresti (2002). An introduction to categorical data analysis. Wiley. Pueden obtenerse en este enlace, junto con otros conjuntos de datos del mismo libro.

Tasa de eliminación de alcohol

  • Descripción Tasa de eliminación de alcohol en la respiración (mg/l por hora) y en la sangre (g/l por hora) en 32 hombres y 27 mujeres. Las variables son sexo (1, hombre; 2, mujer), respiraAC (tasa de eliminación de alcohol en la respiración en mg/l por hora) y sangreAC (tasa de eliminación de alcohol en la sangre en g/l por hora).
  • Datos: alc_elim.csv
  • Usos: Regresión lineal simple o mútiple (con una de las variables regresoras dicotómica si separamos por sexo).
  • Fuente Los datos se pueden encontrar en esta página web. Analizados en este artículo.

Tratamiento con talidomida

  • Descripción: 32 pacientes seropositivos, algunos de ellos con tuberculosis, que habían perdido más del 10% de su peso en los últimos seis meses participaron en un estudio sobre el efecto de un tratamiento con talidomida en la ganancia de peso. El fichero contiene tres variables: talidomida (1, reciben tratamiento con talidomida; 0, reciben placebo), tb (1, tienen tuberculosis; 0, no la tienen) y peso (ganancia de peso en kg tras 21 días de tratamiento).
  • Datos: talidomida.csv
  • Usos: ANOVA con dos factores.
  • Fuente: Los datos se pueden encontrar en esta página web. Proceden de un estudio publicado en este artículo.