Reproducibilidad y referencias

Conceptos de comunicación de datos

Hadrien Lacroix

Curriculum Manager

Informe escrito

 

Un informe debe ser claro y reproducible.

Conceptos de comunicación de datos

Ejemplo de reproducibilidad

 

  • Hornear un pastel

    • Receta
    • Ingredientes crudos
    • Nuestro horno y utensilios de medición
    • Pastel con sabor similar
  • Proyecto de datos

    • Ejecutar el análisis otra vez: mismos resultados

 

icono de receta de cocina

Conceptos de comunicación de datos

Ejemplo de replicabilidad

  • Hornear un pastel
    • Utensilios propios
    • Ingredientes propios
  • Proyecto de datos
    • Entorno diferente
Conceptos de comunicación de datos

Virtudes de la reproducibilidad y replicabilidad

 

  • Evita duplicar esfuerzos
  • Construye sobre trabajo previo
  • Enfócate en nuevos retos
  • Revisión por pares
  • Agnóstico a herramientas
Conceptos de comunicación de datos

Buenas prácticas

  1. Registra cómo se obtuvieron los resultados
    • Scripts bien documentados
      • Comentarios en el código
    • Lista de paquetes y entorno usados
    • Control de versiones
Conceptos de comunicación de datos

Buenas prácticas

  1. Registra cómo se obtuvieron los resultados
  2. Evita la manipulación manual de datos
    • Versionado de datos
    • Guarda datos brutos y pasos intermedios
    • Adapta y resuelve problemas
    • Ejemplo: imputación de datos
      • imputar faltantes con la media
      • guardar y cerrar el editor
      • ¿cómo saber qué valores se reemplazaron al inicio?
Conceptos de comunicación de datos

Buenas prácticas

  1. Registra cómo se obtuvieron los resultados
  2. Evita la manipulación manual de datos
  3. Controla la aleatoriedad
    • Semillas aleatorias para pipelines de ML
    • Controla variables de confusión
Conceptos de comunicación de datos

Buenas prácticas

  1. Registra cómo se obtuvieron los resultados
  2. Evita la manipulación manual de datos
  3. Documenta la aleatoriedad
  4. Interpretabilidad
    • Entiende la causa de una decisión o predice resultados del modelo
    • Historia con narrativa convincente
    • Vínculo con la reproducibilidad
1 Molnar C. Interpretable Machine Learning. 2019.
Conceptos de comunicación de datos

Buenas prácticas

  1. Registra cómo se obtuvieron los resultados
  2. Evita la manipulación manual de datos
  3. Documenta la aleatoriedad
  4. Interpretabilidad
  5. Cita la bibliografía correctamente
Conceptos de comunicación de datos

Referencias

 

  • Una cita es la información básica para identificar y localizar una publicación específica
Conceptos de comunicación de datos

Referencias

 

  • Estilos distintos, misma lógica
    • Libro: Nombre del autor (Año). Título. Editorial.
    • Artículo de revista: Nombre del autor. (Año) 'Título del artículo.' Título de la revista, Volumen, Número, Páginas.
    • Sitio web: Nombre del autor. Fecha de publicación, 'Título de la página/obra.' Título del sitio, Ubicación

 

  • Estilo APA:
    • Citas en el texto (autor, fecha)
Conceptos de comunicación de datos

Referencia

  • Gestores de referencias
    • Más fácil de llevar control
    • Cambiar entre estilos
    • Buscar referencias online
    • Opciones:
      • EndNote
      • Mendeley
      • RefWorks
Conceptos de comunicación de datos

Referencias

  • Contexto empresarial
    • Menos estricto
    • Más simple (hipervínculo)
    • ==> información disponible y recuperable
Conceptos de comunicación de datos

¡Vamos a practicar!

Conceptos de comunicación de datos

Preparing Video For Download...