🇪🇸 Este post está escrito en inglés y español. Puedes encontrar el texto en español más abajo.
🇺🇸 Welcome to the Workflow series!
I wrote this series to help you design a clean workflow, so that you are more effective at communicating findings to your team, clients, or audience. The ultimate goal is to help you help them make better decisions.
Designing a clean workflow goes beyond learning specific lines of code to create plots or analyze data in R
. Much of this series is focused on the context around the code you write. Communicating findings to your colleagues or other audiences is not easy. A well-crafted story requires a balance between writing and data, that you know your audience, and that you are able to translate technical terms and findings into simple language.
In my experience, most researchers and data scientists struggle developing these skills because of their training. We learn statistics, research, communication, and data science skills in isolation, so then we struggle integrating these skills. This results in workflows where:
Data are cleaned once and quickly, with the hopes to get to data analysis as soon as possible. Rarely do people think about data cleaning as a process that needs to be reproducible, scalable, and integrated into the analysis process.
What will you learn?
By the end of the series, you will learn how to:
Plan your workflow based on the decisions that need to be made down the road
Design a clean workflow (organization of files, folders, and code)
Organize your code into modules
Create R Markdown and Quarto documents to help your audience understand your insights
Be on the lookout for the first post in the series: The First Step in Designing a Clean Workflow.
🇪🇸 ¡Bienvenido(a) a la serie de Workflow!
Escribí esta serie para ayudarte a diseñar un flujo de trabajo limpio, de manera que seas más efectivo al comunicar tus hallazgos a tu equipo, clientes o audiencia. El objetivo final es ayudarte a ayudarles a tomar mejores decisiones.
Diseñar un flujo de trabajo limpio va más allá de aprender líneas de código específicas para crear gráficos o analizar datos en R
. Gran parte de esta serie se enfoca en el contexto alrededor del código que escribes. Comunicar hallazgos a tus colegas u otros públicos no es fácil. Una historia bien elaborada requiere un equilibrio entre la escritura y los datos, que conozcas a tu audiencia y que puedas traducir términos técnicos y hallazgos en un lenguaje sencillo.
En mi experiencia, la mayoría de los(as) investigadores(as) y científicos(as) de datos tienen dificultades para desarrollar estas habilidades debido a su formación. Aprendemos estadísticas, investigación, comunicación y habilidades de ciencia de datos de forma aislada, por lo que luego nos resulta difícil integrar estas habilidades. Esto da lugar a flujos de trabajo en los que:
Los datos se limpian una vez y rápidamente, con la esperanza de llegar al análisis de datos lo más rápido posible. Rara vez las personas piensan en la limpieza de datos como un proceso que debe ser reproducible, escalable e integrado en el proceso de análisis.
¿Qué aprenderás?
Al final de la serie, aprenderás cómo:
Planificar tu flujo de trabajo en función de las decisiones que se deben tomar en el futuro.
Diseñar un flujo de trabajo limpio (organización de archivos, carpetas y código).
Organizar tu código en módulos.
Crear documentos R Markdown y Quarto para ayudar a tu audiencia a entender tus ideas.
Estén atentos al primer artículo de la serie: The First Step in Designing a Clean Workflow.