Importando datos desde hojas de cálculo
En este año donde muchas cosas no se dieron como se planearon inicialmente, la edición del congreso LatinR fue virtual. Gracias a esto, distintos grupos de usaries de R de Latinoamerica pudieron unirse para hostear los variados talleres ofrecidos. Es así que tuvimos el lujo de participar, junto a RLadies Puebla, RLadies Xalapa y RLadies Barranquilla, como anfitriones del taller “Importando datos desde hojas de cálculo”, dictado por el Dr. Luis Verde Arregoitia. El material está disponible acá.
A menudo se comparten hojas de cálculo con información poco estructurada, o codificada como formato del texto y/o de las celdas que no se trasladan directamente a un objeto de R (ej. celdas de colores para denotar categorías). Ésto resulta en pérdida de información potencialmente relevante, o bien, pérdida de tiempo al tener que interpretar y limpiar manualmente los valores de las celdas. En este taller se enseñará a importar y manejar este tipo de datos a R. Además, se demostrará la lectura y escritura de archivos .xls y .xlsx (paquetes readxl y writexl), el manejo de archivos con múltiples pestañas (paquete purrr), celdas con formato (paquetes tidyxl y unheadr), y la nueva funcionalidad del paquete googlesheets4 que permite leer y escribir en hojas de cálculo en línea, facilitando la colaboración de manera reproducible. Al final del taller, los asistentes serán capaces de compatibilizar el uso de R con las hojas de cálculo en sus flujos de trabajo y colaboraciones.
Luis es biólogo, especialista en mamíferos y autor de los paquetes unheadr y annotater, que se utilizan para manejar datos desordenados y añadir información sobre librerías externas a código existente. Está interesado en la resolución de problemas usando R, en áreas como análisis espacial, deportes, biología evolutiva y videojuegos.