Foros › Power BI en general › Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”
Que tal a todos,
¿Qué aprendiste en la sección “Profile the data”?
Como muchos saben, han vivido y hemos aprendido (a veces a la mala), una tarea que se va dejando de lado o que no se le da la importancia necesaria es al análisis exploratorio de los datos, como vimos en esta sección existen distintas maneras para hacer una validación de los datos, como se comenta el escenario perfecto sería no tener que preocuparnos por este tema y pasar directo a analizar el tema en cuestión, sin embargo, sabemos que en la vida real esto no es así y muchas fuentes de información necesitan de una depuración y/o transformación antes de empezar a analizar, por lo cual, conocer como esta conformado tu conjunto de datos es fundamental, ¿Qué columnas hay? ¿Qué tipo de datos existen? ¿Hay valores nulos? ¿Tenemos variables categóricas, numéricas, ambas? ¿Debemos de conocer datos estadísticos de alguna variable? ¿Nos aporta valor? Por poner algunos ejemplos y que como mencionó un compañero parafraseando un poco, mejor tratarlos al inicio que darnos de topes cuando el modelo no se ejecute de la manera esperada.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Como mencione en mi respuesta anterior un EDA (Análisis Exploratorio de Datos / Exploratory Data Analysis) es un paso que no debemos saltarnos ya que esta fase nos va a ayudar a entender el comportamiento de los datos, y no solo eso sino en el proceso de obtención de datos identificar si es adecuado o necesita de un ajuste (si es que esta en nuestro poder hacer algo al respecto). Así como ver si existen relaciones entre variables, determinar si consideramos valores outliers, manejo de nulos , etc.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Al entender y saber como utilizar las herramientas con las que cuenta POWER BI, nos ayuda a realizar tareas con una menor complejidad y optimizar el tiempo al máximo.