Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”

bernabe

¿Qué aprendiste en la sección “Profile the data”?

Aprendí a analizar la estructura de las tablas de datos de una base de datos sql server. Vimos una matriz desde donde se puede inferir las relaciones que existen en las tablas mediante el nombre y el tipo de datos.

Aprendí a analizar el perfil de los datos. Esto puede lograrse mediante una gráfica de dispersión que muestre los valores distantes o fuera de rango normal y los valores atípicos.

También otra fuente de análisis son las opciones del view en el query editor. En esta opción existen tres opciones de analisis.

Una permite ver la distribución de los datos donde nos muestra los valores únicos y distintos. “Column distribution”

Otra opción es el “Column quality” que nos muestra la cantidad de datos con errores, cantidad de celdas vacías y la cantidad de celdas válidas.

La tercera es la opción de “Column profile”. Aquí podemos ver las estadísticas de los datos. El valor máximo, el mínimo, los ceros, el promedio, la desviación estándar, ect.

Estos análisis vienen por defecto para los primeros 1000 registros, pero se puede ampliar a todo el dataset.

¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

Para mi es de suma importancia este análisis de los datos. Trabajo mucho con Excel y con fuentes basadas en reportes de varios sistemas. Ahora tengo mas claro las herramientas para estudiar y resolver los errores en los datos de mis fuentes.

¿ Cómo te servirá esto que aprendiste al presentar el examen de certificación?

Podría responder con mas propiedad a las preguntas relacionadas al perfil de los datos “ DATA PROFILE”.