Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”

cmoralesv

Chicos les paso mi resumen de esta sección:

· identify data anomalies (outliars)

Como usar funcionalidades que vienen en Power BI para detectar anomalías en tus datos.

2 Casos en los que pasan:

  1. Se eliminó el dato
  2. Fenómeno real en BI

Las gráficas nos ayudan mucho a poder visualizar las anomalías, es común usar gráficas de disperción o histogramas con tablas para poder encontrar anomalías.

· examine data structures

Examinar la estructura de nuestros datos

Dentro del Query Editor cada consulta tiene columnas que a su vez tienen un tipo de dato específico. Es importante colocar el tipo de dato correcto para cada columna.

Debemos tener cuidado de cambiar el tipo de dato entre dos columnas relacionadas entre dos consultas, si hacemos el cambio en una de las columnas afectará la relación.

Tenemos columnas que algunas de ellas con TABLAS (Se tiene una tabla anidada )y otras que son VALORES (Se tiene un listado, que es unicamente un registro)

· interrogate column properties

Column properties = Propiedades de las columnas

Es básicamente es conocer la información nos muestran las columnas y como la podemos utilizarla para conocer mejor nuestros datos.

Vamos a Transform Data >> en la ventana View podemos activar la calidad de las columnas que nos mostrará:

· la informacion valida

nos muestran las columnas y como la podemos utilizarla para conocer mejor nuestros datos.

Vamos a Transform Data >> en la ventana View podemos activar la calidad de las columnas que nos mostrará:

· la informacion valida

· los errores

· los valores vacios.

.

Si en View seleccionamos el COLUMN DISTRIBUTION nos dará una idea de la distribución de valores en cada uno de los valores.

Gracias a esta opcion del Power Query nos ayuda a concer mejor la distribución de nuestros datos.

Entre más valores unicos haya en nuetras columnas el tamaño de nuetro archivo será más y más grande debido al método de compresión de Power BI.

· interrogate data statistics

Como vizualizar las estadísticas que estan detrás de nuestros datos.

Vamos a Transform Data >> en la ventana View podemos activar COLUMN PROFILE y ahi veremos la estadítica de nuestros datos.

TENER EN CUENTA QUE EN LA PARTE INFERIOR SE MUESTRA QUE LA TABLA MUESTRA SOLO 1000 DATOS entonces se puede cambiar para mostrar más datos en “Column profiling based on entire data set”