Aprendizajes de la sección “Clean, Transform, and Load the data” del módulo “Prepare the data”

bernabe
  • ¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?

Recorrimos diez temas que nos enseñan a limpiar , transformar y cargar correctamente nuestros datos al powerbi desktop.

1. "unexpected values, null values, data quality issues"

  • En este tema aprendí a resolver las inconsistencias en los datos:
  • Corregir errores ( Reemplazándolos, borrándolos o preferiblemente analizándolos para corregirlos ).
  • Corregir datos nulos ( reemplazándolos o borrándolos ).
    2. Aplicar “values replacements” agradables al usuario
  • Se trata de reemplazar valores de filas para hacer los datos mas comprensibles.
    3. Identificar y crear “Keys” adecuadas para “joins”
  • Aprendí a definier las “Keys”: que son campos que nos permiten relacionar una tabla con otras.
  • Aprendimos a crear nuevas columnas de “Keys” adecuadas, en caso de que no existan, para poder relacionar tablas.
  • Vimos como podemos hacer varios tipos de “joins” , que significa combinar tablas.
    4. "Combine queries"
  • Conocimos las dos maneras de combinar consultas: “Append Queries” y “Merge Queries”. Con la primera opción podemos unir dos tablas en una sola; En este caso los nombres de las columnas de las dos tablas deben ser idénticos. con la segunda opción ( Merge Queries ),podemos relacionar dos tablas mediante una “Keys” y extraer las informaciones de una o varias columnas que coincidan con la segunda tabla relacionada.
    5. Evaluar y Transformar “columna data types”
  • Aprendimos a definir los tipos de datos en de las columnas.
    6. Aplicar “Data Shape Transformations” a “ Table Structures”**
  • Vimos como cambiar la forma en la estructura de las tablas. Utilizamos el Trasnpose para que los valores de las filas de la tabla se conviertan en columnas y los valores de las columnas en filas.
  • Utilizamos “Unpivot columns” coloca los valores de las columnas que tenga la tabla para cada una de las filas. Así se repiten las filas como tantas columnas tenga la tabla.
  • En tercer lugar vimos el “Pivot Column” ; que hace lo contrario al Unpivot, o sea cambia la forma de la tabla repitiendo las columnas como tantas filas tenga la tabla.
  • En cuarto lugar vimos el “Reverse Rows” ; que cambia el orden de las filas colocando la ultima en primer lugar.
  • En quinto lugar vimos “ Count Rows ” que convierte la tabla en un numero que suma todas las filas de la tabla.
  • En sexto lugar vimos “ Group By ”; que agrupa los datos por la columna que se indique. Tiene dos opciones una básica, que usa una sola columna para agrupar y la avanzada que usa varias columnas para agrupar.
  • Por ultimo conocimos la pestaña “Add Column” que tiene todas las opciones para agregar nuevas columnas: de índice, personalizadas, condicionales. También en esta pestaña podemos eliminar y duplicar columnas.
    7. Definir “Naming Conventions”, amigables para el usuario a columnas y “queries”.
  • Se trata de reemplazar o adecuar los nombres de las tablas, columnas y medidas para que sean comprensibles al usuario.
    8. Utilizar el “Advanced Editor” para modificar el código M del Power Query.
  • Es un tema fascinante que me ayudo a descifrar la estructura que usa el lenguaje M para codificar los pasos que se realiza en el query editor.
    9. Configurar el “Data Loading”.
  • conocí las opciones para cargar o no la tablas que queremos en nuestro modelo de datos. “ Enable Load, hace que la tabla no se cargue al power bi desktop. También se puede controlar si queremos que una tabla se actualize o no cuando aplicamos la opción Refresh en el power bi desktop. Sin embargo aunque desactivamos el refresh para una tabla, que esta vinculada a otra que requiere actualizarse la que desactivamos se va actualizar.
    10. Resolver errores en el “Data Import”
  • En este temas trabajamos los errores que pueden venir en las tablas. El editor crea una carpeta con los registros de las tablas que tienen errores. Trabajamos también los errores que bloquean las consultas y no permiten que se carguen al modelo. Un caso es si se cambia el nombre del archivo al que nos conectamos. Las soluciones dependen del tipo de error que se presente.

¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

Me sirve para manipular las tablas que voy a cargar al modelo de datos.

¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

Me parece que para responder a las preguntas referentes a la limpieza y transformación de los datos del modelo.