Etiquetado: and Load the data, Clean, Transform
-
¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
-
De la sección “Clena, Transform, and Load the data” aprendí que para cruzar datos entre 2 tablas, las columnas que las integran deben tener el mismo formato; que cuando estamos en el ambiente de query editor avanzado, la sentencia posterior al “in” debe llamar a uno de los pasos previos al “in”; además de consejos súper útiles de cómo resolver problemas de carga en la información.
¡Muy útil hasta aquí!
La posibilidad de marcas las columnas para crear una Key me gustó mucho!!
Hola
Los que aprendí en esta sección:
- La diferencia entre merge y append
- La importancia de los tipos de datos en las columnas, especialmente cuando estas se relacionan con otras tablas.
- El advance editor, y la estructura del código M
Seguimos!!
Como limpiar los errores, como transforma filas a columnas y columnas a filas, como leer el codigo M
En este tema también he aprendido algo que no sabía y a su vez me ha surgido una duda. A ver si alguien me la podría resolver. Hasta la fecha siempre que tenía que hacer un Merge o relacionar tablas en el modelo, si la clave que unía dos tablas, era la unión de diferentes columnas, siempre me creaba una columna auxiliar con esta combinación, pero en este tema hemos visto que se puede realizar el Merge seleccionando el conjunto de columnas. Ahora bien, si yo quisiera unir estas tablas, de una forma similar a como lo hicimos con el Merge, ¿sería posible hacer algo similar a lo que pongo en la foto o es necesario crear la columna auxiliar?
Espero haberme explicado bien
Gracias- Sólo cuando tengamos cargado el modelo y empecemos a analizar los datos, nos daremos cuenta de la importancia que tiene este apartado. Dominar las posibilidades que nos ofrece Power Query y entender cómo funciona el lenguaje M nos dará ventaja en la fiabilidad de los resultados frente a otros que puedan saltarse el paso de la “transformación” y “limpieza”.
- Diferencia entre MERGE y APPEND. Posibilidad de realizar un JOIN con múltiples columnas.
- Diferencia entre TRANSPOSE y UNPIVOT. Muy importante cuando recibimos datos con formatos heredados de excel para seguimiento mensual de alguna métrica.
- Me ha permitido aclarar dudas respecto al funcionamiento de “Refresh”, cuando la tabla no se carga. Qué ocurre si se utiliza para mantener otra tabla del modelo, a pesar de no tener activada la opción de Refresh. El hecho de que la opción quedara ensombrecida pero activada me generaba confusión.
- La gestión de los errores es muy importante, tenerlos controlados y saber como tratarlos es crucial para nos desvirtuar nuestros datos.
Cualquier detalle que ayude a ampliar nuestra habilidad con Power BI ayudará en los desarrollos futuros y en adaptar a los ya existentes.
A por más.
Un saludo a tod@sBuen comentario Isidre!
Solo para especificar en el siguiente punto:
- Combinación de Consultas
MERGE (Combinación): Cuando se tienen una o varias columnas para agregar a otra consulta, se fusionan las consultas. Se pueden formar relaciones entre más de una columna para las consultas, a manera de crear una “KeyColumn” (valores únicos para cada registro).
APPEND (Anexar): Cuando se tienen filas de datos adicionales que desea agregar a una consulta existente, se anexa la consulta. Los nombres de columnas (headers) deben ser exactamente iguales (en ambas consultas a anexar) para evitar errores posteriores.
Asimismo, comentar que es un poco confuso lo de desactivar “Include in report refresh” cuando también hemos desactivado “Enable load” para poder actualizar la consulta. Es un poco contradictorio, bueno de esa manera lo entiendo.
Cualquier comentario que se pueda generar para hacer más fácil de entender las funciones en Power BI Desktop nos ayudará mucho.
Saludos!
Hola Cómo están ? espero que bien lo aprendí en la sección de “Clean, Transform, and Load the data” fue lo siguiente:
- La importancia de saber crear “Keys” adecuados para los “joins” a veces nos descreocupamos de esto cuando trabajamos con base de datos por que desde alli ya viene nuestras primary key, pero debemos estar preparados para todo tipo de fuente de datos.
- Si queremos utlizar Append Queries debe coincidir el nombre de las columnas de las 2 o mas tablas.
- Lo importante de optimizar los pasos (Applied Steps) en Power Query. Entre más pasos tenga el Power Query la carga se demora más.
Saludos,
Santiago- ¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
Facilita la gestión de los datos las funciones Merge y Append así como unir mas de una columna
- ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Me facilitará la preparación de datos con una gestión más robusta buscando aumentar la calidad de los mismo buscando disminuir al mínimo la posibilidad de errores.
- ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Sin duda que disponer de herramientas robustas de gestión de datos te da más margen para trabajar además de asegurar una data de alta calidad que nos asegure concentrarnos en la búsqueda de los reportes finales confiando que están construidos sobre una base sólida.
La sección de “Clean, Transform, and Load the data” nos dotó de herramientas para poder adecuar nuestra data en función de lo que buscamos. Entre ello poder solucionar e identificar errores, combinar queries (ya sea mediante el Merge o Append), configurar las tablas que deseamos cargar a nuestro modelo, entre otros.
Me servirá de mucho para poder aligerar nuestra carga, filtrando la información necesaria al modelo.
Leo algunos post donde queda alguna duda sobre el " Enable Load"; al dejar desactivado la opción “Enable Load” da la impresión que no se actualizará pero en el video se menciona que sí será actualizado, esto me gustaría sea tema de discusión en la reunión que tengamos.
Saludos!
Buen día,
Les comparto mis respuestas.
¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
Considero que es uno de los temas más importante ya que podemos minimizar los fallos que en etapas posteriores del proceso de datos pudieran darse (existencia de campos o valores nulos, tablas de referencia inexistentes, llaves, etc.).
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Revisar mis proyectos para validar que estén de acuerdo con las buenas prácticas mencionadas en la guía de estudio de este curso.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?Saber identificar cuando utilizar lo aprendido en esta sección de acuerdo con las situaciones o ejercicios que se puedan presentar en el examen.
Definitivamente, estos puntos son importantes para todos los proyectos de inteligencia de negocios.
Saludos…
Cada punto visto en la seccion es tan importante en lo que respecta a la calidad de datos.
Me interesa y motiva ver mas en lo que respecta al lenguaje M y el Editor Avanzado.Me resultó muy interesante este módulo. La importancia de las keys y los joins, las diferencias entre merge y append queries y conocer algo más del código M, como forma de mejorar la limpieza, transformación y carga de los datos, conceptos fundamentales para agilizar los procesos.
Si @Javl88 , Como que los términos en español de estas opciones se pueden llegar a confundir…
En inglés, el grupo se llama “Combine” y las opciones son “Merge” y “Append”.
En español, el grupo se llama “Combinar” y las opciones son “Combinar” y “Anexar”.Saludos
Aprendí a comprobar carga de tablas, examinar las fuentes de errores en los datos, errores de formatos, etc. También cómo anexar y combinar tablas similares. Y lo más valioso fue aprender a ver y modificar el código M y cómo se va generando con los pasos que se van creando.
- Debes estar registrado para responder a este debate.