Aprendizajes de la sección “Clean, Transform, and Load the data” del módulo “Prepare the data”

  • Diego
    Participante

    ¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
    ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
    ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

  • Isidre
    • Sólo cuando tengamos cargado el modelo y empecemos a analizar los datos, nos daremos cuenta de la importancia que tiene este apartado. Dominar las posibilidades que nos ofrece Power Query y entender cómo funciona el lenguaje M nos dará ventaja en la fiabilidad de los resultados frente a otros que puedan saltarse el paso de la “transformación” y “limpieza”.
    • Diferencia entre MERGE y APPEND. Posibilidad de realizar un JOIN con múltiples columnas.
    • Diferencia entre TRANSPOSE y UNPIVOT. Muy importante cuando recibimos datos con formatos heredados de excel para seguimiento mensual de alguna métrica.
    • Me ha permitido aclarar dudas respecto al funcionamiento de “Refresh”, cuando la tabla no se carga. Qué ocurre si se utiliza para mantener otra tabla del modelo, a pesar de no tener activada la opción de Refresh. El hecho de que la opción quedara ensombrecida pero activada me generaba confusión.
    • La gestión de los errores es muy importante, tenerlos controlados y saber como tratarlos es crucial para nos desvirtuar nuestros datos.

    Cualquier detalle que ayude a ampliar nuestra habilidad con Power BI ayudará en los desarrollos futuros y en adaptar a los ya existentes.
    A por más.
    Un saludo a [email protected]

    minervamar

    Seguimos con la calidad en la estructura de nuestras tablas y los datos con todas estas herramientas para poder trabajar limpiamente con toda esta información

    En esta ocasión no cabe duda que tener el PBi en ingles será necesario ya que permite estar familiarizado con los términos que se utilizaran en el caso especifico de la certificación.

    Será necesario revisar todas estas funciones en M para conocerlas mejor.

    Saludos!!

    Raulcip

    Buen comentario Isidre!

    Solo para especificar en el siguiente punto:

    • Combinación de Consultas
      MERGE (Combinación): Cuando se tienen una o varias columnas para agregar a otra consulta, se fusionan las consultas. Se pueden formar relaciones entre más de una columna para las consultas, a manera de crear una “KeyColumn” (valores únicos para cada registro).
      APPEND (Anexar): Cuando se tienen filas de datos adicionales que desea agregar a una consulta existente, se anexa la consulta. Los nombres de columnas (headers) deben ser exactamente iguales (en ambas consultas a anexar) para evitar errores posteriores.

    Asimismo, comentar que es un poco confuso lo de desactivar “Include in report refresh” cuando también hemos desactivado “Enable load” para poder actualizar la consulta. Es un poco contradictorio, bueno de esa manera lo entiendo.

    Cualquier comentario que se pueda generar para hacer más fácil de entender las funciones en Power BI Desktop nos ayudará mucho.

    Saludos!

    sfnavarrete

    Hola Cómo están ? espero que bien :slight_smile: lo aprendí en la sección de “Clean, Transform, and Load the data” fue lo siguiente:

    • La importancia de saber crear “Keys” adecuados para los “joins” a veces nos descreocupamos de esto cuando trabajamos con base de datos por que desde alli ya viene nuestras primary key, pero debemos estar preparados para todo tipo de fuente de datos.
    • Si queremos utlizar Append Queries debe coincidir el nombre de las columnas de las 2 o mas tablas.
    • Lo importante de optimizar los pasos (Applied Steps) en Power Query. Entre más pasos tenga el Power Query la carga se demora más.

    Saludos,
    Santiago

    Carlos_Figueroa
    • ¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?

    Facilita la gestión de los datos las funciones Merge y Append así como unir mas de una columna

    • ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

    Me facilitará la preparación de datos con una gestión más robusta buscando aumentar la calidad de los mismo buscando disminuir al mínimo la posibilidad de errores.

    • ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    Sin duda que disponer de herramientas robustas de gestión de datos te da más margen para trabajar además de asegurar una data de alta calidad que nos asegure concentrarnos en la búsqueda de los reportes finales confiando que están construidos sobre una base sólida.

    Hurodebe

    La sección de “Clean, Transform, and Load the data” nos dotó de herramientas para poder adecuar nuestra data en función de lo que buscamos. Entre ello poder solucionar e identificar errores, combinar queries (ya sea mediante el Merge o Append), configurar las tablas que deseamos cargar a nuestro modelo, entre otros.

    Me servirá de mucho para poder aligerar nuestra carga, filtrando la información necesaria al modelo.

    Leo algunos post donde queda alguna duda sobre el " Enable Load"; al dejar desactivado la opción “Enable Load” da la impresión que no se actualizará pero en el video se menciona que sí será actualizado, esto me gustaría sea tema de discusión en la reunión que tengamos.

    Saludos!

    rcuevas
    Participante

    Buen día,

    Les comparto mis respuestas.

    ¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?

    Considero que es uno de los temas más importante ya que podemos minimizar los fallos que en etapas posteriores del proceso de datos pudieran darse (existencia de campos o valores nulos, tablas de referencia inexistentes, llaves, etc.).

    ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

    Revisar mis proyectos para validar que estén de acuerdo con las buenas prácticas mencionadas en la guía de estudio de este curso.
    ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    Saber identificar cuando utilizar lo aprendido en esta sección de acuerdo con las situaciones o ejercicios que se puedan presentar en el examen.

    Definitivamente, estos puntos son importantes para todos los proyectos de inteligencia de negocios.

    Saludos…

    David

    Cada punto visto en la seccion es tan importante en lo que respecta a la calidad de datos.
    Me interesa y motiva ver mas en lo que respecta al lenguaje M y el Editor Avanzado.

    josses

    Me resultó muy interesante este módulo. La importancia de las keys y los joins, las diferencias entre merge y append queries y conocer algo más del código M, como forma de mejorar la limpieza, transformación y carga de los datos, conceptos fundamentales para agilizar los procesos.

    Javl88

    Buenas tardes,

    Buen comentario , justo a mi me jugó una mala pasada porqué en pw bi en español dice “combinar” y en el quiz estaba la opción de “append and combine” creí que era esa pero era “merge”, ya se empieza a ver más el estar familiarizado con los términos en inglés para el tema de certificación.

    Saludos,

    Diego
    Participante

    Si @Javl88 , Como que los términos en español de estas opciones se pueden llegar a confundir…
    En inglés, el grupo se llama “Combine” y las opciones son “Merge” y “Append”.
    En español, el grupo se llama “Combinar” y las opciones son “Combinar” y “Anexar”.

    Saludos :raised_hands:t2:

    jburrull

    Aprendí a comprobar carga de tablas, examinar las fuentes de errores en los datos, errores de formatos, etc. También cómo anexar y combinar tablas similares. Y lo más valioso fue aprender a ver y modificar el código M y cómo se va generando con los pasos que se van creando.

    Abigail

    Hola a todos

    Lo que vimos en este apartado, lo considero como el corazón del todo, es importante partir de una limpieza absoluta en los datos, es pasar el lenguaje humano a máquina sin perder de vista que un humano debe comprenderlo, algo que en mi opinión debe basarse en, yo como usuario, como quisiera que me presentaran estos datos:

    1. Como funcionaria para mi lo que veo
    2. Esta información es clara y fácil de manejar
    3. La terminología es la que yo manejo

    Primordialmente hay que ser empático con el usuario final creando algo con calidad, claridad y confiabilidad.

    Hay que estar atentos a cómo se usará la información, es importante saber leer lo que vamos a presentar, para saber que corregir y cómo corregirlo, esto hará más sencillas las acciones a tomar para transformar la información.

    Jorge_Bastidas

    En diversas oportunidades he usado la función de anexar, pero desconocía el funcionamiento de combinar, así que ha sido muy útil ver el ejemplo. De hecho, recientemente lo apliqué en un reporte que estoy desarrollando :smile:

    llopez

    Buenas noches

    Comparto mi experiencia de lo aprendido en este modulo.

    • Merge: este nos permite hacer un join y traer los datos que coincide desde otra tabla, considero que podría ser un tanto similar a realizar un buscarv (vlookup) en excel.
    • Append: este nos permite anexar información de una o mas tablas para convertirla en una sola vista, importante que los tipos de datos, nombre y cantidad de columnas sean las mismas
    • Interesante la forma de realizar las opciones de transpose y unpivot, ya que muchas veces los input de información de otras fuentes, vienen en una estructura compleja, y considero que con esto se puede sacar el mayor provecho para el análisis
    • El crear un key único (en caso no lo tenga la tabla) considero que es muy utilizado, ya que esto te permite concatenar varias columnas y hacer un merge o append en la tabla
    • Otro punto importante es la creación de nombres de tablas o vistas entendibles para los usuarios a fin de no generar confusiones
    • Asimismo sumamente importante y con muchas opciones para investigar, es el editor avanzado utilizando lenguaje M, buena explicación de su estructura y algunas formas de uso.
    • Finalmente, la opción de Habilitar o desactivar la carga de un tabla, considero que puede ser útil para cuando se necesite realizar un cruce con una tabla y esta no se deba de mostrar en la parte de visualizaciones y/o el modelado

    Gracias a todos por compartir sus experiencias, éxitos. :muscle:t3:

Viendo 15 respuestas - de la 1 a la 15 (de un total de 37)
  • Debes estar registrado para responder a este debate.