Etiquetado: and Load the data, Clean, Transform
-
¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
-
¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
A manejar y ordenar la data e Power Query.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Si la data está organizada desde el principio el trabajo con DAX será mucho más sencillo.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Me di cuenta de que tenía unas lagunas al leer lenguaje M y al entender Trasponer y Columnas Dinámicas (Unpivot).
Aprendí/recordé/aclaré conceptos relacionados con la combinación de tablas, transformación de la estructura de las tablas, identificar y resolver errores en los datos, no considerar tablas a nivel del Power BI lo cual me disminuye el peso del archivo, las diferentes formas de ajustar/actualizar el origen de los datos.
Todo esto me ayuda a realizar mas rapido de forma eficiente el proceso de limpieza, transformación y carga de los datos, lo que optimiza los tiempos de desarrollo de las aplicaciones y tableros; lo cual esta directamente relacionado con el tema “Transformar y cargar datos” del apartado “Preparar los datos” del examen.
1. Aprendí diversas herramientas para limpiar los datos, tipos para mejorar la legibilidad de las consultas y columnas, a combinar consultas. Es importante evaluar los tipos de datos de las columnas y darles el tipo de datos adecuado ya que ello impacta en el rendimiento de nuestras consultas.
También aprendí a usar la sintaxis del Editor avanzado, el lenguaje M nos puede dar muchas posibilidades en la limpieza de nuestros datos.
Esto me servirá para tratar una parte crucial de nuestros desarrollos en Power BI como es el Limpiar y transformar los datos antes de que sean llevados al modelo.
Conceptos y herramientas muy necesarias para la certificación.
Dentro de esta sección aprendí una serie de técnicas y habilidades esenciales que son fundamentales para la preparación de datos antes de su análisis y visualización. Este proceso es crucial porque los datos raramente están en el formato perfecto para análisis directo y requieren una manipulación cuidadosa para asegurar que sean precisos, completos y útiles.
Con lo visto en este modulo más práctica adicional se debería dominar lo siguiente:
1. Identificar y corregir problemas comunes en los datos como: Datos faltantes, errores de ingreso, formatos inconsistentes.
2. Saber las técnicas para modificar datos de formas que los hagan más útiles para análisis como: creación de nuevas columnas, agrupación, Pivot y Unpivot Columns, transpose, etc.
3. Cargar datos transformados en PBI: optimizar modelo de datos, saber las relaciones entre tablas.
dlom dijo¿Qué aprendiste en la sección “Clean, Transform, and Load the data”?
Que podemos agregar contenido similar a tablas existentes desde otras fuentes con estructura igual o similar
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Unificar Tablas de Excel que están separadas en diferentes libros o archivos
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Si hay alguna pregunta acerca de unificar o transformar información
En esta sección del curso, aprendí la estructura del lenguaje M. No sabía que el inicio hace referencia al paso anterior en la declaración in.
Saludos.
En esta sección los conceptos que se repasan son muy ùtiles, sobre todo para la preparación de los datos previo a la generación de un reporte. Destaco la función de código M de "Text.From" algo que desconocía y me hubiese servido tiempo atrás.
Ha estado muy interesante esta sección. Lo que mas me ha gustado y que no sabía es que se podia hacer un Merge forzando a Power BI que haga match en más de una columna. Muy útil.
Sin embargo he tenido un problema al realizar el Merge entre las tablas, ya que una tabla tenían fechas de 2001 y la otra de 2018 a 2019, por tanto no hacían match. No sé si el problema es por la fuente de los datos o porque yo estoy realizando el curso en un ordenador que esta en Portugues (ya que estoy residiendo actualmente el brasil), quizás haya habido algun problema al interpretar las fechas por parte de Power BI.
Si alguien sabe como solucionarlo o si han tenido el mismo problema agradecería que contestarán este mensaje.
Un saludo a todos.
David.
Hola!
comparto mis puntos claves de esta sección, basado en los aspectos que fueron relevantes para mi.Gracias
Detección de errores: No borrarlos, analizarlos. Recomendación: keep Error para analizarlos. Luego clikear en el error y observar de dónde vienen.
Nulos: Fill down, puede usarse en casos de que hay valores nulos, pero debería repetirse el que está arriba. Se pueden remover o reemplazar.
Values replacement: reemplazar valores por otros. Cuidado cuando se reemplaza texto que no se esté reemplazando parte del texto de otra celda que no queramos reemplazar. En números no es lo mismo, si reemplazo el 1 y una celda tiene el 165, ese 1 no será reemplazado en ningún caso que la coincidencia no sea total, es decir, que tengamos "1". Cuidado con la cantidad de reemplazos que agrega pasos en la consulta y hace más pesado el fichero y se tardará mucho más en cargar el PBI.
Tratamiento de errores: reemplazar, modificar o corregir: Cuidado con eliminar las filas con error. Preferentemente identificar y corregir el error. Mejor si se corrige en el origen, si fuera el caso, para evitar pasos innecesarios
Advanced Editor: incluir/modificar pasos. Ver funciones dentro. Cuidado con la coma al final de cada paso (salvo en el último) y luego del in debe ir uno de los pasos que hay en let. Cada paso debe indicarse con #' salvo que contenga palabras sin espacios.
Combinar consultas y anexarlas: se hacen con el Append o Merge.
Key column para combinar consultas: se puede crear esta columna con los valores de varias columnas o bien al realizar el merge se seleccionan las columnas que generan la clave única en cada table.
Pasos en advanced Editor: cada paso incrementa el tiempo de carga. Se deben minimizar los pasos y transformaciones.
Tipos de datos al combinar: cuando se combinan dos tablas, el tipo de dato de la columna utilizada para combinar debe ser el mismo en ambas tablas.
- Debes estar registrado para responder a este debate.