Foros › Power BI en general › Aprendizajes de la sección “Clean, Transform, and Load the data” del módulo “Prepare the data”
Hola!
comparto mis puntos claves de esta sección, basado en los aspectos que fueron relevantes para mi.
Gracias
Detección de errores: No borrarlos, analizarlos. Recomendación: keep Error para analizarlos. Luego clikear en el error y observar de dónde vienen.
Nulos: Fill down, puede usarse en casos de que hay valores nulos, pero debería repetirse el que está arriba. Se pueden remover o reemplazar.
Values replacement: reemplazar valores por otros. Cuidado cuando se reemplaza texto que no se esté reemplazando parte del texto de otra celda que no queramos reemplazar. En números no es lo mismo, si reemplazo el 1 y una celda tiene el 165, ese 1 no será reemplazado en ningún caso que la coincidencia no sea total, es decir, que tengamos "1". Cuidado con la cantidad de reemplazos que agrega pasos en la consulta y hace más pesado el fichero y se tardará mucho más en cargar el PBI.
Tratamiento de errores: reemplazar, modificar o corregir: Cuidado con eliminar las filas con error. Preferentemente identificar y corregir el error. Mejor si se corrige en el origen, si fuera el caso, para evitar pasos innecesarios
Advanced Editor: incluir/modificar pasos. Ver funciones dentro. Cuidado con la coma al final de cada paso (salvo en el último) y luego del in debe ir uno de los pasos que hay en let. Cada paso debe indicarse con #' salvo que contenga palabras sin espacios.
Combinar consultas y anexarlas: se hacen con el Append o Merge.
Key column para combinar consultas: se puede crear esta columna con los valores de varias columnas o bien al realizar el merge se seleccionan las columnas que generan la clave única en cada table.
Pasos en advanced Editor: cada paso incrementa el tiempo de carga. Se deben minimizar los pasos y transformaciones.
Tipos de datos al combinar: cuando se combinan dos tablas, el tipo de dato de la columna utilizada para combinar debe ser el mismo en ambas tablas.