Etiquetado: Calidad de datos, Profile Data
-
¿Qué aprendiste en la sección “Profile the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
-
- ¿Qué aprendiste en la sección “Profile the data”?
Aprendí a analizar la estructuras de las tablas, las anomalías con las que uno puede encontrarse.
- ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
En realizar un análisis previo de la estructura de las tablas por los posibles errores o anomalías que no permita otorgar los datos certeros que uno quiere exponer en la organización.
- ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Para poder responder con propiedad las preguntas de todo lo aprendido.
Muy interesante el tema para poder evaluar y conocer como están siendo cargados los datos y así determinar si es necesario o no transformar ciertos tipos de datos y/o ver datos erroneos.
Hola a todos,
En esta sección no sabía como se visualizaban esas columnas verdes en cada columna y como revisar más a fondo las estadisticas de las columnas. Creo que es muy conveniente saber estos tips para identificar rápidamente cualquier anomalía en los datos.
Saludos.
Buenas, en la sección "Profile the data" aprendí funcionalidades que trae PowerBI y que no conocía. Resultan muy útiles a la hora de comenzar con el armado de un reporte, ya que permiten tener un panorama general de cómo se encuentran los datos a utilizar en el reporte. Estas funcionalidades pueden permitir ahorrar gran cantidad de tiempo haciendo un análisis previo para detectar valores raros, nulos, anómalos en el conjunto de datos.
Aprendí que se puede rápidamente evaluar la calidad de los datos, además de ver estadísticas relevantes por columnas. Es una manera sencilla y rápida que da Power BI para perfilar nuestros datos y revisar tanto la calidad como la conveniencia de los mismos.
Gran lección. Con ganas de más.
Hola!
He aprendido lo siguiente:
Identificar anomalías: estas pueden deberse a mala recopilación o puede ser un fenómeno real. En ambos casos hay que explorar más, para corregirlo o para averiguar la razón. Ayudas: diagramas, tablas para visualizar los outliers
Data Structures: Tener cuidado del tipo de datos que se asigna a cada columna y que coincida entre las distintas tablas para que las relaciones no se vean afectadas. Columnas que tienen registros tipo "Tabla" o Value" que conecta con una tabla que se puede expandir o un valor que se puede ver.
Propiedades de las columnas :Evaluar los datos. Cuando mayor cantidad de valores únicos haya, mayor será el peso del archivo, debido al método de compresión que tiene PBI. Hay métodos para hacer que un archivo de PBI no pese tanto.Las vistas de column profile, distribution and quality son muy útiles para identificar outliers, NAN o algún otro patrón sin necesidad de hacer visualizaciones.
Gracias!Hola,
he aprendido lo siguiente:Selección entre Import, Direct Query o Dual: Excel sólo admite Import. Direct Query se puede usar con bbdd, muestras que Import con cualquier fuente de datos. Se usa Direct Query cuando las bbdd son muy grandes o se necesita información en tiempo real.
Query folding: Plegado de consultas. Realizar menor número de paso y los pasos que no admiten el plegado de consultas, dejarlos para el final. El plegado de consultas permite que las transformaciones se hagan en el servidor.
Parámetros: También en el tema de "Usar parámetros" vimos que los parámetros podíamos utilizarlos para darle más control a nuestros usuarios qué datos íbamos a mostrarles. Se puede hacer templates para que el usuario reciba el PBI y pueda seleccionar un rango de fechas según el parámetro establecido.
Use or create PBIDs file: se usa en Data Sources para exportar esa fuente de datos y que los usuarios puedan conectarse al servidor y las tablas sin necesidad de tener credenciales. Pueden entrar, seleccionar las tablas que les interesa, y trabajar haciendo visualizaciones con ellas
Query type/Conectores: es la forma en que un se conecta para cargar los datos en PBI. Existen muchas fuentes, las más usadas son SQL o AzureSQL y Excel. Otras más generales son: ODBC o Ole db. Hay una que se llama Folder para cargar varios ficheros a la vez.
Un saludo!
Hola a todos y todas 🙂
Me gustan mucho las opciones de perfilado de columnas, distribución y calidad porque permiten conocer características importantes del conjunto de datos con apenas un par de clics.
- Debes estar registrado para responder a este debate.