Etiquetado: Calidad de datos, Profile Data
-
¿Qué aprendiste en la sección “Profile the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
-
Buenas tardes, con todos.
Primero comentar que parece buenísimmo el curso y estoy muy contento de estar aquí con usted.Este tema me resultó muy interesantes, ya que sin necesidad de crear metricas ni fórmulas, se puede analizar la calidad de los datos y detectar cualquier iregularidad en los mismos.
En lo personal nunca habia usado estas opciones. De ahora en adelante ya no será así.
Esta sección “Profile the data” me proveyó de otras opciones para validación de datos rápida. Ahora usaré ese tipo de gráficos con esa intensión. Además las preguntas me ayudan a enfocarme en respuestás concretas. ¡Gracias!
Dan consejos y son certeros en el tema a explicar, sobre todo comprensibles, ahora conozco más a fondo la utilidad de est
a herramienta al momento de validar los datos.
Lo único que note que al editar la fuente de datos en excel ( agregando un nuevo valor ) y actualizando , el grafico de distribución en Column Profile no me lo mostraba hasta que filtre los datos en la columna.
De allí mencionar que los test al final de cada sesión te ayudan a darte idea del examen y que no todo lo que esta seleccionado quiere decir que la pregunta haga referencia a ese campo.
De la sección “Profile the data” puedo rescatar el análisis de las posibles anomalías que podemos que pueden aparecer dentro de los registros importados desde nuestra fuente de información.
Súper útil!Adicional he visto en preguntas del examen de certificación que tratan temas de transformación con múltiples archivos desde sharepoint online, filtrando por el path, sería bueno que agregaran unos videos haciendo referencia a a eso y a como trabajar con los archivos JSON que también vienen incluidos en el examen para tener una mejor orientación y sobre todo para los futuros alumnos.
Hola a todos
Lo que mas me gusto de esta sección fue el uso del grafico de dispersion para poder identificar las anomalías. Es una forma rápida y fácil de analizar las posibles discrepancias que pudieran presentarse en la data.
Buenas Noches
El tema de Outliers interesante.
Ver como analizar la calidad de datos, con las tres opciones que brinda Power Query.
Una pregunta, el tener habilitada esas opciones implica algo en el rendimiento del proyecto, es decir, lo puede hacer mas grande o lento?
Saludos¿Qué aprendiste en la sección “Profile the data”?
Aprendí que en cualquier BD puedo encontrar anomalías y se pueden originar porque se capturó mal un dato o porque hay un comportamiento erróneo en los datos.
Lo experiencia como analista de datos me va dar la habilidad de detectar rápidamente las anomalías que se pueden presentar y que solución se puede dar.
Es importante mencionar que un analista de datos no es solo la persona de sistemas sino que puede ser cualquier usuario sea financiero, logístico, de gestión humana entre otros.¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Me servirá a tener mas seguridad cuando trabaje con BD estadísticamente grandes para la herramienta y saberlos controlar de la mejor manera.¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Me servirá muchísimo; considero que mas importantes la teoría que la práctica para poder entender lo que uno está haciendo.Buenos días con todos,
La sección “Get data from different sources” me permitió conocer más herramientas de PowerBI para poder analizar nuestra data de entrada.
Servirá para tener métricas de nuestra información a primera mano de las tablas de datos.
Me servirá para tener familiaridad con los nuevos términos.
Buenos días,
La sección de Outliers estuvo muy bien, me gustó mucho el Column Properties, aporta mucha información y así no te enteras de errores en tus datos cuando armas el modelo y ves que no funciona (ya he estado ahí).
Saludos
Mis Outliers los verifico con sentencias SQL pero me parecio excelente como los indetificamos desde Power BI con la visualización de Scatter Chart.
Lo que aprendí es sobre donde debo cambiar (Column profling based on entire data set) para tener todos los datos en Power Query. Claro es importante saber el tamaño de los registros que existe en la tabla.
Saludos,
SantiagoEsta sección nos permitirá poder ver desde un inicio la calidad de nuestros datos y de esta manera el resultado pueda ser mas preciso.
De esta manera podemos depurarla o prepararla aun mejor para llevar a cabo nuestros análisis.SALUDOS A TODOS
- ¿Qué aprendiste en la sección “Profile the data”?
Resp. Herramientas para normalizar los datos fáciles de usar, de rápida visualización que ahorran mucho tiempo y son esenciales para disponer de tablas de datos limpias y confiables para trabajar. - ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Resp. Considero que lo importante es la rigurosidad del trabajo previo de normalización y revisión de los datos para no llegar después a conclusiones erróneas. - ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
No puedes hacer un trabajo de calidad si los datos vienen con problemas de base, deberían haber preguntas relacionadas con estos conceptos porque son muy importantes.
Buen día.
¿Qué aprendiste en la sección “Profile the data”?
Lo importante de detectar anomalías en los datos
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Buenas practicas y utilizar mas las herramientas que trae por default power bi para preparar los datos
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Definitivamente lo explicado en esta sección servirá para el examen ya que ayuda a comprender cómo preparar la calidad de los datos.
Saludos…
¿Qué aprendiste en la sección “Profile the data”?
- Métodos para validar que los datos de las tablas vienen limpios e identificar outliers.
- Utilizar el editor de consultas para evaluar la calidad de los datos con los que trabajaré.
- Por último interrogar las propiedades de las columnas de las tablas con las que se quiere trabajar.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
- En primer lugar hacer una validación de tus datos, ayudará a que tengas certeza en que los resultados que presentarás son válidos.
- Evaluar la calidad de los datos también me servirá mucho para tener una previsualización de si hay existencia de datos con error, vacíos o válidos y también ver cuantos valores son distintos y/o únicos.
- Junto con lo anterior también tomar en cuenta que si hay campos que no necesitaré o que no son relevantes para el desarrollo de mis dashboard, mientras mayor datos únicos tengan estos campos, más pesado será el archivo.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
- Yo creo que una de las cosas que el examen será muy exigente, es en que demostremos que podemos ser capaces de tener pensamiento crítico al momento de recibir archivos con los que debemos trabajar, cuestionarnos si realmente están o no correctos sus datos, tomando en cuenta que si este primer paso no lo realizamos, traerá consecuencias graves al momento de presentar resultados.
- ¿Qué aprendiste en la sección “Profile the data”?
- Debes estar registrado para responder a este debate.