Etiquetado: Calidad de datos, Profile Data
-
¿Qué aprendiste en la sección “Profile the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
-
¿Qué aprendiste en la sección “Profile the data”?
Para "Interrogar las data statistics" , la opción "Column profile" nos ayuda a ver distintos valores estadísticos de nuestras columnas. Valores como, por ejemplo, el valor mínimo y el valor máximo. En "Interrogar las column properties" sale la opción "Column distribution" nos permite ver el número de veces que se repiten los valores en la columna, y muestra esto con barras verticales. En "Interrogar data statistics, "Column profile " en la columna seleccionada en la parte de abajo se muestran los valores estadísticos de esta columna, incluyendo el valor mínimo, el valor máximo, el promedio, y más valores."En las column properties" esta la funcionalidad "Column distribution" donde se obtiene la cantidad de valores distintos y únicos para todas las columnas en nuestra tabla.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Revisar las estadísticas de los datos en las columnas, de mas datos necesarios.¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Tener las bases y conocimientos necesarias para el examen.Una descripción muy buena de las diferentes vistas de las características de las columnas.
Me parece muy importante comenzar a fijar métodos de detección de valores atípicos.
Saludos. En la sección Profile the data he concluído lo siguiente:
Las herramientas de generación de perfiles nos brindan una gran ayuda para ver el panorama de los datos. El observar la cantidad de valores únicos y distintos, así como de válidos, errores y vacíos como también un análisis estadístico acompañado de un gráfico de frecuencais con sus distribuciones facilitan el trabajo para nuestro análisis.
En base a los resultados podemos mejorar el conjunto de datos tanto para presentarlos como para disminuir el tamaño del mismo al eliminar valores innecesarios así como otras operaciones.
dlom dijo¿Qué aprendiste en la sección “Profile the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?Con este tema pude fortalecer mis conocimientos, los cuales me servirán para identificar más rápido los errores en mis datos y analizar más rápido la información, espero también ser apoyo más adelante, pronto, para esta comunidad. Hacia la certificación afianza más el tema para dar respuestas más acertadas.
¿Qué aprendiste en la sección “Profile the data”?
Power BI me da la oportunidad de conocer mejor los datos que tengo desde power Query y asi perfilar los datos y analizarlos.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Puedo verificar de una manera rapida la cantidad de nulos de una columna, la distribucion de la misma y tomar desiciones respecto a la transformacion o no para la limpieza de ellos.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
me ayudara a indentificar las secciones que correspondan a perfilar los datos
En la sección “Profile the data” he aprendido lo siguiente:
-La importancia de detectar anomalías en los datos y como tratarlos posteriormente.
-La utilización de la opcion "Column profile" para ser capaz de descubrir cuales son los distintos valores estadísticos que tienen nuestras columnas.
-Como la opción "Column distribution" nos permite identificar la cantidad de veces que se repiten valores en las columnas.
-La multitud de maneras diferentes para evaluar la calidad de mis datos.Profile the Data nos entrega un resumen util y bastante poderoso para determinar rapidamente la calidad y la entegridad de los datos de la tabla.
Es fundamental detectar rapidamente valores atipicos de una manera visualmente global y comparativa con otras tablas.
dlom dijo¿Qué aprendiste en la sección “Profile the data”?
Profile Data sirve para dar un vistazo a las características principales de los datos, muestra de los 1,000 primeros, de tal forma que podemos intuir si son de la calidad que necesitamos o podemos tomar algunas acciones de limpieza de los mismos.
En esta sección me pareció muy interesante la opcion que te brinda Power Query para detectar la calidad de tu data. Con funcionalidades que no conocía como: el Colum Profile y el Column Distribution. Anteriormente, solo empleaba el Data Quality, así que esto es un salto de calidad en mi análisis de Data Quality.
No conocia el profile column del powerquery.
Para una primera instancia en ciencia de datos esta opción es genial ya que obtienes resumen de tus datos e histograma para detectar anomalias.
Me gustaria saber a nivel de visualización que se puede usar para representar eso mismo en x columna o si , si o si hay que crear medidas e ir agregando las etiquetas con cada uno de ellas.
En la práctica usaba la formula describe e info en python y ahi me migraba un dataframe en excel que lo importaba en power bi....
¿Qué aprendiste en la sección “Profile the data”?
La importancia de ver la calidad del datos desde el inicio. No sabía que estaba la opción de que la estadística incluyera todos los datos.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Tomar como primer paso y con más cuidado el tema de la calidad de los datos.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Es uno de los elementos que se deben conocer para el exámen.
Creo que lo mejor es que puedo ver mas de los 1000 primeros datos!!
Qué aprendiste en la sección “Profile the data”?
Herramientas para normalizar los datos, identificar las causas de los errores, el comportamiento de los datos dentro de cada una de las columnas de información.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Asegurando desde un inicio que la información con la que se empezará a realizar operaciones y demás esté lista, libre de errores.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Si la información / datos a los que nos conectamos no son de calidad, el trabajo que realizamos tampoco lo será. Debemos prepararlos y conocerlos.Aprendí herramientas para el analisis de la calidad de los datos y la estimación de las estadísticas que dan informacion sobre le comportamiento de cada variable o columna.
La visual e informacion que se obtiene de los datos con estas herramientas permite al desarrollador hacer una limpieza y transformación de los datos de forma optima.
Los conocimientos adquiridos en esta sección estan relacionados directamente con el tema del examen de certificación "Preparar los datos", específicamente "Limpiar los datos" para realizar la evaluación de estos, estimar las estadísticas y propiedades de las columnas. Tambien para la resolución de las incoherencias, valores inesperados, errores, entre otros.
dlom dijo¿Qué aprendiste en la sección “Profile the data”?
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?- En esta sección aprendí a utilizar las herramientas disponibles en Power Query para analizar la calidad de los datos, la distribución de las columnas y el perfil de las columnas.
Mediante la calidad de los datos podemos determinar el % de valores válidos, % de valores con errores y % de valores vacíos.
Con la Distribución de Columnas podemos observar la cantidad de veces que se repiten los valores en nuestras columnas.
Con el Perfil de columnas podemos obtener diferentes valores estadísticos como valores mínimos, máximos, promedios, etc.
- Lo aprendido me servirá para mejorar la calidad de nuestros datos y poner mucha atención para determinar en cuáles posteriormente debemos aplicar procesos de ETL.
- Estos temas y las pruebas realizadas me ayudan a fortalecer los conocimientos necesarios para rendir el examen de certificación.
- Debes estar registrado para responder a este debate.