Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”

  • dlom
    Participante

      ¿Qué aprendiste en la sección “Profile the data”?
      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    • dat2192434329
      Participante

        ¿Qué aprendiste en la sección “Profile the data”?

        Para “Interrogar las data statistics” , la opción “Column profile” nos ayuda a ver distintos valores estadísticos de nuestras columnas. Valores como, por ejemplo, el valor mínimo y el valor máximo.  En “Interrogar las column properties” sale la opción “Column distribution” nos permite ver el número de veces que se repiten los valores en la columna, y muestra esto con barras verticales.  En “Interrogar data statistics, “Column profile ” en la columna seleccionada en la parte de abajo se muestran los valores estadísticos de esta columna, incluyendo el valor mínimo, el valor máximo, el promedio, y más valores.”En las column properties” esta la funcionalidad “Column distribution” donde se obtiene la cantidad de valores distintos y únicos para todas las columnas en nuestra tabla.

        ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
        Revisar las estadísticas de los datos en las columnas, de mas datos necesarios.

        ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
        Tener las bases y conocimientos necesarias para el examen.

        JoseSanchez
        Participante

          Una descripción muy buena de las diferentes vistas de las características de las columnas.

          Me parece muy importante comenzar a fijar métodos de detección de valores atípicos.

          dennysSalazar117
          Participante

            Saludos. En la sección Profile the data he concluído lo siguiente:

            Las herramientas de generación de perfiles nos brindan una gran ayuda para ver el panorama de los datos. El observar la cantidad de valores únicos y distintos, así como de válidos, errores y vacíos como también un análisis estadístico acompañado de un gráfico de frecuencais con sus distribuciones facilitan el trabajo para nuestro análisis.

            En base a los resultados podemos mejorar el conjunto de datos tanto para presentarlos como para disminuir el tamaño del mismo al eliminar valores innecesarios así como otras operaciones.

            dat2194862088
            Participante
              dlom dijo

              ¿Qué aprendiste en la sección “Profile the data”?
              ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
              ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

              Con este tema pude fortalecer mis conocimientos, los cuales me servirán para identificar más rápido los errores en mis datos y analizar más rápido la información, espero también ser apoyo más adelante, pronto, para esta comunidad. Hacia la certificación afianza más el tema para dar respuestas más acertadas.

              dat2191498887
              Participante

                ¿Qué aprendiste en la sección “Profile the data”?

                Power BI me da la oportunidad de conocer mejor los datos que tengo desde power Query y asi perfilar los datos y analizarlos.

                ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                Puedo verificar de una manera rapida la cantidad de nulos de una columna, la distribucion de la misma y tomar desiciones respecto a la transformacion o no para la limpieza de ellos.

                ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                me ayudara a indentificar las secciones que correspondan a perfilar los datos

                Héctor Vicente Delgado
                Participante

                  En la sección “Profile the data” he aprendido lo siguiente:

                   

                  -La importancia de detectar anomalías en los datos y como tratarlos posteriormente.
                  -La utilización de la opcion “Column profile” para ser capaz de descubrir cuales son los distintos valores estadísticos que tienen nuestras columnas.
                  -Como la opción “Column distribution” nos permite identificar la cantidad de veces que se repiten valores en las columnas.
                  -La multitud de maneras diferentes para evaluar la calidad de mis datos.

                  dat2196136020
                  Participante

                    Profile the Data nos entrega un resumen util y bastante poderoso para determinar rapidamente la calidad y la entegridad de los datos de la tabla.

                    Es fundamental detectar rapidamente valores atipicos de una manera visualmente global y comparativa con otras tablas.

                     

                     

                     

                    dat2181203697
                    Participante
                      dlom dijo

                      ¿Qué aprendiste en la sección “Profile the data”?

                      Profile Data sirve para dar un vistazo a las características principales de los datos, muestra de los 1,000 primeros, de tal forma que podemos intuir si son de la calidad que necesitamos o podemos tomar algunas acciones de limpieza de los mismos.

                      Juan
                      Participante

                        En esta sección me pareció muy interesante la opcion que te brinda Power Query para detectar la calidad de tu data. Con funcionalidades que no conocía como: el Colum Profile y el Column Distribution. Anteriormente, solo empleaba el Data Quality, así que esto es un salto de calidad en mi análisis de Data Quality.

                        Nicolas
                        Participante

                          No conocia el profile column del powerquery.

                          Para una primera instancia en ciencia de datos esta opción es genial ya que obtienes resumen de tus datos e histograma para detectar anomalias.

                          Me gustaria saber a nivel de visualización que se puede usar para representar eso mismo en x columna o si , si o si hay que crear medidas e ir agregando las etiquetas con cada uno de ellas.

                          En la práctica usaba la formula describe e info en python y ahi me migraba un dataframe en excel que lo importaba en power bi….

                          Roberto
                          Participante

                            ¿Qué aprendiste en la sección “Profile the data”?

                            La importancia de ver la calidad del datos desde el inicio. No sabía que estaba la opción de que la estadística incluyera todos los datos.

                            ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                            Tomar como primer paso y con más cuidado el tema de la calidad de los datos.

                            ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                            Es uno de los elementos que se deben conocer para el exámen.

                            dat2168003728
                            Participante

                              Creo que lo mejor es que puedo ver mas de los 1000 primeros datos!!

                              Alejandro
                              Participante

                                Qué aprendiste en la sección “Profile the data”?
                                Herramientas para normalizar los datos, identificar las causas de los errores, el comportamiento de los datos dentro de cada una de las columnas de información.
                                ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
                                Asegurando desde un inicio que la información con la que se empezará a realizar operaciones y demás esté lista, libre de errores.
                                ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
                                Si la información / datos a los que nos conectamos no son de calidad, el trabajo que realizamos tampoco lo será. Debemos prepararlos y conocerlos.

                                Karina
                                Participante

                                  Aprendí herramientas para el analisis de la calidad de los datos y la estimación de las estadísticas que dan informacion sobre le comportamiento de cada variable o columna.

                                  La visual e informacion que se obtiene de los datos con estas herramientas permite al desarrollador hacer una limpieza y transformación de los datos de forma optima.

                                  Los conocimientos adquiridos en esta sección estan relacionados directamente con el tema del examen de certificación “Preparar los datos”, específicamente “Limpiar los datos” para realizar la evaluación de estos, estimar las estadísticas y propiedades de las columnas. Tambien para la resolución de las incoherencias, valores inesperados, errores, entre otros.

                                  Juan
                                  Participante
                                    dlom dijo

                                    ¿Qué aprendiste en la sección “Profile the data”?
                                    ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
                                    ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                                    • En esta sección aprendí a utilizar las herramientas disponibles en Power Query para analizar la calidad de los datos, la distribución de las columnas y el perfil de las columnas.

                                    Mediante la calidad de los datos podemos determinar el % de valores válidos, % de valores con errores y % de valores vacíos.

                                    Con la Distribución de Columnas podemos observar la cantidad de veces que se repiten los valores en nuestras columnas.

                                    Con el Perfil de columnas podemos obtener diferentes valores estadísticos como valores mínimos, máximos, promedios, etc.

                                    • Lo aprendido me servirá para mejorar la calidad de nuestros datos y poner mucha atención para determinar en cuáles posteriormente debemos aplicar procesos de ETL.
                                    • Estos temas y las pruebas realizadas me ayudan a fortalecer los conocimientos necesarios para rendir el examen de certificación.

                                     

                                  Viendo 15 respuestas - de la 46 a la 60 (de un total de 63)
                                  • Debes estar registrado para responder a este debate.