Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”

  • dlom
    Participante

      ¿Qué aprendiste en la sección “Profile the data”?
      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    • mgallegos
      Espectador

        Buenas tardes, con todos.
        Primero comentar que parece buenísimmo el curso y estoy muy contento de estar aquí con usted.

        Este tema me resultó muy interesantes, ya que sin necesidad de crear metricas ni fórmulas, se puede analizar la calidad de los datos y detectar cualquier iregularidad en los mismos.

        En lo personal nunca habia usado estas opciones. De ahora en adelante ya no será así.

        amazona_007
        Espectador

          Esta sección “Profile the data” me proveyó de otras opciones para validación de datos rápida. Ahora usaré ese tipo de gráficos con esa intensión. Además las preguntas me ayudan a enfocarme en respuestás concretas. ¡Gracias!

          Aguizote01
          Espectador

            Dan consejos y son certeros en el tema a explicar, sobre todo comprensibles, ahora conozco más a fondo la utilidad de est

            a herramienta al momento de validar los datos.

            Lo único que note que al editar la fuente de datos en excel ( agregando un nuevo valor ) y actualizando , el grafico de distribución en Column Profile no me lo mostraba hasta que filtre los datos en la columna.

            De allí mencionar que los test al final de cada sesión te ayudan a darte idea del examen y que no todo lo que esta seleccionado quiere decir que la pregunta haga referencia a ese campo.

            GinoP
            Espectador

              De la sección “Profile the data” puedo rescatar el análisis de las posibles anomalías que podemos que pueden aparecer dentro de los registros importados desde nuestra fuente de información.
              Súper útil!

              Aguizote01
              Espectador

                Adicional he visto en preguntas del examen de certificación que tratan temas de transformación con múltiples archivos desde sharepoint online, filtrando por el path, sería bueno que agregaran unos videos haciendo referencia a a eso y a como trabajar con los archivos JSON que también vienen incluidos en el examen para tener una mejor orientación y sobre todo para los futuros alumnos.

                RSantiago
                Espectador

                  Hola a todos :grin:

                  Lo que mas me gusto de esta sección fue el uso del grafico de dispersion para poder identificar las anomalías. Es una forma rápida y fácil de analizar las posibles discrepancias que pudieran presentarse en la data.

                  Isidre
                  Espectador

                    Hola David,

                    Tal como yo lo veo, el hecho de tener activas cualquiera de las tres opciones de visualización (o las tres a la vez), no va a afectar al rendimiento del modelo ni a su tamaño. Ten en cuenta que cuando estás en Power Query Editor, lo que ves es el resultado del código M que se ejecuta detrás y no es hasta que decides clicar en “Close & Apply” que se cargan las tablas (las que tienen “Enabled Load” activado) al modelo.
                    Por tanto, una vez estés en el canvas, cuando refresques el modelo, el hecho de que las tres opciones que comentas estén o no activadas no tendrán ninguna incidencia en su rendimiento. Esto es así, tanto en el refresco de los datos de origen, como en las visualizaciones que vayas incorporando al informe.

                    Otra cosa es como afecte dentro del Power Query Editor estando abierto. Cada una de las opciones requiere un análisis de los datos y sí afectará al tiempo requerido, de la misma manera que si solicitas que este análisis lo limite a las mil primeras filas o la tabla entera.

                    Dicho esto, una vez cerrado el Power Query Editor, ya no debería tener ninguna incidencia ni en el refresco, ni el rendimiento, ni en el tamaño del pbix.

                    Espero haber aclarado la duda.

                    Un saludo.

                    cesar.chunga.saavedr
                    Participante

                      ¿Qué aprendiste en la sección “Profile the data”?
                      Aprendí que en cualquier BD puedo encontrar anomalías y se pueden originar porque se capturó mal un dato o porque hay un comportamiento erróneo en los datos.
                      Lo experiencia como analista de datos me va dar la habilidad de detectar rápidamente las anomalías que se pueden presentar y que solución se puede dar.
                      Es importante mencionar que un analista de datos no es solo la persona de sistemas sino que puede ser cualquier usuario sea financiero, logístico, de gestión humana entre otros.

                      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
                      Me servirá a tener mas seguridad cuando trabaje con BD estadísticamente grandes para la herramienta y saberlos controlar de la mejor manera.

                      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
                      Me servirá muchísimo; considero que mas importantes la teoría que la práctica para poder entender lo que uno está haciendo.

                      Hurodebe
                      Espectador

                        Buenos días con todos,

                        La sección “Get data from different sources” me permitió conocer más herramientas de PowerBI para poder analizar nuestra data de entrada.

                        Servirá para tener métricas de nuestra información a primera mano de las tablas de datos.

                        Me servirá para tener familiaridad con los nuevos términos.

                        chaffardet
                        Espectador

                          Buenos días,

                          La sección de Outliers estuvo muy bien, me gustó mucho el Column Properties, aporta mucha información y así no te enteras de errores en tus datos cuando armas el modelo y ves que no funciona (ya he estado ahí).

                          Saludos

                          sfnavarrete
                          Espectador

                            Mis Outliers los verifico con sentencias SQL pero me parecio excelente como los indetificamos desde Power BI con la visualización de Scatter Chart.

                            Lo que aprendí es sobre donde debo cambiar (Column profling based on entire data set) para tener todos los datos en Power Query. Claro es importante saber el tamaño de los registros que existe en la tabla.

                            Saludos,
                            Santiago

                            minervamar
                            Espectador

                              Esta sección nos permitirá poder ver desde un inicio la calidad de nuestros datos y de esta manera el resultado pueda ser mas preciso.
                              De esta manera podemos depurarla o prepararla aun mejor para llevar a cabo nuestros análisis.

                              SALUDOS A TODOS

                              Carlos_Figueroa
                              Espectador
                                • ¿Qué aprendiste en la sección “Profile the data”?
                                  Resp. Herramientas para normalizar los datos fáciles de usar, de rápida visualización que ahorran mucho tiempo y son esenciales para disponer de tablas de datos limpias y confiables para trabajar.
                                • ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
                                  Resp. Considero que lo importante es la rigurosidad del trabajo previo de normalización y revisión de los datos para no llegar después a conclusiones erróneas.
                                • ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
                                  No puedes hacer un trabajo de calidad si los datos vienen con problemas de base, deberían haber preguntas relacionadas con estos conceptos porque son muy importantes.
                                rcuevas
                                Espectador

                                  Buen día.

                                  ¿Qué aprendiste en la sección “Profile the data”?

                                  Lo importante de detectar anomalías en los datos

                                  ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                                  Buenas practicas y utilizar mas las herramientas que trae por default power bi para preparar los datos

                                  ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                                  Definitivamente lo explicado en esta sección servirá para el examen ya que ayuda a comprender cómo preparar la calidad de los datos.

                                  Saludos…

                                  KevinRoger
                                  Participante

                                    ¿Qué aprendiste en la sección “Profile the data”?

                                    • Métodos para validar que los datos de las tablas vienen limpios e identificar outliers.
                                    • Utilizar el editor de consultas para evaluar la calidad de los datos con los que trabajaré.
                                    • Por último interrogar las propiedades de las columnas de las tablas con las que se quiere trabajar.

                                    ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                                    • En primer lugar hacer una validación de tus datos, ayudará a que tengas certeza en que los resultados que presentarás son válidos.
                                    • Evaluar la calidad de los datos también me servirá mucho para tener una previsualización de si hay existencia de datos con error, vacíos o válidos y también ver cuantos valores son distintos y/o únicos.
                                    • Junto con lo anterior también tomar en cuenta que si hay campos que no necesitaré o que no son relevantes para el desarrollo de mis dashboard, mientras mayor datos únicos tengan estos campos, más pesado será el archivo.

                                    ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                                    • Yo creo que una de las cosas que el examen será muy exigente, es en que demostremos que podemos ser capaces de tener pensamiento crítico al momento de recibir archivos con los que debemos trabajar, cuestionarnos si realmente están o no correctos sus datos, tomando en cuenta que si este primer paso no lo realizamos, traerá consecuencias graves al momento de presentar resultados.
                                  Viendo 15 respuestas - de la 16 a la 30 (de un total de 63)
                                  • Debes estar registrado para responder a este debate.