Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”

  • dlom
    Participante

      ¿Qué aprendiste en la sección “Profile the data”?
      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    • KBvYf224
      Participante
        • ¿Qué aprendiste en la sección “Profile the data”?

        Aprendí a analizar la estructuras de las tablas, las anomalías con las que uno puede encontrarse.

        • ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

        En realizar un análisis previo de la estructura de las tablas por los posibles errores o anomalías que no permita otorgar los datos certeros que uno quiere exponer en la organización.

        • ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

        Para poder responder con propiedad las preguntas de todo lo aprendido.

        Fabián Muñoz
        Participante

          Muy interesante el tema para poder evaluar y conocer como están siendo cargados los datos y así determinar si es necesario o no transformar ciertos tipos de datos y/o ver datos erroneos.

          Claudio
          Participante

            Hola a todos,

            En esta sección no sabía como se visualizaban esas columnas verdes en cada columna y como revisar más a fondo las estadisticas de las columnas. Creo que es muy conveniente saber estos tips para identificar rápidamente cualquier anomalía en los datos.

            Saludos.

            Fausto
            Participante

              Buenas, en la sección "Profile the data" aprendí funcionalidades que trae PowerBI y que no conocía. Resultan muy útiles a la hora de comenzar con el armado de un reporte, ya que permiten tener un panorama general de cómo se encuentran los datos a utilizar en el reporte. Estas funcionalidades pueden permitir ahorrar gran cantidad de tiempo haciendo un análisis previo para detectar valores raros, nulos, anómalos en el conjunto de datos.

               

              David
              Participante

                Aprendí que se puede rápidamente evaluar la calidad de los datos, además de ver estadísticas relevantes por columnas. Es una manera sencilla y rápida que da Power BI para perfilar nuestros datos y revisar tanto la calidad como la conveniencia de los mismos.

                 

                Gran lección. Con ganas de más.

                Andrea
                Participante

                  Hola!

                  He aprendido lo siguiente:

                  Identificar anomalías: estas pueden deberse a mala recopilación o puede ser un fenómeno real. En ambos casos hay que explorar más, para corregirlo o para averiguar la razón. Ayudas: diagramas, tablas para visualizar los outliers
                  Data Structures: Tener cuidado del tipo de datos que se asigna a cada columna y que coincida entre las distintas tablas para que las relaciones no se vean afectadas. Columnas que tienen registros tipo "Tabla" o Value" que conecta con una tabla que se puede expandir o un valor que se puede ver.
                  Propiedades de las columnas :Evaluar los datos. Cuando mayor cantidad de valores únicos haya, mayor será el peso del archivo, debido al método de compresión que tiene PBI. Hay métodos para hacer que un archivo de PBI no pese tanto.

                  Las vistas de column profile, distribution and quality son muy útiles para identificar outliers, NAN o algún otro patrón sin necesidad de hacer visualizaciones.
                  Gracias!

                  Andrea
                  Participante

                    Hola,
                    he aprendido lo siguiente:

                    Selección entre Import, Direct Query o Dual: Excel sólo admite Import. Direct Query se puede usar con bbdd, muestras que Import con cualquier fuente de datos. Se usa Direct Query cuando las bbdd son muy grandes o se necesita información en tiempo real.

                    Query folding: Plegado de consultas. Realizar menor número de paso y los pasos que no admiten el plegado de consultas, dejarlos para el final. El plegado de consultas permite que las transformaciones se hagan en el servidor.

                    Parámetros: También en el tema de "Usar parámetros" vimos que los parámetros podíamos utilizarlos para darle más control a nuestros usuarios qué datos íbamos a mostrarles. Se puede hacer templates para que el usuario reciba el PBI y pueda seleccionar un rango de fechas según el parámetro establecido.

                    Use or create PBIDs file: se usa en Data Sources para exportar esa fuente de datos y que los usuarios puedan conectarse al servidor y las tablas sin necesidad de tener credenciales. Pueden entrar, seleccionar las tablas que les interesa, y trabajar haciendo visualizaciones con ellas

                    Query type/Conectores: es la forma en que un se conecta para cargar los datos en PBI. Existen muchas fuentes, las más usadas son SQL o AzureSQL y Excel. Otras más generales son: ODBC o Ole db. Hay una que se llama Folder para cargar varios ficheros a la vez.

                    Un saludo!

                    guillermope_
                    Participante

                      Hola a todos y todas 🙂

                      Me gustan mucho las opciones de perfilado de columnas, distribución y calidad porque permiten conocer características importantes del conjunto de datos con apenas un par de clics.

                    Viendo 8 respuestas - de la 61 a la 68 (de un total de 68)
                    • Debes estar registrado para responder a este debate.