Aprendizajes de la sección “Perform Advanced Analysis” del módulo “Analyze the data”:

  • Diego
    Participante

    ¿Qué aprendiste en la sección “Perform Advanced Analysis”?
    ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
    ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

  • Isidre

      :loudspeaker:Esta parte de “advanced analysis” es muy nueva para mí. Todo lo visto ha sido una novedad en el tránsito al DA-100.

      • Detectar los “outliers” es crítico si después queremos disponer de los reportes limpios de elementos que puedan desvirtuar nuestra toma de decisiones. Sin duda es un paso previo a los informes muy importante. Por otra parte, también es importante para determinar comportamientos anómalos y que no corresponden a errores en los datos.
      • Creación de grupos en “lists” o “bins”, dependiendo si los datos son categóricos o continuos (números o fechas).
      • Disponemos de gráficos que nos permiten añadir distintas herramientas analíticas, entre ellas el forecasting. Dependiendo de la configuración del visual, se nos mostraran unas u otras. Debemos ser muy cuidadosos con el formato de las columnas que queramos agrupar en jerarquías, además de evitar usar el calendario por defecto. De ello dependerá que dispongamos de más o menos opciones. Muy útil la utilización de “play axis” para ver la evolución de una magnitud en el tiempo.
      • El visual “Key Influencers” nos permite determinar qué elementos clave están afectando al comportamiento de la métrica u otro elemento que queremos analizar.
        Podremos explicar la incidencia de un elemento sobre otro, siempre y cuando pertenezca a la misma tabla o esté relacionada con la que contiene al que debamos analizar. Los algoritmos utilizados detrás del cálculo no son controlables por el usuario, es el propio “engine” que dependiendo de la muestra y del tipo de datos aplicará uno u otro.
        Cuando analizamos el efecto sobre un campo de tabla no numérico, se aplica línea a línea, por tanto, no podemos expandir (Expand by) la muestra incorporando más variables. Sólo cuando el elemento a analizar es una medida o una columna numérica, será conveniente utilizar ese apartado para ampliar la muestra.
      • El visual “Decomposition Tree” es más intuitivo i fácil de manejar, pero no por ello menos potente. Nos permite ir desglosando una medida por los diferentes elementos que influyen en ella, podemos llegar al detalle deseado y encontrar valores en los extremos, de entre todos los campos incluidos en “Explain by”. La AI se encarga de encontrar en cuál de los campos se encuentra ese extremo.
      • Diferentes opciones de aplicar el Machine Learning, gracias a los algoritmos incluidos en Power bi. Algunas características sólo disponibles con la capacidad premium.

      :moneybag:Espero añadir valor en los futuros desarrollos. A fecha de hoy, no había utilizado casi ninguna de las opciones que nos ofrece aplicar “AI insights”.

      :firecracker:Antes del examen habrá que volver a revisar esta sección, nunca sabes qué parte del temario puede provocar un descalabro.

      chaffardet

        Buenas noches:

        Interesante todas las funciones de análisis que ofrece la herramienta:

        ¿Qué aprendiste en la sección “Perform Advanced Analysis”?
        Que conocer estas herramientas pueden ofrece run valor agregado a los reportes.

        ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
        Aunque no los he utilizado, el de Decomposition Tree sería un excelente ejemplo para entender como se distribuyen los datos, junto a Outliers, list y Bins,

        ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
        Como todo el temario, será necesario ir revisando hasta tenerlo claro antes de ir al examen.

        jburrull

           

          • Aprendí a identificar outliers con objeto visual de dispersión
          • Usar list y bins para trabajar con datos categóricos y continuos a discretizar
          • Usar series de tiempo para hacer predicciones
          • Usar key influencers para ver qué dimensiones afectan más al modelo o métrica analizada
          • Usar decomposition tree para navegar por las dimensiones explicando alguna métrica seleccionada
          • Aplicar AI Insights para ver los elementos que mas o menos influyen en el estudio de alguna métrica
          llopez

            Buenas tardes:

            Resumen de lo aprendido en esta sección:

            • Como ya habíamos visto en alguna sección anterior, es muy importante la identificación de posibles outliers, identificar estos datos atípicos, nos permitirá que no mostremos información distorsionada.
            • La creación de lists (a nivel categoría) o bins (para valores continuos; grupo de rangos), hacer un histograma con discretizar
            • Time series analysis: analizar datos en base a la dim tiempo, realizar forescat o previsiones, ir evaluando con lo resultados que ya pasaron (reduciendo unos puntos) para encontrar una similitud e ir encontrando la proyección optima
            • Los elementos influyentes clave, nos muestra que factores están influyendo para que haya una disminución o aumento de determinado campo que estamos analizando
            • La descomposición tree, para el desglose de una medida, es a nivel jerárquico y se puede evaluar los campos que tenemos y sus resultados
            • Finalmente los AI insights, en definitiva la parte de IA esta muy demandada en la actualidad, considero que es un apartado muy amplio por explorar.

            Saludos

            Isidre

              Estoy revisando el visual “Key Influencers” y la línea del gráfico de color rojizo que nos muestra “Average excluding selected” debería cambiar el valor a medida que vamos seleccionando los valores de la izquierda, los de las burbujas, que nos muestran los influenciadores.
              La cuestión es que no lo hace y no tiene sentido, pues bien dice que ese “average” excluye la Key seleccionada.

              ¿Alguien lo ha probado? En cualquier caso o no soy capaz de ver donde está mi error o no entiendo su funcionamiento.

              Un saludo a [email protected]

              josses

                Me fue muy útil e interesante, la utilizacion de un diagrama de dispersión, una tabla y los slicers para tener un pantallazo de los datos y encontrar los outliers.
                El uso de list y bin en gráficos de dispersión y de barras, con el objetivo de aislar grupos de datos, nos dan también una imagen muy importante para el análisis de distintas variables en esos datos y lo considero de mucha utilidad. Por supuesto que la misma se va dando con la aplicación de esta técnica.
                Las funciones de inteligencia artificial como las predicciones o forecast, así como los gráficos Key influencers y el Decomposition Tree no los conocía y realmente me sorprendieron por los datos interesantes que podemos sacar de ellos, así como la forma de iniciar un análisis de nuestro data set o de ver el flujo de la información en los mismos.
                Fue una sección realmente muy interesante.

                jluis
                Participante

                  Esta sección es muy importante y aunque alguno de los elementos los había visto por encima, nunca había entrado a analizar el potencial que podemos conseguir con ellos. Como analistas de datos no solo se nos pide modelar los datos y preparar algunas visualizaciones, también debemos ser capaces de analizar los datos con los que trabajamos para encontrar datos que no sean del todo correctos, encontrar correlaciones que otros no han sido capaces… Y esta sección nos ayuda a ello de la siguiente forma:

                  • Encontrando los outliers, esos datos atípicos que debemos identificar, aislar y analizar su procedencia.
                  • Podemos crear distintas listas o bins (discretizaciones) según el tipo del dato.
                  • Realizar un forecast para intentar predecir como se va a comportar un dato en el futuro.
                  • Key influencers para encontar los elementos influyentes clave. Esto nos permite identificar si hay elementos que tengan un impacto relevante en el desempeño de una medida.
                  • La opción que más me ha gustado que ha sido la del Decomposition tree, que nos permite un gran análisis de una medida, incluso para los usuarios finales sin tener un gran conocimiento de Power BI.
                  • El resto de AI Insights, algunos de ellos solo disponibles en versión Premium. También es muy útil la opción de realizar los clusters de forma automática a nuestros datos.

                  Una sección menos y el examen ya está más cerca :slight_smile:

                  KevinRoger
                  Participante

                    ¿Qué aprendiste en la sección “Perform Advanced Analysis”?

                    1. Identificar outliers
                    2. Qué son y como se usan los grupos “Lists” y “Bins
                    3. Desarrollar "Time series analysis"
                    4. Uso de “Key Influencers” para explorar variaciones dimensionales
                    5. Usar la visualización "Descomposition tree"
                    6. Uso de la técnica de Cluster

                    ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                    1.Identificar outliers

                    • Primero es importante recordar que le llamamos outliers a las anomalías que existen en nuestros datos.
                    • Una de las estrategias para tratar los outliers es aislarlos, para luego investigar a qué se debe su aparición y al encontrarlos y analizarlos puedo generar gran impacto en el negocio
                    • Es recomendable usar un gráfico de dispersión para detectar el dato atípico y agregar una tabla que nos muestre el detalle del dato que sobresale.

                     

                    2.Qué son y cómo se usan los grupos “Lists” y “Bins

                    • Lists: usados para trabajar datos categóricos
                    • Bins: usados para trabajar datos continuos

                     

                    3.Desarrollar "Time series analysis"

                    • Este es un tipo de análisis que se lleva a cabo con un gráfico de líneas donde el eje x corresponderá al campo de Fecha.
                    • Para este tipo de análisis se utiliza opción Forecast, cuyo objetivo es ver cómo se comportará en el futuro el dato analizado

                     

                     

                    • En este tipo de visualización se puede: definir cuantos puntos visualizar a futuro, intervalo de confianza y definir cuantos puntos del periodo real ignorar.
                      .
                      .
                      .

                    4.Uso de “Key Influencers” para explorar variaciones dimensionales

                    • Esta herramienta nos ayuda a detectar el datos o elementos que están teniendo un mayor impacto para explicar el comportamiento de la medida que se esta analizando, mostrando si afecta de manera positiva o negativa, si es que tiene un impacto realmente relevante en la medida.

                    .
                    .

                    5.Usar la visualización "Descomposition tree"

                    • El objetivo de esta herramienta es ubicar dónde se tiene la mayor incidencia que está afectando el desempeño de la organización de manera positiva o negativa.

                    • Esta visualización es recomendable trabajarla con medidas a nivel de % para que la visualización pueda utilizar su IA para recomendar el campo que realmente a nivel jerárquico es relevante y afecta positivo o negativamente.

                    .
                    .

                    6.Uso de la técnica de Cluster

                    • Esta técnica permite identificar un segmento de datos que sean similares entre ellos pero muy diferentes al resto de los otros datos.
                    • La gracias de esta técnica es que se crea una columna que segmenta por N° de Cluster y estos se pueden utilizar para graficar en un gráfico de dispersión.
                      .
                      .

                    ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                      • Siento que el objetivo de esta sección y por la cual nos sirve para la certificación, es el hecho de saber hacer un análisis profundo de los datos y así lograr encontrar datos atípicos que pueden ayudarnos a encontrar errores en la data, problemas con el rendimiento con el vendedor o de otra manera también descubrir un punto positivo que se puede replicar y así mejorar el rendimiento de la empresa.
                    cesar.chunga.saavedr
                    Participante

                      ¿Qué aprendiste en la sección “Perform Advanced Analysis”?
                      Aprendí que la funcionalidad de Analyze en algunos gráficos nos permite analizar distintas distribuciones de nuestros datos.
                      Aprendí que la mejor visualización para detectar outliers o valores atípicos es con el diagrama de dispersión o scatter plots.
                      Aprendí a utilizar a más a fondo de decomposition tree o árbol de descomposición o diagrama de arbol; el objetivo es desglozar una medida en valor mas alto o valor mas bajo incentivando la exploración de los indicadores y realizar un análisis de causa raíz.
                      Aprendí la función AI Insigths que tiene la visualización decomposition tree cuyo objetivo es analizar todos los campos disponibles y determinar cual mostrarnos a continuación para obtener el valor mas alto o bajo de la medida que estamos analizando.

                      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
                      Me servirá para analizar mas a detalle mi información y más si tengo valores atípicos.
                      Explotaré mas estas visualizaciones de análisis.

                      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
                      Me sirve un montón, sentirme seguro a estas instancias es primoridal para rendir la certificación.

                      Aguizote01

                        Para esta sección aprendí de la variedad que herramientas de IA que ofrece power BI tanto en versión desktop como la del service , la manera en como podemos encontrar los valores atípicos.
                        El tema de la predicción ( forecast ) me parecio excelente y más cuando se combina con la visualización de Play Axis ,
                        Tampoco menos importante mencionar de la creación de los grupos “List” y “Bins” donde categorizamos, siento que a este tema le falto un poco más con ejemplos reales de la vida real pero es bueno saberlo y nos guía para propio autoconocimiento al igual que los Key Influencers.

                        El tema de “Decomposition Tree” es interesante en el como la IA trabajo sobre métrica a analizar y desglose por mayor o menor dependiendo de lo que busquemos.

                        A seguir estudiando :smiley:

                      Viendo 10 respuestas - de la 1 a la 10 (de un total de 10)
                      • Debes estar registrado para responder a este debate.