Aprendizajes de la sección “Perform Advanced Analysis” del módulo “Analyze the data”:

  • dlom
    Participante

      ¿Qué aprendiste en la sección “Perform Advanced Analysis”?
      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    • Isidre
      Espectador

        :loudspeaker:Esta parte de “advanced analysis” es muy nueva para mí. Todo lo visto ha sido una novedad en el tránsito al DA-100.

        • Detectar los “outliers” es crítico si después queremos disponer de los reportes limpios de elementos que puedan desvirtuar nuestra toma de decisiones. Sin duda es un paso previo a los informes muy importante. Por otra parte, también es importante para determinar comportamientos anómalos y que no corresponden a errores en los datos.
        • Creación de grupos en “lists” o “bins”, dependiendo si los datos son categóricos o continuos (números o fechas).
        • Disponemos de gráficos que nos permiten añadir distintas herramientas analíticas, entre ellas el forecasting. Dependiendo de la configuración del visual, se nos mostraran unas u otras. Debemos ser muy cuidadosos con el formato de las columnas que queramos agrupar en jerarquías, además de evitar usar el calendario por defecto. De ello dependerá que dispongamos de más o menos opciones. Muy útil la utilización de “play axis” para ver la evolución de una magnitud en el tiempo.
        • El visual “Key Influencers” nos permite determinar qué elementos clave están afectando al comportamiento de la métrica u otro elemento que queremos analizar.
          Podremos explicar la incidencia de un elemento sobre otro, siempre y cuando pertenezca a la misma tabla o esté relacionada con la que contiene al que debamos analizar. Los algoritmos utilizados detrás del cálculo no son controlables por el usuario, es el propio “engine” que dependiendo de la muestra y del tipo de datos aplicará uno u otro.
          Cuando analizamos el efecto sobre un campo de tabla no numérico, se aplica línea a línea, por tanto, no podemos expandir (Expand by) la muestra incorporando más variables. Sólo cuando el elemento a analizar es una medida o una columna numérica, será conveniente utilizar ese apartado para ampliar la muestra.
        • El visual “Decomposition Tree” es más intuitivo i fácil de manejar, pero no por ello menos potente. Nos permite ir desglosando una medida por los diferentes elementos que influyen en ella, podemos llegar al detalle deseado y encontrar valores en los extremos, de entre todos los campos incluidos en “Explain by”. La AI se encarga de encontrar en cuál de los campos se encuentra ese extremo.
        • Diferentes opciones de aplicar el Machine Learning, gracias a los algoritmos incluidos en Power bi. Algunas características sólo disponibles con la capacidad premium.

        :moneybag:Espero añadir valor en los futuros desarrollos. A fecha de hoy, no había utilizado casi ninguna de las opciones que nos ofrece aplicar “AI insights”.

        :firecracker:Antes del examen habrá que volver a revisar esta sección, nunca sabes qué parte del temario puede provocar un descalabro.

        chaffardet
        Espectador

          Buenas noches:

          Interesante todas las funciones de análisis que ofrece la herramienta:

          ¿Qué aprendiste en la sección “Perform Advanced Analysis”?
          Que conocer estas herramientas pueden ofrece run valor agregado a los reportes.

          ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
          Aunque no los he utilizado, el de Decomposition Tree sería un excelente ejemplo para entender como se distribuyen los datos, junto a Outliers, list y Bins,

          ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
          Como todo el temario, será necesario ir revisando hasta tenerlo claro antes de ir al examen.

          jburrull
          Espectador

             

            • Aprendí a identificar outliers con objeto visual de dispersión
            • Usar list y bins para trabajar con datos categóricos y continuos a discretizar
            • Usar series de tiempo para hacer predicciones
            • Usar key influencers para ver qué dimensiones afectan más al modelo o métrica analizada
            • Usar decomposition tree para navegar por las dimensiones explicando alguna métrica seleccionada
            • Aplicar AI Insights para ver los elementos que mas o menos influyen en el estudio de alguna métrica
            llopez
            Espectador

              Buenas tardes:

              Resumen de lo aprendido en esta sección:

              • Como ya habíamos visto en alguna sección anterior, es muy importante la identificación de posibles outliers, identificar estos datos atípicos, nos permitirá que no mostremos información distorsionada.
              • La creación de lists (a nivel categoría) o bins (para valores continuos; grupo de rangos), hacer un histograma con discretizar
              • Time series analysis: analizar datos en base a la dim tiempo, realizar forescat o previsiones, ir evaluando con lo resultados que ya pasaron (reduciendo unos puntos) para encontrar una similitud e ir encontrando la proyección optima
              • Los elementos influyentes clave, nos muestra que factores están influyendo para que haya una disminución o aumento de determinado campo que estamos analizando
              • La descomposición tree, para el desglose de una medida, es a nivel jerárquico y se puede evaluar los campos que tenemos y sus resultados
              • Finalmente los AI insights, en definitiva la parte de IA esta muy demandada en la actualidad, considero que es un apartado muy amplio por explorar.

              Saludos

              Isidre
              Espectador

                Estoy revisando el visual “Key Influencers” y la línea del gráfico de color rojizo que nos muestra “Average excluding selected” debería cambiar el valor a medida que vamos seleccionando los valores de la izquierda, los de las burbujas, que nos muestran los influenciadores.
                La cuestión es que no lo hace y no tiene sentido, pues bien dice que ese “average” excluye la Key seleccionada.

                ¿Alguien lo ha probado? En cualquier caso o no soy capaz de ver donde está mi error o no entiendo su funcionamiento.

                Un saludo a tod@s

                josses
                Espectador

                  Me fue muy útil e interesante, la utilizacion de un diagrama de dispersión, una tabla y los slicers para tener un pantallazo de los datos y encontrar los outliers.
                  El uso de list y bin en gráficos de dispersión y de barras, con el objetivo de aislar grupos de datos, nos dan también una imagen muy importante para el análisis de distintas variables en esos datos y lo considero de mucha utilidad. Por supuesto que la misma se va dando con la aplicación de esta técnica.
                  Las funciones de inteligencia artificial como las predicciones o forecast, así como los gráficos Key influencers y el Decomposition Tree no los conocía y realmente me sorprendieron por los datos interesantes que podemos sacar de ellos, así como la forma de iniciar un análisis de nuestro data set o de ver el flujo de la información en los mismos.
                  Fue una sección realmente muy interesante.

                  jluis
                  Espectador

                    Esta sección es muy importante y aunque alguno de los elementos los había visto por encima, nunca había entrado a analizar el potencial que podemos conseguir con ellos. Como analistas de datos no solo se nos pide modelar los datos y preparar algunas visualizaciones, también debemos ser capaces de analizar los datos con los que trabajamos para encontrar datos que no sean del todo correctos, encontrar correlaciones que otros no han sido capaces… Y esta sección nos ayuda a ello de la siguiente forma:

                    • Encontrando los outliers, esos datos atípicos que debemos identificar, aislar y analizar su procedencia.
                    • Podemos crear distintas listas o bins (discretizaciones) según el tipo del dato.
                    • Realizar un forecast para intentar predecir como se va a comportar un dato en el futuro.
                    • Key influencers para encontar los elementos influyentes clave. Esto nos permite identificar si hay elementos que tengan un impacto relevante en el desempeño de una medida.
                    • La opción que más me ha gustado que ha sido la del Decomposition tree, que nos permite un gran análisis de una medida, incluso para los usuarios finales sin tener un gran conocimiento de Power BI.
                    • El resto de AI Insights, algunos de ellos solo disponibles en versión Premium. También es muy útil la opción de realizar los clusters de forma automática a nuestros datos.

                    Una sección menos y el examen ya está más cerca :slight_smile:

                    KevinRoger
                    Participante

                      ¿Qué aprendiste en la sección “Perform Advanced Analysis”?

                      1. Identificar outliers
                      2. Qué son y como se usan los grupos “Lists” y “Bins
                      3. Desarrollar “Time series analysis”
                      4. Uso de “Key Influencers” para explorar variaciones dimensionales
                      5. Usar la visualización “Descomposition tree”
                      6. Uso de la técnica de Cluster

                      ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                      1.Identificar outliers

                      • Primero es importante recordar que le llamamos outliers a las anomalías que existen en nuestros datos.
                      • Una de las estrategias para tratar los outliers es aislarlos, para luego investigar a qué se debe su aparición y al encontrarlos y analizarlos puedo generar gran impacto en el negocio
                      • Es recomendable usar un gráfico de dispersión para detectar el dato atípico y agregar una tabla que nos muestre el detalle del dato que sobresale.

                       

                      2.Qué son y cómo se usan los grupos “Lists” y “Bins

                      • Lists: usados para trabajar datos categóricos
                      • Bins: usados para trabajar datos continuos

                       

                      3.Desarrollar “Time series analysis”

                      • Este es un tipo de análisis que se lleva a cabo con un gráfico de líneas donde el eje x corresponderá al campo de Fecha.
                      • Para este tipo de análisis se utiliza opción Forecast, cuyo objetivo es ver cómo se comportará en el futuro el dato analizado

                       

                       

                      • En este tipo de visualización se puede: definir cuantos puntos visualizar a futuro, intervalo de confianza y definir cuantos puntos del periodo real ignorar.
                        .
                        .
                        .

                      4.Uso de “Key Influencers” para explorar variaciones dimensionales

                      • Esta herramienta nos ayuda a detectar el datos o elementos que están teniendo un mayor impacto para explicar el comportamiento de la medida que se esta analizando, mostrando si afecta de manera positiva o negativa, si es que tiene un impacto realmente relevante en la medida.

                      .
                      .

                      5.Usar la visualización “Descomposition tree”

                      • El objetivo de esta herramienta es ubicar dónde se tiene la mayor incidencia que está afectando el desempeño de la organización de manera positiva o negativa.

                      • Esta visualización es recomendable trabajarla con medidas a nivel de % para que la visualización pueda utilizar su IA para recomendar el campo que realmente a nivel jerárquico es relevante y afecta positivo o negativamente.

                      .
                      .

                      6.Uso de la técnica de Cluster

                      • Esta técnica permite identificar un segmento de datos que sean similares entre ellos pero muy diferentes al resto de los otros datos.
                      • La gracias de esta técnica es que se crea una columna que segmenta por N° de Cluster y estos se pueden utilizar para graficar en un gráfico de dispersión.
                        .
                        .

                      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                        • Siento que el objetivo de esta sección y por la cual nos sirve para la certificación, es el hecho de saber hacer un análisis profundo de los datos y así lograr encontrar datos atípicos que pueden ayudarnos a encontrar errores en la data, problemas con el rendimiento con el vendedor o de otra manera también descubrir un punto positivo que se puede replicar y así mejorar el rendimiento de la empresa.
                      cesar.chunga.saavedr
                      Participante

                        ¿Qué aprendiste en la sección “Perform Advanced Analysis”?
                        Aprendí que la funcionalidad de Analyze en algunos gráficos nos permite analizar distintas distribuciones de nuestros datos.
                        Aprendí que la mejor visualización para detectar outliers o valores atípicos es con el diagrama de dispersión o scatter plots.
                        Aprendí a utilizar a más a fondo de decomposition tree o árbol de descomposición o diagrama de arbol; el objetivo es desglozar una medida en valor mas alto o valor mas bajo incentivando la exploración de los indicadores y realizar un análisis de causa raíz.
                        Aprendí la función AI Insigths que tiene la visualización decomposition tree cuyo objetivo es analizar todos los campos disponibles y determinar cual mostrarnos a continuación para obtener el valor mas alto o bajo de la medida que estamos analizando.

                        ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
                        Me servirá para analizar mas a detalle mi información y más si tengo valores atípicos.
                        Explotaré mas estas visualizaciones de análisis.

                        ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
                        Me sirve un montón, sentirme seguro a estas instancias es primoridal para rendir la certificación.

                        Aguizote01
                        Espectador

                          Para esta sección aprendí de la variedad que herramientas de IA que ofrece power BI tanto en versión desktop como la del service , la manera en como podemos encontrar los valores atípicos.
                          El tema de la predicción ( forecast ) me parecio excelente y más cuando se combina con la visualización de Play Axis ,
                          Tampoco menos importante mencionar de la creación de los grupos “List” y “Bins” donde categorizamos, siento que a este tema le falto un poco más con ejemplos reales de la vida real pero es bueno saberlo y nos guía para propio autoconocimiento al igual que los Key Influencers.

                          El tema de “Decomposition Tree” es interesante en el como la IA trabajo sobre métrica a analizar y desglose por mayor o menor dependiendo de lo que busquemos.

                          A seguir estudiando :smiley:

                          dennysSalazar117
                          Participante

                            Saludos, del tema “Técnicas avanzadas de análisis” he concluido lo siguiente:

                             

                            Los valores atípicos son aquellos que presentan un comportamiento distinto al resto. Al usar herramientas de visualización se pueden detectar, agrupar e ir a un análisis más profundo. Según sea el caso, se usarán más herramientas, medidas o lo que haga falta para entender que está pasando con ese o el conjunto de valores distintos que se puedan presentar.

                             

                            Las herramientas de IA son el futuro para cualquier tema, negocio, etc. Buscan facilitar para este caso los análisis, extraer datos importantes, generar visualizaciones interactivas.

                            dat2194862088
                            Participante
                              dlom dijo

                              ¿Qué aprendiste en la sección “Perform Advanced Analysis”?

                              En esta sección pude ver con más detalle las funcionalidades de los gráficos de análisis de datos y su uso, dependiendo el tipo de requerimiento.

                              ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

                              Este tema me será muy útil al momento que tenga que elegir el grafico para analizar los datos.

                              ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

                              Espero ahora poder elegir con más certeza las respuestas relacionadas con gráficos

                               

                               

                              Héctor Vicente Delgado
                              Participante

                                ¿Que he aprendido en la sección “Técnicas avanzadas de análisis”?

                                -Saber que es un outlier, como identificarlo (a través de visualizaciones) y aislarlo para analizarlo posteriormente.

                                -Crear listas y grupos y entender las diferencias. En las listas trabajaremos con datos categóricos, y en los grupos trabajaremos con valores continuos, con rangos.
                                Podemos crearlos gracias a las visualizaciones.

                                -Analizar datos en función de la dimensión del tiempo. Esto nos servirá para identificar tendencias y hacer pronósticos.
                                Una herramienta para ello es el objeto visual Play Axis, la cual nos creará una visualización animada.

                                -Utilizar la visualización de elementos influyentes clave para descubrir los elementos que mas impacto están generando.
                                Esta visualización trabaja con elementos de IA.

                                -Descubrir el objeto visual de esquema jerárquico para desglosar medidas. Este visual puede trabajar con columnas y con medidas.
                                Podemos desglosar el análisis por cualquiera de los valores que hayamos incluido y también identificando el valor mas elevado y el mínimo.
                                Esto nos ayuda a detectar donde esta el problema en el desempeño de la organización.

                                -Agrupar los clusters para identificar segmentos de datos similares entre ellos pero diferentes al resto. Con ello podemos juntar y aislar grupos de datos. La visualización detecta automáticamente los clusters y tu decides que cantidad de ellos quieres.

                                Nicolas
                                Participante

                                  Los graficos de IA realmente te hacen enamorar más de la herramienta.

                                  Podes encontrar insights que ni sabias que existian y por otro lado generar este tipo de graficos , sumados al de dispersion agrupando en clusters le das más profundidad a tus datos y aportas un mayor valor a la empresa para tomar decisiones correctas.

                                  Juan
                                  Participante

                                    Muy interesante esta seccion sobre todo xq no conocia algunas funcionalidades como Analyze en ciertos gráficos nos permite analizar distintas distribuciones de nuestros datos. Emplear el scatter plott para Identificar outliers. La ayuda y ahorro de tiempo que te pueden dar las funcionalidades de Q&A y finalmente usar el decomposition tree para desglosar una medida entre valor más alto o valor más bajo, dependiendo de lo que estemos analizando o buscando. Esto nos permite incentivar la exploración de los indicadores y realizar un análisis de causa raíz.

                                  Viendo 15 respuestas - de la 1 a la 15 (de un total de 16)
                                  • Debes estar registrado para responder a este debate.