Aprendizajes de la sección “Perform Advanced Analysis” del módulo “Analyze the data”:

KevinRoger
Participante

¿Qué aprendiste en la sección “Perform Advanced Analysis”?

  1. Identificar outliers
  2. Qué son y como se usan los grupos “Lists” y “Bins
  3. Desarrollar "Time series analysis"
  4. Uso de “Key Influencers” para explorar variaciones dimensionales
  5. Usar la visualización "Descomposition tree"
  6. Uso de la técnica de Cluster

¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

1.Identificar outliers

  • Primero es importante recordar que le llamamos outliers a las anomalías que existen en nuestros datos.
  • Una de las estrategias para tratar los outliers es aislarlos, para luego investigar a qué se debe su aparición y al encontrarlos y analizarlos puedo generar gran impacto en el negocio
  • Es recomendable usar un gráfico de dispersión para detectar el dato atípico y agregar una tabla que nos muestre el detalle del dato que sobresale.

 

2.Qué son y cómo se usan los grupos “Lists” y “Bins

  • Lists: usados para trabajar datos categóricos
  • Bins: usados para trabajar datos continuos

 

3.Desarrollar "Time series analysis"

  • Este es un tipo de análisis que se lleva a cabo con un gráfico de líneas donde el eje x corresponderá al campo de Fecha.
  • Para este tipo de análisis se utiliza opción Forecast, cuyo objetivo es ver cómo se comportará en el futuro el dato analizado

 

 

  • En este tipo de visualización se puede: definir cuantos puntos visualizar a futuro, intervalo de confianza y definir cuantos puntos del periodo real ignorar.
    .
    .
    .

4.Uso de “Key Influencers” para explorar variaciones dimensionales

  • Esta herramienta nos ayuda a detectar el datos o elementos que están teniendo un mayor impacto para explicar el comportamiento de la medida que se esta analizando, mostrando si afecta de manera positiva o negativa, si es que tiene un impacto realmente relevante en la medida.

.
.

5.Usar la visualización "Descomposition tree"

  • El objetivo de esta herramienta es ubicar dónde se tiene la mayor incidencia que está afectando el desempeño de la organización de manera positiva o negativa.

  • Esta visualización es recomendable trabajarla con medidas a nivel de % para que la visualización pueda utilizar su IA para recomendar el campo que realmente a nivel jerárquico es relevante y afecta positivo o negativamente.

.
.

6.Uso de la técnica de Cluster

  • Esta técnica permite identificar un segmento de datos que sean similares entre ellos pero muy diferentes al resto de los otros datos.
  • La gracias de esta técnica es que se crea una columna que segmenta por N° de Cluster y estos se pueden utilizar para graficar en un gráfico de dispersión.
    .
    .

¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

    • Siento que el objetivo de esta sección y por la cual nos sirve para la certificación, es el hecho de saber hacer un análisis profundo de los datos y así lograr encontrar datos atípicos que pueden ayudarnos a encontrar errores en la data, problemas con el rendimiento con el vendedor o de otra manera también descubrir un punto positivo que se puede replicar y así mejorar el rendimiento de la empresa.