Foros › Power BI en general › Aprendizajes de la sección “Perform Advanced Analysis” del módulo “Analyze the data”:
¿Qué aprendiste en la sección “Perform Advanced Analysis”?
- Identificar outliers
- Qué son y como se usan los grupos “Lists” y “Bins”
- Desarrollar "Time series analysis"
- Uso de “Key Influencers” para explorar variaciones dimensionales
- Usar la visualización "Descomposition tree"
- Uso de la técnica de Cluster
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
1.Identificar outliers
- Primero es importante recordar que le llamamos outliers a las anomalías que existen en nuestros datos.
- Una de las estrategias para tratar los outliers es aislarlos, para luego investigar a qué se debe su aparición y al encontrarlos y analizarlos puedo generar gran impacto en el negocio
- Es recomendable usar un gráfico de dispersión para detectar el dato atípico y agregar una tabla que nos muestre el detalle del dato que sobresale.
2.Qué son y cómo se usan los grupos “Lists” y “Bins”
- Lists: usados para trabajar datos categóricos
- Bins: usados para trabajar datos continuos
3.Desarrollar "Time series analysis"
- Este es un tipo de análisis que se lleva a cabo con un gráfico de líneas donde el eje x corresponderá al campo de Fecha.
- Para este tipo de análisis se utiliza opción Forecast, cuyo objetivo es ver cómo se comportará en el futuro el dato analizado
forecast1424×502 71.9 KB
- En este tipo de visualización se puede: definir cuantos puntos visualizar a futuro, intervalo de confianza y definir cuantos puntos del periodo real ignorar.
.
.
.
4.Uso de “Key Influencers” para explorar variaciones dimensionales
- Esta herramienta nos ayuda a detectar el datos o elementos que están teniendo un mayor impacto para explicar el comportamiento de la medida que se esta analizando, mostrando si afecta de manera positiva o negativa, si es que tiene un impacto realmente relevante en la medida.
.
.
5.Usar la visualización "Descomposition tree"
- El objetivo de esta herramienta es ubicar dónde se tiene la mayor incidencia que está afectando el desempeño de la organización de manera positiva o negativa.
- Esta visualización es recomendable trabajarla con medidas a nivel de % para que la visualización pueda utilizar su IA para recomendar el campo que realmente a nivel jerárquico es relevante y afecta positivo o negativamente.
.
.
6.Uso de la técnica de Cluster
- Esta técnica permite identificar un segmento de datos que sean similares entre ellos pero muy diferentes al resto de los otros datos.
- La gracias de esta técnica es que se crea una columna que segmenta por N° de Cluster y estos se pueden utilizar para graficar en un gráfico de dispersión.
.
.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
-
- Siento que el objetivo de esta sección y por la cual nos sirve para la certificación, es el hecho de saber hacer un análisis profundo de los datos y así lograr encontrar datos atípicos que pueden ayudarnos a encontrar errores en la data, problemas con el rendimiento con el vendedor o de otra manera también descubrir un punto positivo que se puede replicar y así mejorar el rendimiento de la empresa.