Aprendizajes de la sección “Optimize model performance” del módulo “Model the data”

KevinRoger
Participante

¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

  1. Eliminar filas y Columnas no necesarias y el porque es útil.
  • Este punto señala que un reporte independiente de su calidad en la información, también es importante fijarse en cuanto pesa el archivo y qué es lo que hace que pese más o menos.
  • Para esta sección se trata el concepto de Vertipaq Engine, el cual es un mecanísmo que comprime los datos dentro de Power BI donde:
    -Si hay + cantidad de datos en el modelo, + grande el archivo.
    -Si hay - cantidad de datos en el modelo, + liviano es el archivo.
  • Es por esto que se hace la recomendación de acceder a Power Query y decidir que columnas de la base a la que nos conectaremos, serán necesarias o no. Una vez tomada esa decisión proceder a eliminar las columnas y filas innecesarias (utilizando los filtros de la columna).
  • Por último si una columna de una tabla está contenida en otra tabla, se recomienda eliminarla dado que se podrán obtener los datos al momento de relacionar las tablas usando la función RELATED()
  • Optimizar modelo
    1. Identificar medidas, relaciones y visualizaciones con mal desempeño.
    • En este apartado aprendimos utilizar el Performance Analyzer, el cual cumple la función de ayudarnos a detectar cuanto tarda en cargar el reporte y todo lo que contiene, con el fin medir el desempeño del reporte antes de dejarlo en “Productivo”. Dentro de los datos que muestra esta función está.
      -Gráficos, campos utilizados o medidas, tiempo que toma en actualizarse el reporte, etc.
    1. Mejorar los niveles de cardinalidad (Cardinality Levels) al combinar el “Data Type”.
    • Si tengo una columna del tipo tiempo donde en una sola celda se contiene hora:minutos:segundo y todos los valores de este campo son únicos, hará que el reporte pierda eficiencia, por lo que se recomienda: agregar columnas nuevas en Power Query, extrayendo la hora, minuto y segundo en columnas distintas y elimnando en un nuevo paso el campo original.
    • En el caso de tener Fecha con tiempo, solo transformar la vista del dato a formato Fecha: dd/mm/aaaa.
    1. Mejorar “Cardinality levels” mediante "Summarization"
    • En este apartado hace mención a la misma idea anterior pero reduciendo el nivel de datos a través de la opción GROUP BY , donde puedes sumar, contabilizar datos respecto a fechas.
      Ejemplo:

      1. Utilización de Aggregattions.
      • Aquí aprendimos que se puede utilizar para encontrar los Insight más importantes, siendo que la base maneja mucho volumen de información, creando así una tabla intermedia que será utilizada para consultar la información de manera más rápida.

      ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

      • Creo que la mejor manera de definir la importancia de esta sección es su enfoque a La eficiencia de un reporte y creo que para la certificación es muy importante no solamente que sabemos crear buenos modelos de datos o limpieza de datos, si no que el reporte cumpla con el objetivo que ofrece la herramienta que es optimizar el tiempo.