Aprendizajes de la sección “Get data from different sources” del módulo “Prepare the data”

bernabe

¿Qué aprendiste en la sección “Get data from different sources”?

DATA SOURCE

Que Power Bi se puede conectar a cualquier modelo de datos tanto de otros proveedores de bases de datos, como a modelos de datos creados en powerbi.

Que se puede conectar a informaciones en Excel, a páginas webs y carpetas para crear el modelo de datos.

Que los modelos de datos se pueden crear local ( local dataset ) o compartido en nube ( shared dataset ). Este ultimo modelo compartido no permite conexiones a otros modelos ni crear nuevas relaciones para que todo sea desde una fuente única de la verdad.

Aprendí a modificar la configuración de las conexiones a fuentes de datos que ya estén realizadas.

Aprendí que existen tres formas de almacenar los datos ( STORAGE MODE ) cuando se trabaja con bases de datos : La primera es “ Import ” que trae las tablas del modelo a nuestro archivo local. La segunda es trabajar con los datos en el servidor donde esta alojada la base de datos “ Direct ” y la tercera es la mixta “ Dual ” que combina las dos anteriores.

QUERY TYPE

Que PowerbBi se conecta a las fuentes de datos a través de uno de los conectores con los que cuenta. Y que prácticamente tiene conectores para todo tipo de fuente de datos y siguen ampliando constantemente.

Estos conectores se representan en forma gráfica pero se crea en forma automática un código de programación llamado lenguaje M, propio de PowerBi. Que se puede consultar desde el editor de consultas avanzado.

QUERY PERFORMANCE

Aprendí que se puede mejorar el desempeño de la ejecución de las consultas:

Reduciendo los pasos de transformación de las tablas

Cuando los pasos se aplican del lado del servidor a lo que se le llama plegado de consultas ( query folding ); en caso de el “ Storage Mode ” este configurado en modo directo “direct ”. Sin embargo en caso que se agregue un paso que solo se pueda hacer local ( como agregar una columna por ejemplo ) a partir de ahí los pasos subsiguientes se estarán realizando de manera local.

Creando Parámetros. Que también dan flexibilidad a los usuarios de los reportes de controlar las informaciones que desean ver.

Al compartir un archivo de powerbi como una plantilla: “TEMPLATE” ( EXTENCION PBIT ) , conserva el parámetro que se defina para que el usuario al abrir el archivo indique en el parámetro la información que desea ver y solo verá esa información.

MICROSOFT DATAVERSE

Sustituye al “Common Data Service”. Se trata de una aplicación de Microsoft que crea un entorno de trabajo desde donde se puede crear bases de datos desde cero o a partir de tablas de ejemplo prediseñadas por Microsoft.

Luego podemos crear un archivo de powerbi y mediante el conector creado para Dataverse conectarnos a la base de datos por las vías permitidas: STORAGE DATA ( directa o importar los datos ).

ARCHIVO EXTENCION “PBIDS”

Es un tipo de archivo que se puede compartir con otro usuario. Hereda la configuración de la conexión a una base de datos en nube y el usuario no tendrá que pasar por el proceso de conexión y además le permite seleccionar las tablas con las que desea trabajar, sin necesidad de abrirlas todas.

DATAFLOW

Es como el query editor en la nube, en powerbi service. Los usuarios autorizados tendrán acceso a las transformaciones. Es para trabajar transformaciones en equipo. Es para espacio de trabajo de organizaciones. Desde ahí se hacen las conexiones a las fuentes y las transformaciones en equipo.

Luego desde powerbi desktop los usuarios con acceso a la cuenta pueden conectarse a las bases de datos ya transformadadas y trabajar los reportes.

¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?

Para ser más productivo al seleccionar donde ubicar los datos; compartir archivos , y conectarme a fuentes en nube.

¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

Para responder a las diferentes formas de conectarse a una fuente de datos, las formas disponibles para la transformación, formas compartir las bases de datos y optimizar la ejecución de los recursos.