<< Back

¿Qué hay de nuevo en Tableau 2020.3? #2 Publicar en bases de datos con Tableau Prep

Otra novedad, y de las más interesantes, en la nueva versión de Tableau 2020.3 no es para Tableau Desktop ni Tableau Server, sino para Tableau Prep.

Hasta ahora, después de un flujo, teníamos siempre que guardar los datos en un archivo local de Tableau (.TDE o .HYPER) o bien publicar los datos directamente en Tableau Server o Tableau Online. Ahora, podremos también publicar los datos directamente en una base de datos relacional, en concreto, y de momento, en una de las siguientes:

  • Microsoft SQL Server
  • MySQL
  • PostgreSQL
  • Amazon Redshift
  • Showflake
  • Oracle
  • Teradata

¿Cómo publicar en bases de datos relacionales?

Además, no podía ser más sencillo. Imaginemos que tenemos un flujo en Tableau Prep en el que queremos leer cuatro ficheros distintos, hacer algo de limpieza y ajustes en cada uno de ellos para posteriormente unirlos, crear una Right Join con un quinto fichero y posteriormente guardar esos datos. Es decir algo así:

Un flujo en Tableau Prep.

Lo que finalmente nos gustaría es poder guardar estos datos en nuestra base de datos, lo cual no era posible hasta ahora, pero sí con Tableau Prep 2020.3. Para ello añadiremos al final un último paso, un Output o Salida:

Añadiendo un Output al final del flujo.

De momento nada ha cambiado, seguimos viendo las mismas opciones que teníamos disponibles anteriormente: guardar en un archivo (tde o hyper) o guardar en una fuente de datos publicada (en Tableau Server o Tableau Online). Pero ahora tenemos disponible una tercera opción: Tabla de base de datos.

Guardar salida en…

Si seleccionamos dicha opción podremos entonces elegir la base de datos en la que queremos guardar los datos:

Conexiones disponibles.

Seleccionamos la que nos interese y nos aparece una nueva ventana donde tendremos que introducir los datos de nuestro servidor / base de datos:

Datos de conexión de la base de datos.

Una vez hemos indicado los datos de la conexión, podremos entonces elegir la base de datos y el nombre de la tabla en la que queremos guardar los datos, ya sea una tabla existente o una nueva tabla que queremos crear como, miNuevaTabla:

Elegir la tabla donde guardar los datos.

Así de fácil. Ahora podríamos hacer click en el botón Ejecutar flujo o Run Flow y Tableau Prep realizará todo el proceso de preparación y unión de los distintos ficheros y publicará los datos en nuestra base de datos relacional.

Además, tenemos una opción en al final del todo donde podremos especificar cómo queremos que se comporte Tableau Prep en el caso de que deba crear o actualizar una tabla, contando con las siguientes tres opciones:

Opciones de salida o escritura en una base de datos.
  1. Crear Tabla (Create table): Esta opción creará la tabla en el caso de que no exista en nuestra base de datos, y si existe la eliminará y creará de nuevo.
  2. Anexar a la tabla (Append to table): Si la tabla no existe se creará, pero si ya existe se añadirán filas a la misma, sin sobreescribir datos.
  3. Reemplazar datos (replace data): Si la tabla no existe se creará, pero si existe se sobreescribirán los datos.

Casos de uso

Los casos de uso de esta nueva función son muchos, pero sobre todo abre un nuevo mundo de posibilidades para quien quiera automatizar procesos y generar datos en sus bases de datos utilizando Tableau Prep.

Ahora podremos no sólo integrar y preparar ficheros de datos locales para luego publicarlos en nuestra base de datos, sino también combinar información de distintas fuentes o bases de datos, integrarlos, y posteriormente publicarlos en una de dichas bases de datos o en una distinta.

¿Quieres combinar un archivo de Excel con una tabla de PostgreSQL, hacer una join con datos que vengan de Salesforce y posteriormente publicar la información, ya preparada y lista para su análisis en Snowflake? Pues con Tableau Prep 2020.3, ya puedes hacerlo.

Leave a Reply

Your email address will not be published. Required fields are marked *