La preparación y limpieza de datos antes de ser analizados es una de las tareas que más tiempo consumen en el proceso de análisis. Estos procesos -denominados procesos ETL- se encargan de extraer (E) los datos, transformarlos (T) y cargarlos (Load, en inglés) en el software de análisis, y su correcta configuración es crítica si deseamos obtener buenos resultados.
Ya hemos visto que Tableau Desktop incluye algunas herramientas de transformación básicas que nos permiten cambiar el nombre a un campo, dividirlo en bloques, modificar su tipo... Pero existe una aplicación independiente, Tableau Prep Builder, que incluye herramientas mucho más potentes que nos van a permitir realizar combinaciones entre tablas ("joins"), anexión vertical de tablas, despivotar tablas dinámicas, así como aplicar muchas más transformaciones a nuestros datos para dar forma a esos procesos ETL que llevarán los datos transformados a Tableau Desktop. La definición de estos flujos de transformaciones se realiza apoyándose en una herramienta visual que hace el proceso mucho más sencillo y comprensible:
De hecho, éste es el nombre que recibe el resultado de Tableau Prep Builder: flujo. Un flujo está formado por pasos que definen el tipo de transformaciones a aplicar. Hay "pasos de entrada" (en los que los datos entran en el flujo), pasos de transformaciones de diversos tipos, y "pasos de salida", que generan un fichero de salida con los datos transformados.
En todo flujo hay, al menos, un paso de entrada y, al menos, un paso de salida.