Muestra de datos

Como ya sabemos, nuestros datos se van transformando a lo largo del flujo, y podemos -tal y como veremos en breve- ir haciendo clic aquí y allá para ver cuál es el estado de nuestros datos en los diferentes pasos. Por motivos de rendimiento, es posible que Tableau Prep Builder no considere todos los datos para mostrarnos su estado en estos puntos intermedios, sino que opte por considerar solo una muestra de ellos. En este bloque ("Muestra de datos") podemos configurar cómo se va a escoger esa muestra:

Paso de entrada: Muestra de datos

En el primer bloque deberemos escoger la cantidad de datos (de registros) a incluir: una cantidad de muestra predeterminada que dependerá del "tamaño" de nuestros datos (número de columnas, tipos, etc.), usar todos los datos, o un número fijo de filas (que no podrá ser mayor que un millón). En estos dos últimos casos es posible que el rendimiento se vea afectado.

En el segundo bloque deberemos especificar el método de muestreo: una selección rápida -que puede no ser la más representativa- o una muestra aleatoria, lo que resultaría en una selección más representativa desde un punto de vista estadístico, pero más lenta.

Este muestreo se utiliza solo para mostrarnos los datos y su estado en los diferentes pasos del flujo. Una vez ejecutemos el flujo para transformar de forma efectiva nuestros datos, se van a transformar todos.