Muestra

La tarea Sample permite extraer un subconjunto de datos de una tabla de forma simple y controlada.

Es ideal para:

  • Pruebas y validación

  • Visualizaciones preliminares

  • Reducción de volumen de datos

  • Preprocesamiento en flujos de Machine Learning

circle-exclamation

Cómo Usar la Tarea Sample

1. Agregar la Tarea Sample al Flujo

  1. En el Studio, ve al panel Tareas.

  2. Dentro de la sección Analytics, selecciona Sample.


2. Configurar los Campos Principales

  • Etiqueta de la tarea (opcional): Nombre interno para identificar esta etapa en el flujo. (valor por defecto: sample)

  • Tabla de resultado: Nombre de la tabla de salida que contendrá los datos muestreados (por ejemplo: sample_sample)


3. Elegir el Tipo de Muestreo

Puedes seleccionar entre dos opciones:

Porcentaje

Permite definir el porcentaje de filas que se extraerán de la tabla original.

  • Puedes ajustar el control deslizante o ingresar el valor manualmente.

  • Ejemplo: 0.7 (70%) → devuelve el 70% de las filas de la tabla de origen.


Número de Filas

Permite definir una cantidad fija de filas para extraer como muestra.

  • Ejemplo: 1000 → la tabla resultante contendrá exactamente 1.000 filas seleccionadas aleatoriamente.


4. Guardar y Ejecutar

  1. Haz clic en Guardar después de configurar el tipo y valor de muestreo.

  2. Ejecuta el flujo.

Se generará una nueva tabla con base en la configuración seleccionada.


Buenas Prácticas

Utiliza la tarea Sample para:

  • Reducir el tamaño del dataset durante desarrollo o pruebas de paneles.

  • Crear subconjuntos para entrenamiento de modelos de Machine Learning.

  • Probar consultas y transformaciones sin procesar el dataset completo.

Puedes combinarla con tareas como:

  • AutoML

  • Cluster

  • Scoring

circle-check

Última actualización