Amostragem

A Amostragem no Gaio DataOS permite extrair um subconjunto de dados de uma tabela de forma simples e controlada. Essa funcionalidade é ideal para testes, validação, visualizações iniciais ou pré-processamento em fluxos de Machine Learning.

circle-exclamation

Como usar a Sample Task

1. Adicionar a Sample Task ao fluxo

No Studio, acesse o painel Tarefas. Na seção Analytics, selecione Amostragem.


2. Configurar os campos principais

  • Rótulo (opcional): Nome para identificar esta task no fluxo (padrão: sample).

  • Tabela resultado: Nome da tabela de saída que conterá os dados amostrados (ex.: sample_sample).


3. Escolher o tipo de amostragem

Você pode escolher entre duas opções:

Porcentagem

Permite definir a porcentagem de linhas que serão amostradas da tabela original.

  • Ajuste o seletor ou informe o valor manualmente

  • Exemplo: 0.7 (70%) → retorna 70% das linhas da tabela de origem

Linhas

Permite definir um número fixo de linhas para compor a amostra.

  • Exemplo: 1.000 → A tabela de saída conterá exatamente 1.000 linhas selecionadas aleatoriamente


4. Salvar e executar

  • Após configurar o tipo e o valor da amostragem, clique em Save

  • Execute o fluxo — uma nova tabela será gerada com base na configuração de amostra escolhida


Boas práticas

Utilize a Sample Task para:

  • Reduzir o tamanho de datasets durante o desenvolvimento ou pré-visualização de dashboards

  • Criar conjuntos de dados menores para treinamento de modelos de Machine Learning

  • Testar queries e transformações sem processar o dataset completo

  • Combinar com outras tasks como AutoML, Cluster ou Scoring para acelerar experimentação e modelagem

circle-check

Atualizado