Amostragem

A Amostragem no Gaio DataOS permite extrair um subconjunto de dados de uma tabela de forma simples e controlada. Essa funcionalidade é ideal para testes, validação, visualizações iniciais ou pré-processamento em fluxos de Machine Learning.
Esta task só pode ser utilizada quando uma tabela estiver selecionada no fluxo.
Como usar a Sample Task
1. Adicionar a Sample Task ao fluxo
No Studio, acesse o painel Tarefas. Na seção Analytics, selecione Amostragem.
2. Configurar os campos principais
Rótulo (opcional): Nome para identificar esta task no fluxo (padrão:
sample).Tabela resultado: Nome da tabela de saída que conterá os dados amostrados (ex.:
sample_sample).
3. Escolher o tipo de amostragem
Você pode escolher entre duas opções:
Porcentagem
Permite definir a porcentagem de linhas que serão amostradas da tabela original.
Ajuste o seletor ou informe o valor manualmente
Exemplo:
0.7(70%) → retorna 70% das linhas da tabela de origem
Linhas
Permite definir um número fixo de linhas para compor a amostra.
Exemplo:
1.000→ A tabela de saída conterá exatamente 1.000 linhas selecionadas aleatoriamente
4. Salvar e executar
Após configurar o tipo e o valor da amostragem, clique em Save
Execute o fluxo — uma nova tabela será gerada com base na configuração de amostra escolhida
Boas práticas
Utilize a Sample Task para:
Reduzir o tamanho de datasets durante o desenvolvimento ou pré-visualização de dashboards
Criar conjuntos de dados menores para treinamento de modelos de Machine Learning
Testar queries e transformações sem processar o dataset completo
Combinar com outras tasks como AutoML, Cluster ou Scoring para acelerar experimentação e modelagem
Todas as colunas da tabela de origem serão mantidas na tabela amostrada. Apenas o número de linhas será reduzido.
Atualizado