Gaio Documentation
Portuguese
Portuguese
  • Bem vindo à documentação da Plataforma Gaio!
  • Documentação
    • Informações Gerais
      • Estrutura de Funcionamento
      • Login
      • Página Inicial
    • Aplicações
    • Studio
      • Processos
      • Fontes de Dados
      • Tarefas
        • ETL
          • Consulta
          • SQL
          • SQL Externo
          • Inserção Tabela
          • Inserção Linha
          • Atualização
          • Exclusão
          • Cria Tabela
          • Quick Table
          • Pivot Table
          • Unpivot Table
          • Executar Processo
          • Rest
          • Parâmetros para Tabela
          • Tabela para Parâmetros
          • Usuários
          • CSV Web
          • Google Planilhas
        • Analytics
          • Amostragem
          • AutoML
          • Scoring
          • Cluster
          • Componentes Principais
          • Regras de Associação
          • Séries Temporais
          • Python
        • Delivery
          • Relatório
          • Power Search
          • Conteúdo
          • Formulário
          • Exportar Output
          • Banner
          • Exportar CSV
          • Mapa
          • Insights
          • API
          • SMS
          • WhatsApp
          • Email
          • Network
      • Parâmetros
      • Formulários
      • Arquivos
      • Botões de Ação
      • Menu Superior
        • SQL
        • Editar Tabelas do Bucket
        • Execuções em Andamento
        • Editor de Mapas
        • Agendamento
        • Modelos
        • Cognitivo
        • Log de erros
        • Editar Dashboard
        • Chat - GPS
        • Menu Geral
    • Administração
      • Permissões
      • Usuários
      • Fontes de Dados
      • Repositórios
        • Criação
        • Gestão de Dados
      • Compartilhamento
      • Agendamento
      • Log
    • Atalhos do Teclado
  • Integrações
    • LDAP
  • HUB
    • Exemplos
      • Tarefa Conteúdo
        • Formulário Manual
  • FAQ
  • Gestão de Servidor
    • Inicialização do Gaio
  • What's New!
    • Release Notes
      • 2022
Powered by GitBook
On this page
  1. Documentação
  2. Studio
  3. Tarefas
  4. Analytics

Amostragem

PreviousAnalyticsNextAutoML

Last updated 2 years ago

Essa tarefa gera uma nova tabela com uma amostra aleatória da tabela de origem. Esse recurso é muito usado e útil no momento de criar modelos preditivos, pois, computacionalmente é muito pesado aplicar por exemplo Redes Neurais em um grande conjunto de dados. Ao mesmo tempo é ineficiente, pois, com menos dados, é possível rodar mais técnicas, com mais parametrizações e portanto, encontrar um modelo melhor. Além disso, uma boa amostra é suficiente para se compreender o universo em estudo.

Basicamente existem duas alternativas:

  1. Escolher um percentual de linhas da tabela de origem.

  2. Escolher uma quantidade específica de linhas que estarão na tabela gerada.

Toda vez que essa tarefa for executada novamente, um novo conjunto aleatório de dados será gerado.

Em muitos casos, o desejo é gerar uma base aleatória e trabalhar com ele um período maior. Se assim for, gere a tabela com dados aleatórios e apague logo em seguida a tarefa Amostragem, não permitindo que a tabela aleatório seja gerada novamente.

Todos as colunas da tabela de origem estarão presentes na tabela aleatória. Só o número de linhas que será menor.