# Amostragem

<figure><img src="/files/JqREMiCr23EB9kM1t0w3" alt=""><figcaption></figcaption></figure>

A **Amostragem** no **Gaio DataOS** permite extrair um subconjunto de dados de uma tabela de forma simples e controlada. Essa funcionalidade é ideal para **testes**, **validação**, **visualizações iniciais** ou **pré-processamento em fluxos de Machine Learning**.

{% hint style="warning" %}
&#x20;Esta task só pode ser utilizada quando uma **tabela** estiver selecionada no fluxo.
{% endhint %}

***

## Como usar a Sample Task

### 1. Adicionar a Sample Task ao fluxo

No **Studio**, acesse o painel **Tarefas**.\
Na seção **Analytics**, selecione **Amostragem**.

***

### 2. Configurar os campos principais

* **Rótulo (opcional):**\
  Nome para identificar esta task no fluxo\
  \&#xNAN;*(padrão: `sample`)*.
* **Tabela resultado:**\
  Nome da tabela de saída que conterá os dados amostrados\
  (ex.: `sample_sample`).

***

### 3. Escolher o tipo de amostragem

Você pode escolher entre duas opções:

**Porcentagem**

Permite definir a **porcentagem de linhas** que serão amostradas da tabela original.

* Ajuste o seletor ou informe o valor manualmente
* **Exemplo:** `0.7` (70%) → retorna 70% das linhas da tabela de origem

**Linhas**

Permite definir um **número fixo de linhas** para compor a amostra.

* **Exemplo:** `1.000` → A tabela de saída conterá exatamente 1.000 linhas selecionadas aleatoriamente

***

#### 4. Salvar e executar

* Após configurar o tipo e o valor da amostragem, clique em **Save**
* Execute o fluxo — uma nova tabela será gerada com base na configuração de amostra escolhida

***

### Boas práticas

Utilize a **Sample Task** para:

* Reduzir o tamanho de datasets durante o desenvolvimento ou pré-visualização de dashboards
* Criar conjuntos de dados menores para treinamento de modelos de Machine Learning
* Testar queries e transformações sem processar o dataset completo
* Combinar com outras tasks como **AutoML**, **Cluster** ou **Scoring** para acelerar experimentação e modelagem

{% hint style="success" %}
Todas as colunas da tabela de origem serão mantidas na tabela amostrada. Apenas o **número de linhas** será reduzido.
{% endhint %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.gaiodataos.com/gaio-dataos-portuguese/tools/tarefas/analytics/amostragem.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
