Regras de Associação

Muito popular em sites de e-commerce, Regras de Associação ou Análise de Cesta identificam relacionamentos entre produtos. Esse tipo de técnica possibilita oferecer produtos que outras pessoas compraram ao navegar em uma página específica de produto.

Muitas outras aplicações são possíveis com esse tipo de técnica, como identificar fraudes em licitações (associações entre empresas participantes), identificar afinidades entre pessoas, entre outras aplicações.

O Gaio utiliza o mlxtend arrow-up-rightpara realizar os cálculos.


Como Configurar a Tarefa de Regras de Associação


1. Abrir a Tarefa

  • Para identificar associações nos seus dados, clique na tabela que contenha pelo menos duas colunas (Transaction e Item).

  • No Studio, vá até o painel de Tasks.

  • Na seção Analytics, selecione Regras de Associação.


2. Preencher os Campos Obrigatórios

  • Rótulo: (opcional) Nome para identificar esta etapa no seu fluxo.

  • Tabela resultado: Nome da tabela de saída que armazenará os resultados (ex.: basket_association_rules).

  • Tabela de origem: Preenchido automaticamente com a tabela selecionada (ex.: association_rules).

  • Suporte mínimo: Frequência mínima para que um conjunto de itens seja considerado (ex.: 0.2 = 20%). Quantidade de vendas em que os dois “produtos” apareceram juntos dividida pelo total de vendas.

  • Confiança mínima: Nível mínimo de confiança para que uma regra seja aceita (ex.: 0.8 = 80%). Dado que o produto A foi vendido, qual a probabilidade de B ser vendido?

  • Coluna ID: Coluna que representa o ID único da transação ou do usuário (ex.: order_id).

  • Categoria: Coluna que contém o item, produto ou evento a ser analisado (ex.: product_name).

Após configurar essas informações, a tarefa pode ser executada para buscar associações.


3. O que esta tarefa faz

  • Aplica algoritmos de mineração de regras de associação (como apriori).

  • Gera regras no formato “se-então” que destacam relações entre itens.

  • Produz uma tabela contendo as combinações mais relevantes, com base em suporte, confiança e lift.


Exemplo de Caso de Uso

Dado um dataset com:

  • order_id → identificador da transação

  • product_name → itens comprados


4. Resultados

Como resultado da execução da técnica, é gerada uma tabela contendo as associações. Cada linha representa uma associação encontrada com base nos dois critérios definidos (minimum support e minimum confidence).

  • antecedentes: Nesta coluna aparecem um ou mais “produtos” que, se “comprados”, aumentam a probabilidade do que está nos consequents ser comprado.

  • consequentes: Aqui são apresentados os “produtos” que têm sua probabilidade aumentada quando os antecedents são vendidos.

As colunas com estatísticas de relacionamento são:

Indicador
Fórmula
Variação

suporte(A → B)

suporte(A + B)

0 a 1

confiança(A → B)

suporte(A + B) / suporte(A)

0 a 1

lift(A → B)

confiança(A → B) / suporte(B)

0 a ∞

alavancagem(A → B)

suporte(A → B) – suporte(A) * suporte(B)

0 a 1

convicção

[1 – suporte(B)] / [1 – confiança(A → B)]

0 a ∞


Boas Práticas

  • Utilize datasets que contenham múltiplos itens por transação (ex.: carrinhos de compra, combos, ações de usuários).

  • Aplique filtros ou segmentações antes de executar a tarefa para refinar a geração das regras.

  • Visualize os resultados utilizando gráficos ou redes com base em confiança, suporte ou lift.

Atualizado