Regras de Associação

Muito popular em sites de e-commerce, Regras de Associação ou Análise de Cesta identificam relacionamentos entre produtos. Esse tipo de técnica possibilita oferecer produtos que outras pessoas compraram ao navegar em uma página específica de produto.
Muitas outras aplicações são possíveis com esse tipo de técnica, como identificar fraudes em licitações (associações entre empresas participantes), identificar afinidades entre pessoas, entre outras aplicações.
O Gaio utiliza o mlxtend para realizar os cálculos.
Como Configurar a Tarefa de Regras de Associação
1. Abrir a Tarefa
Para identificar associações nos seus dados, clique na tabela que contenha pelo menos duas colunas (Transaction e Item).
No Studio, vá até o painel de Tasks.
Na seção Analytics, selecione Regras de Associação.
2. Preencher os Campos Obrigatórios
Rótulo: (opcional) Nome para identificar esta etapa no seu fluxo.
Tabela resultado: Nome da tabela de saída que armazenará os resultados (ex.:
basket_association_rules).Tabela de origem: Preenchido automaticamente com a tabela selecionada (ex.:
association_rules).Suporte mínimo: Frequência mínima para que um conjunto de itens seja considerado (ex.: 0.2 = 20%). Quantidade de vendas em que os dois “produtos” apareceram juntos dividida pelo total de vendas.
Confiança mínima: Nível mínimo de confiança para que uma regra seja aceita (ex.: 0.8 = 80%). Dado que o produto A foi vendido, qual a probabilidade de B ser vendido?
Coluna ID: Coluna que representa o ID único da transação ou do usuário (ex.:
order_id).Categoria: Coluna que contém o item, produto ou evento a ser analisado (ex.:
product_name).
Após configurar essas informações, a tarefa pode ser executada para buscar associações.
3. O que esta tarefa faz
Aplica algoritmos de mineração de regras de associação (como apriori).
Gera regras no formato “se-então” que destacam relações entre itens.
Produz uma tabela contendo as combinações mais relevantes, com base em suporte, confiança e lift.
Exemplo de Caso de Uso
Dado um dataset com:
order_id→ identificador da transaçãoproduct_name→ itens comprados
4. Resultados
Como resultado da execução da técnica, é gerada uma tabela contendo as associações. Cada linha representa uma associação encontrada com base nos dois critérios definidos (minimum support e minimum confidence).

antecedentes: Nesta coluna aparecem um ou mais “produtos” que, se “comprados”, aumentam a probabilidade do que está nos consequents ser comprado.
consequentes: Aqui são apresentados os “produtos” que têm sua probabilidade aumentada quando os antecedents são vendidos.
As colunas com estatísticas de relacionamento são:
suporte(A → B)
suporte(A + B)
0 a 1
confiança(A → B)
suporte(A + B) / suporte(A)
0 a 1
lift(A → B)
confiança(A → B) / suporte(B)
0 a ∞
alavancagem(A → B)
suporte(A → B) – suporte(A) * suporte(B)
0 a 1
convicção
[1 – suporte(B)] / [1 – confiança(A → B)]
0 a ∞
Boas Práticas
Utilize datasets que contenham múltiplos itens por transação (ex.: carrinhos de compra, combos, ações de usuários).
Aplique filtros ou segmentações antes de executar a tarefa para refinar a geração das regras.
Visualize os resultados utilizando gráficos ou redes com base em confiança, suporte ou lift.
Atualizado