A ANACOR (Análise de Correspondência).
- Variáveis Qualitativas.
- Simples 2 variáveis categóricas.
- Múltipla > que 2 variáveis categóricas.
OBS: um ponto interessante é que com a Anacor e suas coordenadas, podemos transformar variáveis categóricas em métricas.
Associações estátisticamente significantes, verifica as categorias das associações, análise dessas categorias.
Podemos transformar uma variável métrica em categórica. Exemplo faixas de idade.
Objetivo é analisar pela proximidade a associação entre as variáveis.

Fonte: https://rpubs.com/rcleoni/265601, acesso 11 maio de 2026.
- Verificar se existe associação e estatisticamente significantes: teste Qui-Quadrado.
Criando a tabela contingência, para verificar a contagem por variável.
Abaixo será explicado detalhadamente cada item:
Função de cada etapa da ANACOR
| Etapa | Função na análise |
|---|---|
| 1. Tabela de contingência | É o ponto de partida. Mostra as frequências observadas entre duas variáveis categóricas, por exemplo, Perfil do Cliente × Canal de Atendimento. |
| 2. Frequências esperadas | Mostram quais valores seriam esperados se as duas variáveis fossem independentes, ou seja, se não houvesse associação entre elas. |
| 3. Resíduos padronizados | Medem a diferença entre o observado e o esperado em cada célula. Indicam quais combinações ocorreram mais ou menos do que o esperado. |
| 4. Matriz A | É construída a partir dos resíduos padronizados divididos por n. Ela organiza os desvios padronizados em uma matriz preparada para a decomposição matemática. |
| 5. Matriz /W=ATA | Resume a estrutura de associação das categorias das colunas. É a matriz usada para encontrar os autovalores e autovetores. |
| 6. Autovalores λ | Indicam quanta informação, ou inércia, cada dimensão explica. Quanto maior o autovalor, mais importante é aquela dimensão. |
| 7. Autovetores | Indicam a direção dos eixos fatoriais. Eles ajudam a determinar como as categorias serão posicionadas no espaço. |
| 8. Coordenadas das categorias | Transformam as categorias em pontos no plano. Cada categoria recebe uma coordenada e , correspondentes às dimensões 1 e 2. |
| 9. Gráfico perceptual | Representa visualmente as categorias. Categorias próximas no gráfico tendem a estar mais associadas. |
Frequências absolutas observadas
Onde:
representa a frequência esperada da célula da linha i e coluna j;
representa o total da linha;
representa o total da coluna;
representa o total geral da tabela.
Exemplo de Frequências Absolutas:
| Perfil do Cliente | App | Site | Telefone | Loja Física | Total |
|---|---|---|---|---|---|
| Jovem | 35 | 20 | 5 | 10 | 70 |
| Adulto | 25 | 30 | 15 | 20 | 90 |
| Idoso | 5 | 10 | 25 | 30 | 70 |
| Total | 65 | 60 | 45 | 60 | 230 |
Duas variáveis categóricas:
Perfil do Cliente
Canal de Atendimento
Frequência esperada
Para Jovem × App:
Exemplo de Frequências esperadas
| Perfil do Cliente | App | Site | Telefone | Loja Física |
|---|---|---|---|---|
| Jovem | 19,78 | 18,26 | 13,70 | 18,26 |
| Adulto | 25,43 | 23,48 | 17,61 | 23,48 |
| Idoso | 19,78 | 18,26 | 13,70 | 18,26 |
Tabela de resíduos simples
O resíduo simples é calculado por:
Onde:
é a frequência observada;
é a frequência esperada.
Exemplo do cálculo do resíduo simples
Para Jovem × App:
Resíduos simples
| Perfil do Cliente | App | Site | Telefone | Loja Física |
|---|---|---|---|---|
| Jovem | 15,22 | 1,74 | -8,70 | -8,26 |
| Adulto | -0,43 | 6,52 | -2,61 | -3,48 |
| Idoso | -14,78 | -8,26 | 11,30 | 11,74 |
Resíduos padronizados
O resíduo padronizado é calculado por:
Ele é mais útil do que o resíduo simples porque coloca os valores em uma escala comparável.
Exemplo do cálculo do resíduo padronizado
Para Jovem × App:
Exemplo da Tabela de resíduos padronizados
| Perfil do Cliente | App | Site | Telefone | Loja Física |
|---|---|---|---|---|
| Jovem | 3,42 | 0,41 | -2,35 | -1,93 |
| Adulto | -0,09 | 1,35 | -0,62 | -0,72 |
| Idoso | -3,32 | -1,93 | 3,05 | 2,75 |
Os maiores resíduos positivos indicam as associações mais fortes entre categorias.
Neste exemplo, os principais destaques são:
| Associação | Resíduo padronizado | Interpretação |
|---|---|---|
| Jovem × App | 3,42 | Jovens usam App mais do que o esperado |
| Idoso × Telefone | 3,05 | Idosos usam Telefone mais do que o esperado |
| Idoso × Loja Física | 2,75 | Idosos usam Loja Física mais do que o esperado |
| Jovem × Telefone | -2,35 | Jovens usam Telefone menos do que o esperado |
| Idoso × App | -3,32 | Idosos usam App menos do que o esperado |
Teste Qui-quadrado
Ele verifica se existe associação estatística entre as duas variáveis categóricas:
Onde:
é a frequência observada.
é a frequência esperada.
Exemplo do cálculo de uma célula
Para Jovem × App:
Esse valor representa a contribuição da célula Jovem × App para o Qui-quadrado total.
Contribuições para o Qui-quadrado
| Perfil do Cliente | App | Site | Telefone | Loja Física |
|---|---|---|---|---|
| Jovem | 11,71 | 0,17 | 5,52 | 3,74 |
| Adulto | 0,01 | 1,81 | 0,39 | 0,52 |
| Idoso | 11,05 | 3,74 | 9,33 | 7,55 |
Somando todas as contribuições:
A fórmula dos graus de liberdade é:
Onde:
Neste Exemplo:
Resultado do teste
| Estatística | Valor |
|---|---|
| Qui-quadrado calculado | 55,51 |
| Graus de liberdade | 6 |
| p-valor | 0,00000000037 |
| Nível de significância | 0,05 |
Como o p-valor é muito menor que 0,05:
rejeitamos a hipótese nula de independência.
O resultado indica que existe associação estatisticamente significativa entre perfil do cliente e canal de atendimento.
Na prática, isso significa que a escolha do canal de atendimento não parece ocorrer de forma aleatória em relação ao perfil do cliente.
Os maiores responsáveis pelo valor do Qui-quadrado foram:
| Associação | Contribuição |
|---|---|
| Jovem × App | 11,71 |
| Idoso × App | 11,05 |
| Idoso × Telefone | 9,33 |
| Idoso × Loja Física | 7,55 |
| Jovem × Telefone | 5,52 |
Essas células mostram onde estão as maiores diferenças entre o observado e o esperado.
Resíduos padronizados ajustados (utilizar esse)
Após o cálculo dos resíduos padronizados, é possível aprofundar a análise utilizando os resíduos padronizados ajustados. Esses resíduos corrigem o efeito dos totais marginais das linhas e colunas, permitindo uma interpretação mais adequada da associação entre cada par de categorias.
A fórmula do resíduo padronizado ajustado é:
Como os resíduos padronizados ajustados se aproximam de uma distribuição normal padrão, podemos interpretar assim:
| Valor do resíduo ajustado | Interpretação |
|---|---|
| Maior que 1,96 | Associação positiva significativa |
| Menor que -1,96 | Associação negativa significativa |
| Entre -1,96 e 1,96 | Sem associação estatisticamente forte |
Considerando nível de significância de 5%
indica que aquela célula contribui de forma relevante para a associação entre as variáveis.
No Exemplo:
No exemplo analisado, o perfil Jovem apresentou forte associação positiva com o canal App, enquanto o perfil Idoso apresentou associação positiva com Telefone e Loja Física. Por outro lado, clientes idosos apresentaram associação negativa com o uso de App, indicando que esse canal aparece menos do que seria esperado para esse perfil.
Resíduos padronizados ajustados
| Perfil do Cliente | App | Site | Telefone | Loja Física |
|---|---|---|---|---|
| Jovem | 4,84 | 0,59 | -3,38 | -2,75 |
| Adulto | -0,13 | 2,10 | -0,90 | -1,11 |
| Idoso | -4,70 | -2,75 | 4,39 | 3,91 |
Principais associações do exemplo
| Associação | Resíduo ajustado | Interpretação |
|---|---|---|
| Jovem × App | 5,12 | Associação positiva forte |
| Idoso × Telefone | 4,32 | Associação positiva forte |
| Idoso × Loja Física | 4,01 | Associação positiva forte |
| Idoso × App | -4,96 | Associação negativa forte |
| Jovem × Telefone | -3,32 | Associação negativa forte |
| Jovem × Loja Física | -2,82 | Associação negativa |
| Idoso × Site | -2,82 | Associação negativa |
| Adulto × Site | 2,08 | Associação positiva |
Exemplo do cálculo: Jovem × App
Primeiro, usamos o resíduo padronizado da célula:
Agora calculamos o ajuste da linha e da coluna.
Total da linha Jovem:
Total da coluna App:
Total geral:
Então:
Conclusões: Células com associação positiva.
As células com resíduo ajustado maior que 1,96 são:
| Associação | Resíduo ajustado | Interpretação |
|---|---|---|
| Jovem × App | 4,84 | Jovens tendem a utilizar mais o App |
| Adulto × Site | 2,10 | Adultos tendem a utilizar mais o Site |
| Idoso × Telefone | 4,39 | Idosos tendem a utilizar mais o Telefone |
| Idoso × Loja Física | 3,91 | Idosos tendem a utilizar mais a Loja Física |
Elaboração do mapa perceptual
Passo a passo em calculo para chegar nos eixos do mapa perceptual.
Para a elaboração do mapa perceptual da Análise de Correspondência, inicialmente constrói-se a matriz A, formada pelos resíduos padronizados divididos pela raiz quadrada do total geral da tabela. Essa matriz representa os desvios padronizados entre as frequências observadas e esperadas.
Em seguida, calcula-se a matriz W, definida por:
A partir dessa matriz, os autovalores são obtidos pela solução da equação característica:
As raízes dessa equação correspondem aos autovalores, que indicam a quantidade de inércia (variância) explicada por cada dimensão. No exemplo analisado, a primeira dimensão apresentou autovalor igual a 0,2283, explicando 94,60% da inércia total. A segunda dimensão apresentou autovalor igual a 0,0130, explicando 5,40%.
Como a quantidade máxima de dimensões é dada por m=min(I−1,J−1), e a tabela possui três categorias nas linhas e quatro categorias nas colunas, tem-se:
Assim, o mapa perceptual pode ser representado em duas dimensões, correspondentes aos eixos e . Cada categoria recebe uma coordenada no plano, permitindo visualizar graficamente as associações entre perfis de clientes e canais de atendimento.
Autovalor:
Na Análise de Correspondência, os autovalores indicam a quantidade de inércia explicada por cada dimensão do mapa perceptual. Essa inércia pode ser interpretada como a quantidade de informação associativa representada em cada eixo.
Exemplo:
No exemplo, observa-se proximidade entre Jovem e App, indicando associação entre clientes jovens e uso do aplicativo. O perfil Adulto aparece mais próximo de Site, enquanto o perfil Idoso aparece próximo de Telefone e Loja Física. Portanto, o mapa perceptual confirma visualmente a associação entre Perfil do Cliente e Canal de Atendimento.
1. Construção da matriz A
Primeiro, parte-se da tabela de resíduos padronizados simples, calculados por:
Depois, cada resíduo padronizado é dividido pela raiz quadrada do total geral da tabela:
No exemplo Perfil do Cliente × Canal de Atendimento, temos:
Logo:
A matriz fica aproximadamente:
| Perfil do Cliente | App | Site | Telefone | Loja Física |
|---|---|---|---|---|
| Jovem | 0,2256 | 0,0268 | -0,1549 | -0,1275 |
| Adulto | -0,0057 | 0,0887 | -0,0410 | -0,0473 |
| Idoso | -0,2192 | -0,1275 | 0,2014 | 0,1811 |
Essa matriz representa os desvios padronizados entre as frequências observadas e esperadas.
2. Construção da matriz W
Após montar a matriz , calcula-se sua transposta:
Em seguida, calcula-se a matriz :
Como tem dimensão 3×4, então:
e
A matriz W fica:
| App | Site | Telefone | Loja Física | |
|---|---|---|---|---|
| App | 0,0990 | 0,0335 | -0,0789 | -0,0682 |
| Site | 0,0335 | 0,0248 | -0,0335 | -0,0307 |
| Telefone | -0,0789 | -0,0335 | 0,0663 | 0,0582 |
| Loja Física | -0,0682 | -0,0307 | 0,0582 | 0,0513 |
3. Determinação dos autovalores
Com base na matriz , os autovalores são obtidos por:
Onde:
W
é a matriz obtida por ;
representa os autovalores;
é a matriz identidade.
As raízes dessa equação são os autovalores.
No exemplo, os autovalores principais são:
| Dimensão | Autovalor λ | % da inércia |
|---|---|---|
| 1 | 0,2283 | 94,60% |
| 2 | 0,0130 | 5,40% |
| Total | 0,2413 | 100,00% |
4. Cálculo dos valores singulares
Os valores singulares são calculados pela raiz quadrada dos autovalores:
Assim:
A tabela fica:
| Dimensão | Autovalor λ | % Inércia | Valor Singular σ |
|---|---|---|---|
| 1 | 0,2283 | 94,60% | 0,4778 |
| 2 | 0,0130 | 5,40% | 0,1141 |
| Total | 0,2413 | 100,00% |
5. Quantidade máxima de dimensões
A quantidade máxima de dimensões é dada por:
No exemplo:
I = 3
porque existem 3 perfis:
e
J = 4
porque existem 4 canais:
Portanto:
m = 2
Logo, o mapa perceptual terá no máximo duas dimensões, que serão representadas pelos eixos e .
6. Coordenadas das categorias
Depois dos autovalores e autovetores, são calculadas as coordenadas das categorias no mapa perceptual.
Cada categoria recebe uma posição:
(x, y)
Onde:
Coordenadas dos perfis
| Perfil do Cliente | Dimensão 1 / X | Dimensão 2 / Y |
|---|---|---|
| Jovem | 0,5372 | 0,1154 |
| Adulto | 0,1028 | -0,1402 |
| Idoso | -0,6694 | 0,0649 |
Coordenadas dos canais
| Canal de Atendimento | Dimensão 1 / X | Dimensão 2 / Y |
|---|---|---|
| App | 0,5803 | 0,1156 |
| Site | 0,2489 | -0,1825 |
| Telefone | -0,5816 | 0,0187 |
| Loja Física | -0,4413 | 0,0433 |
7. Interpretação do mapa perceptual
No mapa perceptual, categorias próximas indicam associação.
Neste exemplo:
| Proximidade no mapa | Interpretação |
|---|---|
| Jovem próximo de App | Jovens estão mais associados ao uso do aplicativo |
| Adulto próximo de Site | Adultos estão mais associados ao uso do site |
| Idoso próximo de Telefone e Loja Física | Idosos estão mais associados a canais tradicionais |
A Dimensão 1 explica 94,60% da inércia. Portanto, o eixo horizontal é o mais importante. Ele separa principalmente:
de:
A Dimensão 2 explica apenas 5,40%, ajudando no ajuste visual das categorias, mas com importância menor.
1. Autovalores do nosso exemplo
Para o exemplo Perfil do Cliente × Canal de Atendimento, os autovalores foram:
| Dimensão | Autovalor λ | % Inércia | Valor Singular σ |
|---|---|---|---|
| 1 | 0,2283 | 94,60% | 0,4778 |
| 2 | 0,0130 | 5,40% | 0,1141 |
| Total | 0,2413 | 100,00% |
2. Como calcular a % de inércia
Na ANACOR, a ideia é parecida com PCA: cada dimensão explica uma parte da informação total. Mas, em vez de “variância”, usamos o termo inércia, porque estamos analisando a associação entre categorias.
A fórmula é:
Onde:
é o autovalor da dimensão analisada.
E:
é a soma de todos os autovalores não nulos.
Aplicando no nosso exemplo
A soma dos autovalores é:
Para a Dimensão 1:
Para a Dimensão 2:
Somando:
Ou seja:
A Dimensão 1, representada pelo eixo , explica aproximadamente 94,60% da inércia total. Isso significa que quase toda a associação entre Perfil do Cliente e Canal de Atendimento está concentrada nesse primeiro eixo.
A Dimensão 2, representada pelo eixo , explica aproximadamente 5,40% da inércia total. Ela ainda participa do mapa perceptual, mas tem peso muito menor na explicação da associação.
Portanto, no nosso exemplo, o eixo é muito mais importante para a interpretação do gráfico do que o eixo .
Qual categoria é mais representativa? Calcular as massas:
Na ANACOR, as massas mostram o peso relativo de cada categoria na tabela. Em termos simples, elas indicam quais categorias têm maior participação no total da amostra.
A massa é calculada dividindo o total da linha ou da coluna pelo total geral.
1. Tabela observada
| Perfil do Cliente | App | Site | Telefone | Loja Física | Total |
|---|---|---|---|---|---|
| Jovem | 35 | 20 | 5 | 10 | 70 |
| Adulto | 25 | 30 | 15 | 20 | 90 |
| Idoso | 5 | 10 | 25 | 30 | 70 |
| Total | 65 | 60 | 45 | 60 | 230 |
O total geral é:
n = 230
2. Massas das linhas
A massa da linha é calculada por:
Onde:
é o total da linha, e:
n
é o total geral da tabela.
Tabela de massas das linhas
| Perfil do Cliente | Total da linha | Massa |
|---|---|---|
| Jovem | 70 | 0,3043 |
| Adulto | 90 | 0,3913 |
| Idoso | 70 | 0,3043 |
| Total | 230 | 1,0000 |
A categoria de linha mais representativa é:
porque possui a maior massa:
Ou seja, os adultos representam aproximadamente:
do total da amostra.
Tabela de massas das colunas
| Canal de Atendimento | Total da coluna | Massa |
|---|---|---|
| App | 65 | 0,2826 |
| Site | 60 | 0,2609 |
| Telefone | 45 | 0,1957 |
| Loja Física | 60 | 0,2609 |
| Total | 230 | 1,0000 |
A categoria de coluna mais representativa é:
porque possui a maior massa:
Ou seja, o canal App representa aproximadamente:
do total de atendimentos.
As massas indicam quais categorias têm maior peso no conjunto de dados.
No exemplo:
| Tipo de categoria | Categoria mais representativa | Massa | Percentual |
|---|---|---|---|
| Linha | Adulto | 0,3913 | 39,13% |
| Coluna | App | 0,2826 | 28,26% |
Portanto, a categoria mais representativa entre os perfis é Adulto, enquanto a categoria mais representativa entre os canais é App.
Mas atenção: massa alta não significa necessariamente maior associação.
A massa mostra o peso da categoria na amostra. Já a associação é analisada pelos resíduos padronizados ajustados e pela posição no mapa perceptual.
AutoVetores:
Indicam a direção dos eixos fatoriais. Eles ajudam a determinar como as categorias serão posicionadas no espaço.
Mapa Perceptual da Anacor:
