A Estatística Multidimensional é uma mistura de duas ou mais técnicas de Estatística Multivariada. Fazendo um "mix" dessas técnicas é possível aumentar mais ainda a capacidade de analisar dados com diversas variáveis. Hoje vamos apresentar uma combinação bem interessante.
Uma mistura possível está entre a Análise de Correspondência Múltipla e a Análise de Conglomerados (Cluster Analysis). Vamos falar rapidamente sobre cada uma delas e dar a dica de como usá-las em conjunto.
Análise de Correspondência Múltipla
Análise de Conglomerados (Cluster Analysis)
Dada as explicações acima, vamos observar que a mistura das duas técnicas será possível quando estivermos tratando de dados onde as variáveis são não-métricas (qualitativas, categóricas, etc.) e pretendemos criar grupos (clusters) a partir delas. Em muitas situações teremos o interesse em fazer análises de agrupamento (conglomerado) para descobrir possíveis grupos. Resumindo: quando queremos fazer uma segmentação. Seja a partir de dados primários, vindos de uma pesquisa de mercado, por exemplo. Ou de dados secundários que já existam em tabelas de alguma empresa.
Quando buscamos esses agrupamentos e nos vemos diante de variáveis categóricas (não-métricas) uma ótima solução é usar Correlação Múltipla e em seguida a Análise de Conglomerado. A grande dica é que para criarmos os cluster precisamos trabalhar com variáveis quantitativas (métricas). Como estamos em um ambiente onde as variáveis são não-métricas, categóricas, usamos a Correspondência para criar dimensões que são métricas. Esses dimensões criadas pela Análise de Correspondência são desenvolvidas a partir das relações existentes entre as categorias das variáveis presentes no estudo.
Com as dimensões sendo "variáveis" quantitativas (métricas) torna-se viável realizar uma Análise de Conglomerado. A análise resultará em grupos (clusters) que ao final podem ser analisados e compreendidos a partir das variáveis categóricas que geraram as dimensões da Análise de Correspondência.
Em próximos posts falaremos mais dessas duas técnicas e seu mix! Fica a dica! Quem tiver interesse em Estatística Multidimensional pode ler um dos meus artigos clicando aqui.
Uma mistura possível está entre a Análise de Correspondência Múltipla e a Análise de Conglomerados (Cluster Analysis). Vamos falar rapidamente sobre cada uma delas e dar a dica de como usá-las em conjunto.
Análise de Correspondência Múltipla
- Utilizada em variáveis não-métricas, ou seja, variáveis qualitativas definidas por atributos ou características categóricas;
- É uma técnica de interdependência. Trabalha com diversas variáveis e busca a associação entre elas;
- Tem como objetivo principal a combinação entre as categorias das variáveis buscando associações que não sejam aleatórias.
Análise de Conglomerados (Cluster Analysis)
- Utilizada em variáveis métricas, ou seja, variáveis quantitativas;
- É uma técnica de interdependência.
- Trabalha com o objetivo de, a partir de um conjunto de variáveis, determinar grupos internamente homogêneos e heterogêneos entre si;
Dada as explicações acima, vamos observar que a mistura das duas técnicas será possível quando estivermos tratando de dados onde as variáveis são não-métricas (qualitativas, categóricas, etc.) e pretendemos criar grupos (clusters) a partir delas. Em muitas situações teremos o interesse em fazer análises de agrupamento (conglomerado) para descobrir possíveis grupos. Resumindo: quando queremos fazer uma segmentação. Seja a partir de dados primários, vindos de uma pesquisa de mercado, por exemplo. Ou de dados secundários que já existam em tabelas de alguma empresa.
Quando buscamos esses agrupamentos e nos vemos diante de variáveis categóricas (não-métricas) uma ótima solução é usar Correlação Múltipla e em seguida a Análise de Conglomerado. A grande dica é que para criarmos os cluster precisamos trabalhar com variáveis quantitativas (métricas). Como estamos em um ambiente onde as variáveis são não-métricas, categóricas, usamos a Correspondência para criar dimensões que são métricas. Esses dimensões criadas pela Análise de Correspondência são desenvolvidas a partir das relações existentes entre as categorias das variáveis presentes no estudo.
Com as dimensões sendo "variáveis" quantitativas (métricas) torna-se viável realizar uma Análise de Conglomerado. A análise resultará em grupos (clusters) que ao final podem ser analisados e compreendidos a partir das variáveis categóricas que geraram as dimensões da Análise de Correspondência.
Em próximos posts falaremos mais dessas duas técnicas e seu mix! Fica a dica! Quem tiver interesse em Estatística Multidimensional pode ler um dos meus artigos clicando aqui.