Hoje em dia trabalhar com muitos dados é normal. Qualquer empresa, por menor que seja, pode fazer um bom "banco de dados". Seja usando softwares próprios para isso ou mesmo dezenas de planilhas de Excel bem organizadas. Talvez em Access também. O certo é que com a facilidade da informática as bases de dados continuam aumentando cada vez mais.Com isso muitas técnicas de Estatística Multivariada foram desenvolvidas e cada uma com seu propósito. Meu objetivo hoje é falar um pouco sobre suas possibilidades!
Um ponto importante para se trabalhar com Multivariada é ter inicialmente uma base de dados bem organizada. Prezar por dados bem estruturados é fundamental. Então vejamos a estrutura mais simples e fundamental para se realizar uma análise multivariada. Nos principais softwares a maneira mais padronizada de se ter os dados é a seguinte:
Um ponto importante para se trabalhar com Multivariada é ter inicialmente uma base de dados bem organizada. Prezar por dados bem estruturados é fundamental. Então vejamos a estrutura mais simples e fundamental para se realizar uma análise multivariada. Nos principais softwares a maneira mais padronizada de se ter os dados é a seguinte:
Como é possível visualizar na Figura 1 a estrutura ideal deve conter em sua primeira linha o nome das variáveis. Sendo assim, cada coluna refere-se a uma variável. Nas demais linhas estão relacionados os casos referentes a cada uma das variáveis. Lembrando que cada linha completa será referente a um registro. Cada linha pode ser compreendida como sendo um vetor que, para cada uma das variáveis propostas, contempla um resultado dentro dos valores possíveis de serem apresentados por cada variável.
Melhorando o visual para entender melhor a disposição dos dados segue a Figura 2 como um exemplo de simples entendimento:
Melhorando o visual para entender melhor a disposição dos dados segue a Figura 2 como um exemplo de simples entendimento:
Como é possível ver na Figura 2, temos uma variável que será a "chave" dessa base. Ela quem torna cada registro (linha) único. Os demais casos nas outras variáveis podem até se repetir, mas a chave será única para identificá-los como registros diferentes.
Ainda nessa tabela é possível notar que temos dois tipos de variáveis: string (sequencial, texto, etc) e numeric (numérica). As numéricas podem ser contínuas ou discretas e são contáveis, quantitativas. Já as string, por exemplo, são categóricas, qualitativas! Quando estivermos falando sobre Multivariada vamos chamá-las de variáveis métricas e não-métricas.
Agora, após esse entendimento inicial começa a sua escolha por uma técnica de Multivariada. Após organizar bem os dados para se ter eficiência quando utilizar as técnicas vamos fazer a seguinte perguntas:quero uma técnica de interdependência ou dependência?
Ainda nessa tabela é possível notar que temos dois tipos de variáveis: string (sequencial, texto, etc) e numeric (numérica). As numéricas podem ser contínuas ou discretas e são contáveis, quantitativas. Já as string, por exemplo, são categóricas, qualitativas! Quando estivermos falando sobre Multivariada vamos chamá-las de variáveis métricas e não-métricas.
Agora, após esse entendimento inicial começa a sua escolha por uma técnica de Multivariada. Após organizar bem os dados para se ter eficiência quando utilizar as técnicas vamos fazer a seguinte perguntas:quero uma técnica de interdependência ou dependência?
Na Figura 3 é possível ver uma estrutura de organograma que mostra que existem dois grandes grupos na multivariada. Segundo Fávero et al (2009), um pesquisador pode ter interesse na inter-relação de muitas variáveis, a fim de ser possível avaliar associações (se forem não métricas) ou as correlações (se forem métricas) entre elas. Nesse caso estamos nos referindo as técnicas de interdependência.
Já as técnicas de dependência, segundo Fávero et al (2009), como o próprio nome diz, referem-se à determinação de modelos nos quais uma ou mais variáveis são dependentes do comportamento de outra (s) variável (is).
Vejamos quais são as técnicas muito conhecidas para interdependência:
Já as técnicas de dependência, segundo Fávero et al (2009), como o próprio nome diz, referem-se à determinação de modelos nos quais uma ou mais variáveis são dependentes do comportamento de outra (s) variável (is).
Vejamos quais são as técnicas muito conhecidas para interdependência:
Vejamos agora as mais usadas técnicas de dependência:
Espero que essa pequena introdução sobre as técnicas de Multivariada já seja uma ajuda e some ao conhecimento dos leitores do blog. Mas adiante estaremos falando melhor de cada uma dessas técnicas com o objetivo de difundir esse conhecimento e trocarmos experiências. Até o próximo post!