Muitas pessoas olham o Big Data como uma revolução, mas não é bem assim. Esse termo tem grande importância no cenário atual, mas está muito correlacionados a Estatística e ao Data Mining, porém sem serem tão mencionados quanto o termo da moda. Mas você sabe a diferença entre essas três termos? Se ainda não descobriu então vai entender melhor agora.
Comece olhando para o gráfico da Imagem 1 abaixo. Nele é exibido um comparativo entre os termos Estatística, Data Mining e Big Data.
Comece olhando para o gráfico da Imagem 1 abaixo. Nele é exibido um comparativo entre os termos Estatística, Data Mining e Big Data.
É possível dizer que o com a evolução computacional descobre-se o termo Data Mining, sendo as técnicas Estatística transformadas em algoritmos computacionais possibilitando mais agilidade e praticidade em diversas análises de dados. Com o aumento da capacidade de armazenamento de dados e a possibilidade de armazenamento e análise, também de dados não estruturados, temos então a era do Big Data.
É importante ficar claro essa evolução e entender a importância de cada momento. As principais vantagens, com vê-se na Imagem 1 é a variedade e quantidade de dados analisados, variedade e técnicas analíticas utilizadas e uma preocupação com pragmatismo, ou seja busca por valores mais práticos. Toda essa melhoria resulta nos três pilares do Big Data, chamados de 3 V's. São eles Volume, Velocidade e Variedade de dados.
No entanto, uma parte afetada vem sendo a confiabilidade nos resultados. A questão é que com a capacidade de obter, não mais amostras, mas sim populações inteiras de dados, todos aqueles valores passados e importância que se dada para termos resultados significativos está ficando de lado. Com o grande volume de dados e sua atualização constante muitos não se preocupam mais com o "erro", dado que a probabilidade de acertar é bem maior.
Outro ponto que deve ser mencionado, sendo o mesmo de extrema importância e muito citado por Schonberger e Cukier, no livro "Big Data - A Revolution That Will Transform How We Live, Work and Think", é o que estamos saindo da era do Por quê para era do O que. A busca pela causa dos acontecimentos não importa tanto, pois temos dados suficientes e em tempo real para compreender suas tendências e se seguindo essas tendências é possível acertar, então isso basta.
Por último, apresento um gráfico, retirado do Google Trends. Nela é possível ver a quantidade em milhões de buscas pelos termos apresentados nesse artigo. A busca pela Estatística é bem constante, após notamos uma explosão do termo Data Mining e atualmente um crescimento ainda do termo Big Data e redução do Data Mining. É importante termos este conhecimentos, pois os três termos estão muito relacionados e são bem dependentes. Contudo, no mercado atual o termo da moda é o Big Data. Então, será qual o novo termo que aparecerá no bom e velho mercado de coleta, organização e análise de dados?
É importante ficar claro essa evolução e entender a importância de cada momento. As principais vantagens, com vê-se na Imagem 1 é a variedade e quantidade de dados analisados, variedade e técnicas analíticas utilizadas e uma preocupação com pragmatismo, ou seja busca por valores mais práticos. Toda essa melhoria resulta nos três pilares do Big Data, chamados de 3 V's. São eles Volume, Velocidade e Variedade de dados.
No entanto, uma parte afetada vem sendo a confiabilidade nos resultados. A questão é que com a capacidade de obter, não mais amostras, mas sim populações inteiras de dados, todos aqueles valores passados e importância que se dada para termos resultados significativos está ficando de lado. Com o grande volume de dados e sua atualização constante muitos não se preocupam mais com o "erro", dado que a probabilidade de acertar é bem maior.
Outro ponto que deve ser mencionado, sendo o mesmo de extrema importância e muito citado por Schonberger e Cukier, no livro "Big Data - A Revolution That Will Transform How We Live, Work and Think", é o que estamos saindo da era do Por quê para era do O que. A busca pela causa dos acontecimentos não importa tanto, pois temos dados suficientes e em tempo real para compreender suas tendências e se seguindo essas tendências é possível acertar, então isso basta.
Por último, apresento um gráfico, retirado do Google Trends. Nela é possível ver a quantidade em milhões de buscas pelos termos apresentados nesse artigo. A busca pela Estatística é bem constante, após notamos uma explosão do termo Data Mining e atualmente um crescimento ainda do termo Big Data e redução do Data Mining. É importante termos este conhecimentos, pois os três termos estão muito relacionados e são bem dependentes. Contudo, no mercado atual o termo da moda é o Big Data. Então, será qual o novo termo que aparecerá no bom e velho mercado de coleta, organização e análise de dados?