O termo Big Data, desde sua popularização, vem sendo utilizado por diversas áreas de conhecimento onde se fala muito em quantidade de registros, variando a partir de 1 ou 2 milhões, e seus cruzamentos, deixando de lado o entendimento sobre o tamanho mínimo necessário e a complexidade para que um processo, e não uma base de dados, possa ser classificada como tal.
Outro dia, lendo mais uma reportagem sobre Big Data, dentre as diversas existentes atualmente, a mesma falava sobre a utilidade dessa tecnologia para bases enormes de dados. Ao ler a parte que mencionava o tamanho dessas bases "enormes", identifiquei que não eram superior a 3 milhões de registros. Se falava a respeito de 3 milhões de posts de alguma rede social que atualmente poderiam ser analisados e gerar ótimas informações. Me assustei com o espanto do entrevistado ao relatar o tamanho de sua base de dados e lembrei dos momentos de modelagens com bases que chegavam a casa dos 90 e 100 milhões de registros. Isso antes de se tornar popular o termo Big Data.
Até onde sei, o público das áreas de Estatística, Matemática e TI já manipula e realiza cálculos com bases até maiores a bastante tempo e bem antes da popularização do tema. Contudo, existem 4 processos que devem ser exaltados e servem de justificativa para o tema. São a coleta dos dados, o armazenamento, possibilidade de interações e a velocidade em gerar informações. Esses quatro componentes são, ao meu ver, os verdadeiros pilares do Big Data. No infográfico abaixo é possível entender essa dinâmica.
Outro dia, lendo mais uma reportagem sobre Big Data, dentre as diversas existentes atualmente, a mesma falava sobre a utilidade dessa tecnologia para bases enormes de dados. Ao ler a parte que mencionava o tamanho dessas bases "enormes", identifiquei que não eram superior a 3 milhões de registros. Se falava a respeito de 3 milhões de posts de alguma rede social que atualmente poderiam ser analisados e gerar ótimas informações. Me assustei com o espanto do entrevistado ao relatar o tamanho de sua base de dados e lembrei dos momentos de modelagens com bases que chegavam a casa dos 90 e 100 milhões de registros. Isso antes de se tornar popular o termo Big Data.
Até onde sei, o público das áreas de Estatística, Matemática e TI já manipula e realiza cálculos com bases até maiores a bastante tempo e bem antes da popularização do tema. Contudo, existem 4 processos que devem ser exaltados e servem de justificativa para o tema. São a coleta dos dados, o armazenamento, possibilidade de interações e a velocidade em gerar informações. Esses quatro componentes são, ao meu ver, os verdadeiros pilares do Big Data. No infográfico abaixo é possível entender essa dinâmica.
Veja outros posts que envolvem Big Data e assuntos similares:
Não confunda "segmentação" com "divisão"
A Estatística está cada vez mais presente no esporte
Análise de Cluster no R
Big Data. O corpo humano pode ser um ótimo exemplo!
Estatística Multivariada. Qual técnica devo usar?
Estatística Multidimensional: segmentação a partir de variáveis categóricas. O que fazer?
Big Data pode ser visto como uma filosofia!
Gostou do Post? Deixe seu comentário!
Não confunda "segmentação" com "divisão"
A Estatística está cada vez mais presente no esporte
Análise de Cluster no R
Big Data. O corpo humano pode ser um ótimo exemplo!
Estatística Multivariada. Qual técnica devo usar?
Estatística Multidimensional: segmentação a partir de variáveis categóricas. O que fazer?
Big Data pode ser visto como uma filosofia!
Gostou do Post? Deixe seu comentário!