[Pesquisar este blog]

terça-feira, 1 de julho de 2014

Big Data

O uso cada vez maior de computadores e dispositivos digitais, associado ao crescimento da internet e de sua capacidade de transmissão de dados, tornou a produção de informações abundante, em quantidade e velocidade incríveis.
Fonte: http://thumbnails-visually.netdna-ssl.com/big-data_50291c3b16257_w1500.jpg
São páginas na internet; registros de compras com cartões de débito e crédito; transações financeiras; e-mails; postagens em redes sociais; uploads de fotos, músicas e vídeos; torpedos; além de muitos outros conteúdos armazenados em bancos de dados.

Além da tendência para criação de coleções de dados cada vez maiores, a análise e correlação destas grandes massas de registros agrega ainda mais informações derivadas de outros conjuntos. Por exemplo, as fotos salvas num serviço da internet por uma pessoa são um conjunto de dados primário, ao qual podem ser acrescidos comentários e informações de localização. Ao divulgar estas fotos para outros usuários, novas informações podem ser agregadas ao efetuar-se a correlação destas imagens com aquelas compartilhadas pelos demais, o que pode expandir, e muito, o tamanho do conjunto de dados iniciais. Este processo pode ser expandido para outros grupos, resultando em muito mais dados produzidos do que as fotos originais.

Big Data é o termo usado para definir estas coleções gigantescas de dados e as novas técnicas exigidas para seu processamento, pois os modelos tradicionais, além de muito demorados, não são capazes de produzir os resultados desejados.

No Big Data existem alguns aspectos considerados fundamentais, chamados de 4V ou 5V (quatro ou cinco "vês") conforme o autor:
  • Volume
    Capacidade de trabalhar com grandes volumes de dados gerados a partir de múltiplos dispositivos; obtidos de diversos bancos de dados ou oriundos das mídias sociais.
  • Variedade
    Devido a multiplicidade de origens, existem muitos formatos de dados: bancos de dados tradicionais, arquivos de texto, e-mail, imagens, áudio, vídeo e muitos outros formatos. Algumas estimativas apontam que 80-85% dos dados de uma organização não é numérico.
  • Velocidade
    Significa a rapidez tanto da produção dos dados, como da necessidade de seu tratamento para atender as demandas. A explosão do uso de dispositivos móveis integrados a internet, além de etiquetas de RFID e grande disseminação dos computadores estão impulsionando a necessidade crescente de lidar com fluxos de dados em tempo quase real.
  • Veracidade
    Representa a confiabilidade dos dados, pois não adianta dispor de dados em volume e possuir velocidade para seu processamento se as informações não forem corretas.
  • Valor
    É o benefício que pode ser obtido do investimento neste tipo de tecnologia.


Os desafios do Big Data incluem capturar, classificar, armazenar, pesquisar, compartilhar e, principalmente, analisar dados, permitindo sua visualização. As aplicações são igualmente grandes: finanças, negócios, saúde, segurança, transportes, telecomunicações e muitas outras.
Fonte: http://oglobo.globo.com/infograficos/bigdata/bigdata.jpg

Para Saber Mais

Nenhum comentário: