O Facebook está coletando seus dados - 500 terabytes por dia

Admin 3 Views 0 comments
Advertisement

O Facebook está coletando seus dados - 500 terabytes por dia

Com mais de 950 milhões de usuários, o Facebook (s fb) está coletando muitos dados. Toda vez que você clicar em uma notificação, visitar uma página, fazer upload de uma foto ou verificar o link de um amigo, você está gerando dados para que a empresa acompanhe. Multiplique isso por 950 milhões de pessoas, que gastam em média mais de 6,5 horas no site todos os meses, e você tem muita informação para lidar.

Aqui estão algumas das estatísticas que a empresa forneceu quarta-feira para demonstrar o quão grande os dados do Facebook realmente são:

  • 2,5 bilhões de itens de conteúdo compartilhados por dia (atualizações de status + postagens de parede + fotos + vídeos + comentários)
  • 2,7 bilhões de gostos por dia
  • 300 milhões de fotos carregadas por dia
  • 100 petabytes de espaço em disco em um dos maiores clusters Hadoop (HDFS) do FB
  • 105 terabytes de dados digitalizados via Hive, linguagem de consulta Hadoop do Facebook, a cada 30 minutos
  • 70.000 consultas executadas nessas bases de dados por dia
  • 500 + terabytes de novos dados ingeridos nos bancos de dados todos os dias

"Se você não está aproveitando os grandes dados, então você não tem dados importantes, você tem apenas uma pilha de dados", disse Jay Parikh, vice-presidente de infraestrutura do Facebook na quarta-feira. "Tudo é interessante para nós".

Parikh disse que a empresa está constantemente tentando descobrir como melhor analisar e dar sentido aos dados, incluindo fazer testes A / B extensivos em todas as atualizações potenciais do site e certificando-se de que ele responde em tempo real para a entrada do usuário.

"Estamos crescendo rápido, mas todo mundo está crescendo mais rápido", disse ele.


Nemicind all rights reserved, if not specified, are original, reproduced need to indicate the source.