Nós dias atuais com o advento do Big Data, é muito comum as empresas ficarem na dúvida sobre o que escolher. Um Data Lake ou um Data warehouse. Para ficar menos repetitivo vamos passar a chamar de DL (Data Lake) e DW (Data Warehouse)

Para facilitar nosso entendimento, vamos pensar em 3 pontos principais: 

  • Volumetria
  • Flexibilidade
  • Compartilhamento
  • ROI

Volumetria

Ambos, DL e DW, funcionam como um depósito de dados, porém os DL’s são enormes e permitem o crescimento de informações em um ritmo mais rápido. Sendo possível inserir elementos de diferentes tipos – estruturados, semi-estruturados ou não estruturados – e isso, além de permitir um armazenamento maior, também aumenta a descoberta de novas informações e cruzamentos entre os conteúdos analisados. Pois parte do princípio que toda informação pode ser analisada e entendida, sem necessidade de definição anterior, o que normalmente acontece em um DW.

Os insights extraídos dos dados são valiosos, porém podem tomar muito tempo, caso o DL esteja desorganizado ou mal estruturado. Neste momento os profissionais atuam parar garantir a organização da estrutura, como sinalizar os prazos para retenção de informações, demandas do compliance ou da governança corporativa, além de práticas para manter a segurança digital.

Flexibilidade

DW’s são criados para reunir dados relevantes ao negócio. Para isso, é preciso saber quais perguntas esses elementos responderão, e havendo novas demandas, deve-se ter em mente que talvez não sejam atendidas devido ao tipo de estrutura definida.

Já os DL’s, deixam que a informação venha de múltiplas fontes e tenha qualquer formato. Não é necessário definir quais perguntas serão respondidas pelos dados, o que dá mais flexibilidade para criar novos tópicos conforme a demanda.

Compartilhamento

É necessário entender que o Big Data é feito por e para pessoas, afinal, os resultados analíticos possuem uma grande importância nos processos. Porém, nem sempre estará disponível a todos. Os DW’s muitas vezes ficam isolados e sem acesso da maioria dos funcionários. Os DL’s, por outro lado, foram criados para que a informação seja compartilhada com vários usuários, além de ser agrupada conforme a necessidade.

Investimento e Retorno (ROI)

Na avaliação dos custos da construção dessas estruturas, além da aquisição do equipamento e do sistema, as empresas devem considerar resultados que serão obtidos. DW’s demandam um alto investimento de tempo e dinheiro, e antes de tudo é preciso uma preparação para que seja usado.

Já os DL’s operam de forma mais rápida e eficiente. Sua construção também é cara, e é possível armazenar uma quantidade muito maior de informações que são analisadas de maneira muito mais rápida e ampla por cientista de dados ou analistas. Esse fluxo, por sua vez, resulta em insights que trarão valor para o negócio.

Conclusão

O mundo está mudando rapidamente, novas tecnologias estão chegando todos os dias. E, hoje, os dados são o novo OIL do momento. E nenhuma informação é descartada sendo, de preferência, tudo armazenado. Então devemos entender que não temos como fugir disso, é e necessário estar preparado para o mercado.