Hoje com o advento do Big Data é cada vez mais comum as empresas irem em direção dos dados. O Data Driven apesar de ser algo já comum no vocabulário de muitas empresas, ainda existe muitas dúvidas sobre como criar o ambiente de Big Data.

Muitos alunos vêm até mim, querendo entender o que pode ser melhor para montagem do ambiente. Se é melhor usar um Serviço na nuvem (SaaS), instalar manualmente um cluster na nuvem ou usar um ambiente on premise. Essa é uma pergunta cujo a resposta está mais voltado a necessidade, capacidade e recursos disponíveis em cada empresa.

Serviço na Nuvem – SAAS

Software como serviço, do inglês Software as a service (SaaS), é uma forma de distribuição e comercialização de software. No SaaS, o fornecedor do software se responsabiliza por toda a estrutura necessária  (servidores, conectividade, segurança e etc). Modelo muito recomendado pela fácil interação, onde  o cliente utiliza o software via internet, pagando um valor pelo serviço.

É comum um serviço ser oferecido pela Cloud, como AWS ou Google Cloud. Este modelo trás muita vantagem para o negócio, assim sendo sempre indicado por oferecer facilidades que as outras opções não oferecem. Muito útil para quando o negócio está iniciando ou para fazer POC (Proof of Concept).

Obviamente tem suas desvantagens, a principal é o preço elevado, seguido pela amarração que seu negócio terá a ferramenta. Ao trocar um serviço de uma Cloud para outro, será feito um esforço muito grande. Um serviço que existe na AWS, é exclusivo da AWS e ao migrar para o Google Cloud, por exemplo, não haverá um produto igual. Apesar de existirem ferramentas similares, a migração para outra Cloud pode ser uma tarefa árdua.

Ambiente na nuvem – IaaS

O IaaS é a parte encarregada por prover toda a infraestrutura necessária para a PaaS e o SaaS. O principal objetivo do IaaS é tornar mais fácil e acessível o fornecimento de recursos, tais como servidores, rede, armazenamento e outros recursos de computação essenciais para construir um ambiente sob demanda, que podem incorporar sistemas operacionais e aplicativos.

Este ao meu ver, seria a melhor opção devido ao custo/benefício. Aqui o valor é mais em conta em relação ao SaaS, e lhe dá toda a capacidade de controle do ambiente. Podendo, se necessário, migrar os ambientes entre Cloud de maneira muito mais facilitada. Sendo possível utilizar, por exemplo, receitas para montagem dos ambientes com uso de Devops.

Da mesma forma que o SaaS, existe algumas desvantagens neste modelo. É um modelo mais baixo nível, sendo assim  necessário profissionais para dar suporte no gerenciamento dessas máquinas. O mercado brasileiro carece de profissionais nesta area. Este modelo é indicado para empresas que já possuem profissionais na area, e com negócio já consolidado no mercado.

Ambiente on premise 

Ambientes on premise são desnecessários para a maioria das empresas, já que demanda muitos recursos e esforço. Além de elevar o custo, faz com que a empresa deixe de focar no negócio para focar na TI. Eu já presenciei casos onde a area de TI era duas vezes maior que as outras areas da empresa juntas. Gasto com pessoal para dar suporte aos equipamentos, aos serviços, além das boas práticas para garantir seguridade para o data center. 

Apesar de ser algo desnecessário para a maioria das empresas, em alguns casos não há como fugir disso. Um caso muito comum são as instituições financeiras que por lei, são obrigadas a possuírem seu próprio data center, que eles também chamam de nuvem.

Conclusão

Não preciso nem dizer que Cloud é o futuro que já está no presente de muitas empresas. Se ficarmos atentos como gastamos energia ao definirmos ambientes nas empresas, veremos que existe opções muito mais vantajosas e práticas que fazem com que as empresas foquem no negócio e não mais na TI.