Big Data, o que é e para que serve | SEIDOR
Seidor
Big Data

17 de novembro de 2022

Big Data, o que é e para que serve

Big Data é uma combinação de dados estruturados, semi-estruturados e não estruturados recolhidos pelas organizações, dos quais se pode extrair informação.

Embora não exista um valor específico que defina quando uma base de dados se torna Big Data, a maioria destas coleções envolve terabytes, petabytes e até exabytes de dados criados e recolhidos ao longo do tempo.

Estes grandes volumes de dados podem provir de uma variedade de fontes (tanto internas como externas) e ser utilizados para uma variedade de projetos, desde sistemas de aprendizagem automática, modelação preditiva e outras aplicações analíticas avançadas.

Os Vs do Big Data

Para definir melhor o que é Big Data, é frequente fazer-se referência a vários Vs que definem estes sistemas:

  • Volume de dados
  • Variedade dos tipos de dados que se armazenam
  • Velocidade com que se geram estes dados
  • Veracidade dos dados recolhidos e utilizados
  • Validade na hora de os utilizar
  • Valor que têm e aportam esses dados
  • Variabilidade, tanto na composição como na frequência e disponibilidade
  • Volatilidade, uma vez que não são eternos nem perenes
  • Viabilidade dos dados
  • Visualização desses mesmos dados

Para que serve o Big Data

Todo este volume de informação precisa de ser processado e analisado de forma a extrair valor de todos estes dados. A forma como é utilizado depende muito do tipo de organização que pretende explorar o Big Data: desde a criação de campanhas de marketing personalizadas até à investigação sobre o cancro. Em última análise, o Big Data permite-lhe atingir os seus objetivos de forma mais rápida, eficaz e eficiente.

O sucesso ou o fracasso de todas estas operações dependerá também muito da qualidade dos dados disponíveis, bem como da limpeza e do tratamento dos dados, das questões colocadas aos sistemas encarregados de tratar toda a informação e da capacidade de análise.

Como dissemos anteriormente, para ter um bom sistema de Big Data, a informação deve provir de várias fontes. Internamente, muitas destas informações provêm do processamento de transações, bases de dados de clientes, documentos, e-mails, registos de cliques na Web, aplicações móveis e redes sociais. Inclui também dados gerados por máquinas, como ficheiros de registo de rede e de servidor e dados de sensores de máquinas de fabrico, equipamento industrial e dispositivos da Internet das Coisas (Internet of Things).

Para além dos dados de sistemas internos, os ambientes de Big Data incorporam frequentemente dados externos sobre consumidores, mercados financeiros, condições meteorológicas e de tráfego, informações geográficas e investigação científica, entre outros. Imagens, vídeos e ficheiros áudio são também formas de Big Data.

Analize de forma ágil os dados do seu negócio

Em qualquer caso, o Big Data permite às empresas analisar todos os dados do seu negócio de forma ágil, para que possam detetar possíveis áreas de melhoria e outras que precisam de ser exploradas para reduzir custos, aumentar as receitas e maximizar os lucros.

A análise de Big Data é uma das partes mais complicadas e importantes deste domínio. Envolve o exame de enormes volumes de dados para encontrar informações ocultas ou menos visíveis, como padrões ocultos, correlações, tendências de mercado, preferências de clientes ou sistemas que podem levar a melhores decisões (baseadas em dados).

Para fazer esta análise, os profissionais de dados (como analistas e cientistas de dados) recolhem, processam, limpam, tratam e analisam as informações e correlacionam-nas com outros conjuntos de dados com aplicações específicas.

Em muitos casos, serão capazes de desenvolver modelos preditivos para automatizar estas tarefas e tornar a empresa ainda mais eficiente e capaz de tirar maior partido de todos estes dados. Para tal, será necessário, em determinadas ocasiões, recorrer a tecnologias como Machine Learning, Deep Learning, Inteligência Artificial, aplicações de Business Intelligence e até de visualização.

Por último, importa referir que, dada a grande capacidade computacional que normalmente é necessária para realizar todas estas operações relacionadas com o Big Data, a maioria das aplicações está baseada na nuvem, uma vez que esta permite uma maior escalabilidade dos sistemas.

Talvez lhe possa interessar

26 de setembro de 2023

Vantagens e desvantagens da proteção de dados na cloud

À medida que cada vez mais organizações se tornam orientadas para os dados, devem assegurar que esta informação seja sempre acessível, segura e protegida.

SEIDOR em PT
24 de março de 2023

O poder da automação

As tecnologias de IoT e RPA são cada vez mais utilizadas pelas organizações que buscam eficiência e rentabilidade. Vantagens e benefícios de uma tendência que cresce de forma vertiginosa no mundo.

01 de fevereiro de 2023

O que é o ChatGPT? E a importância da IA nos negócios

Um dos tópicos de tendência das últimas semanas tem sido o famoso ChatGPT, a razão é muito simples, os seus criadores decidiram lançar este chat a todos e assim surpreender-nos com o seu poder, dar uma mensagem sobre o avanço tecnológico e perguntar-nos o que se seguirá depois desta ferramenta.