top of page
data.png

A MD2 é parceira da DataBricks, na categoria Databricks Consulting Partners. Databricks Lakehouse é uma plataforma de dados, análises e Inteligência Artificial que revoluciona o mundo de gestão e análise de dados.

O paradigma do Lake House é desenhado como uma plataforma ideal para dados e IA, para gerenciar todos os tipos de dados, que tem arquitetura aberta, segurança e modelo de governança unificada. Não apenas desenhada para gerenciar todos os tipos de dados, mas, também ser agnóstico a nuvem, assim os dados podem ser governados onde estiveram armazenados, Como  seu propósito é dar suporte a todos os principais workloads de dados e IA os times podem colaborar facilmente e acessar todos os dados que precisam para manter inovação e melhorias nos negócios. Todas essas features de arquitetura são implementadas na plataforma Databricks Lake house, incluindo a confiança e desempenho do delta lake e sua fundação, o estado da arte para governança de dados, com Unity Catalog, e casos de uso baseado em Persona (centistas de dados, analistas, engenheiros de dados)

O DataBricks Lakehouse é uma solução de armazenamento de dados big data que combina os benefícios do armazenamento de dados em nuvem com os benefícios do Data Warehouse. Ele é projetado para ajudar as empresas a gerenciar e processar grandes quantidades de dados de várias fontes de maneira consistente e eficiente.

Uma das principais vantagens do DataBricks Lakehouse é sua arquitetura descentralizada, que permite que os dados sejam armazenados em vários locais em vez de em um único local centralizado. Isso torna o sistema mais resiliente e permite que os usuários acessem os dados mais rapidamente, já que eles não precisam ser transferidos de um único local para outro para serem processados.

O DataBricks Lakehouse também inclui uma camada de gerenciamento de metadados que permite que os usuários gerenciem os metadados dos dados armazenados na plataforma, como descrições de tabelas e colunas, tipos de dados e outras informações. Isso permite que os usuários compreendam melhor os dados que estão sendo processados e facilita a colaboração entre os membros da equipe. Além disso, o DataBricks Lakehouse também inclui a solução Delta Lake, que permite que os usuários armazenem, gerenciem e processem dados em formato de tabela de maneira consistente e eficiente.

  • O DataBricks Unity Catalog é um componente da  plataforma para gerenciamento de metadados que permite que os usuários armazenem, gerenciem e compartilhem os metadados dos dados armazenados no DataBricks Lakehouse. Ele inclui uma interface de usuário amigável e APIs REST que permitem aos usuários gerenciar os metadados dos dados de maneira fácil e eficiente. Além disso, o DataBricks Unity Catalog também inclui recursos de governança de dados, como controle de acesso baseado em função e auditoria, que ajudam os usuários a proteger os dados armazenados na plataforma
     

  • O Delta Lake é o componente de armazenamento de dados que permite que os usuários armazenem, gerenciem e processem dados em formato de tabela de maneira consistente e eficiente. Ele foi projetado para ser compatível com o Spark e inclui recursos como versionamento de dados, transações ACID e integração com o DataBricks Unity Catalog, que ajudam os usuários a gerenciar e proteger os dados armazenados na plataforma.
     

  • O Photon é o componente da  plataforma para processamento de dados em grande escala que permite que os usuários façam consultas e execute tarefas de processamento de dados em grande escala usando o Spark. Ele foi projetado para ser compatível com o Delta Lake e inclui recursos como otimização de consultas e integração com o DataBricks Unity Catalog, que ajudam os usuários a acessar e processar rapidamente grandes quantidades de dados de maneira eficiente.

bottom of page