Projetos de IA e analytics são impulsionados com atualização de open data lakehouse da Cloudera

Projetos de IA e analytics são impulsionados com atualização de open data lakehouse da Cloudera

Nathalia Alcoba
4 min p/ ler 5.0k já leram
ClouderaCloudera

 A Cloudera, única empresa que leva IA aos dados em qualquer lugar, anuncia atualizações em sua plataforma, especificamente o Cloudera Iceberg REST Catalog e o Cloudera Lakehouse Optimizer, reforçando seu compromisso em oferecer o melhor open data lakehouse baseado em Iceberg. Com essas atualizações, o Iceberg REST Catalog fornece a interoperabilidade aberta necessária para compartilhar dados sem atritos, enquanto o Lakehouse Optimizer garante que eles estejam sempre otimizados e com custo reduzido para todos os mecanismos que os acessam, tudo sob governança e segurança unificadas da Cloudera. Esses recursos foram apresentados no EVOLVE25 NYC, principal evento de IA e dados da empresa. 

À medida que as organizações correm para liberar o poder da IA e analytics, enfrentam barreiras significativas: arquiteturas complexas, plataformas isoladas e governança inconsistente. Mover dados entre sistemas para análise ou treinamento de IA aumenta custos, introduz riscos de segurança e atrasa insights. Organizações modernas precisam de arquiteturas abertas, seguras e interoperáveis que suportem dados em qualquer lugar para IA em todo lugar e análises multi-engine sem forçar duplicação de dados ou aprisionamento a fornecedores. 

Iceberg REST Catalog – Menor TCO com mais velocidade 

A Cloudera é a primeira e única fornecedora a integrar o Iceberg REST Catalog em uma plataforma de dados e IA de ciclo completo, viabilizando compartilhamento de dados seguro, sem cópias, e governança unificada em qualquer nuvem ou data center. Isso permite que mecanismos de terceiros acessem dados gerenciados pela Cloudera diretamente — sem copiar ou mover — e garante aplicação consistente de políticas e inteligência de metadados na nuvem pública, data centers e edge. Ao estender o poder do Apache Iceberg com acesso REST, a Cloudera permite que empresas preparem suas estratégias de dados para o futuro mantendo controle, visibilidade e compliance. 

Após essas atualizações, todos os clientes Cloudera em Iceberg passam a contar com interoperabilidade perfeita sem cópias em todo o ecossistema, com conexões a mecanismos líderes de analytics e IA como Snowflake, Databricks, AWS Athena, AWS EMR e Salesforce — com total conformidade ACID e políticas de acesso unificadas. Ganham, ainda, governança em nível corporativo, estendendo controles de acesso detalhados, linhagem e auditoria para ferramentas de terceiros via Shared Data Experience (SDX) da Cloudera, assegurando democratização de dados segura e compliance em escala. Além disso, terão acesso aberto a metadados, com descoberta instantânea de ativos sem ficarem presos a catálogos proprietários, acelerando desenvolvimento de IA e BI com uma fonte de verdade consistente. Finalmente, essas melhorias entregam menor custo total de propriedade e maior velocidade para resultados: clientes relatam até 79% de redução em custos de armazenamento, melhorando a visibilidade entre áreas de negócios — por exemplo, um grande cliente global de satélites obteve essas economias enquanto fortalecia seus pipelines de dados para IA. 

Lakehouse Optimizer – Maior performance de consultas e redução de custos 

O Cloudera Lakehouse Optimizer é um novo serviço inteligente que oferece otimizações automáticas e manutenção de tabelas para Apache Iceberg dentro do lakehouse da Cloudera. Vai além da manutenção básica de tabelas, com tarefas como reescrever manifestos e arquivos de exclusão por posição. Ao otimizar tabelas de forma inteligente, elimina a necessidade de tarefas manuais e custos operacionais, permitindo que os clientes se concentrem em extrair insights. É uma solução aberta, aplicável a qualquer mecanismo compatível com Iceberg em qualquer nuvem pública, oferecendo observação e controle sem precedentes por meio de uma interface única para definição e modificação granular de políticas, que podem ser aplicadas a uma tabela específica ou a um catálogo inteiro, e o serviço será o único do tipo disponível on-premises em um lançamento futuro. Benchmarks internos mostram que esse serviço melhora a performance de consultas em até 13 vezes e reduz custos de armazenamento em 36%. 

“A Cloudera foi pioneira no setor de Big Data e é a única fornecedora de plataforma que continua investindo para tornar o formato de tabela aberta Apache Iceberg pronto para uso empresarial”, disse Leo Brunnick, Chief Product Officer da Cloudera. “Com as novidades de hoje, seguimos entregando flexibilidade, escalabilidade e insights sem concessões, onde e quando as empresas mais precisam. É por isso que as maiores organizações do mundo confiam na Cloudera para levar IA aos seus dados — onde quer que estejam”. 

Cloudera Data Sharing com Iceberg REST Catalog e Cloudera Lakehouse Optimizer já estão disponíveis em GA (General Availability). 

Gostou? Compartilhe com amigos!

O que você achou?

Amei 64
Kkkk 37
Triste 14
Raiva 7

Espere! Não perca isso...

Antes de ir, veja o que acabou de acontecer:

Não, obrigado. Prefiro ficar desinformado.