A Cloudera, única empresa que leva IA aos dados em qualquer lugar, anuncia atualizações em sua plataforma, especificamente o Cloudera Iceberg REST Catalog e o Cloudera Lakehouse Optimizer, reforçando seu compromisso em oferecer o melhor open data lakehouse baseado em Iceberg. Com essas atualizações, o Iceberg REST Catalog fornece a interoperabilidade aberta necessária para compartilhar dados sem atritos, enquanto o Lakehouse Optimizer garante que eles estejam sempre otimizados e com custo reduzido para todos os mecanismos que os acessam, tudo sob governança e segurança unificadas da Cloudera. Esses recursos foram apresentados no EVOLVE25 NYC, principal evento de IA e dados da empresa.
À medida que as organizações correm para liberar o poder da IA e analytics, enfrentam barreiras significativas: arquiteturas complexas, plataformas isoladas e governança inconsistente. Mover dados entre sistemas para análise ou treinamento de IA aumenta custos, introduz riscos de segurança e atrasa insights. Organizações modernas precisam de arquiteturas abertas, seguras e interoperáveis que suportem dados em qualquer lugar para IA em todo lugar e análises multi-engine sem forçar duplicação de dados ou aprisionamento a fornecedores.
Iceberg REST Catalog – Menor TCO com mais velocidade
A Cloudera é a primeira e única fornecedora a integrar o Iceberg REST Catalog em uma plataforma de dados e IA de ciclo completo, viabilizando compartilhamento de dados seguro, sem cópias, e governança unificada em qualquer nuvem ou data center. Isso permite que mecanismos de terceiros acessem dados gerenciados pela Cloudera diretamente — sem copiar ou mover — e garante aplicação consistente de políticas e inteligência de metadados na nuvem pública, data centers e edge. Ao estender o poder do Apache Iceberg com acesso REST, a Cloudera permite que empresas preparem suas estratégias de dados para o futuro mantendo controle, visibilidade e compliance.
Após essas atualizações, todos os clientes Cloudera em Iceberg passam a contar com interoperabilidade perfeita sem cópias em todo o ecossistema, com conexões a mecanismos líderes de analytics e IA como Snowflake, Databricks, AWS Athena, AWS EMR e Salesforce — com total conformidade ACID e políticas de acesso unificadas. Ganham, ainda, governança em nível corporativo, estendendo controles de acesso detalhados, linhagem e auditoria para ferramentas de terceiros via Shared Data Experience (SDX) da Cloudera, assegurando democratização de dados segura e compliance em escala. Além disso, terão acesso aberto a metadados, com descoberta instantânea de ativos sem ficarem presos a catálogos proprietários, acelerando desenvolvimento de IA e BI com uma fonte de verdade consistente. Finalmente, essas melhorias entregam menor custo total de propriedade e maior velocidade para resultados: clientes relatam até 79% de redução em custos de armazenamento, melhorando a visibilidade entre áreas de negócios — por exemplo, um grande cliente global de satélites obteve essas economias enquanto fortalecia seus pipelines de dados para IA.
Lakehouse Optimizer – Maior performance de consultas e redução de custos
O Cloudera Lakehouse Optimizer é um novo serviço inteligente que oferece otimizações automáticas e manutenção de tabelas para Apache Iceberg dentro do lakehouse da Cloudera. Vai além da manutenção básica de tabelas, com tarefas como reescrever manifestos e arquivos de exclusão por posição. Ao otimizar tabelas de forma inteligente, elimina a necessidade de tarefas manuais e custos operacionais, permitindo que os clientes se concentrem em extrair insights. É uma solução aberta, aplicável a qualquer mecanismo compatível com Iceberg em qualquer nuvem pública, oferecendo observação e controle sem precedentes por meio de uma interface única para definição e modificação granular de políticas, que podem ser aplicadas a uma tabela específica ou a um catálogo inteiro, e o serviço será o único do tipo disponível on-premises em um lançamento futuro. Benchmarks internos mostram que esse serviço melhora a performance de consultas em até 13 vezes e reduz custos de armazenamento em 36%.
“A Cloudera foi pioneira no setor de Big Data e é a única fornecedora de plataforma que continua investindo para tornar o formato de tabela aberta Apache Iceberg pronto para uso empresarial”, disse Leo Brunnick, Chief Product Officer da Cloudera. “Com as novidades de hoje, seguimos entregando flexibilidade, escalabilidade e insights sem concessões, onde e quando as empresas mais precisam. É por isso que as maiores organizações do mundo confiam na Cloudera para levar IA aos seus dados — onde quer que estejam”.
Cloudera Data Sharing com Iceberg REST Catalog e Cloudera Lakehouse Optimizer já estão disponíveis em GA (General Availability).