Snowflake anunció en marzo de 2026 la disponibilidad en vista previa pública de su soporte para Apache Iceberg v3, la versión más reciente del formato de tablas de código abierto que permite la interoperabilidad de datos entre plataformas. La actualización introduce características clave que incluyen row-level deletes, clustering para tablas gestionadas y un nuevo Variant data type para datos semiestructurados, marcando una expansión significativa de las capacidades de Snowflake en el data lakehouse abierto.
Las nuevas características llegan en un momento en que las organizaciones exigen cada vez más flexibilidad para gestionar datos a través de múltiples plataformas sin dependencia de proveedores. Según el anuncio de Snowflake, la especificación v3 también introduce las estrategias Copy-on-Write (CoW) y Merge-on-Read (MoR), brindando a los usuarios flexibilidad para manejar actualizaciones y borrados de datos.
Más allá de las características principales, la actualización incluye row lineage capabilities que permiten casos de uso de Change Data Capture (CDC) al rastrear modificaciones a nivel de fila, proporcionando a las organizaciones un historial claro de los cambios en los datos. Esta funcionalidad es particularmente valiosa para los requisitos de cumplimiento y auditoría en industrias reguladas.
Dos modelos de gestión distintos
La implementación de Snowflake divide el soporte de Iceberg en dos modelos con diferencias funcionales significativas. Las Snowflake-managed tables ofrecen transacciones ACID completas, soporte para transacciones de múltiples sentencias y capacidades de clustering a través de la función CLUSTERING KEY para la optimización del rendimiento. Estas tablas se benefician de la gestión automática del ciclo de vida de Snowflake, incluida la compactación.
En cambio, las externally-managed tables se integran con catálogos externos como AWS Glue o sistemas REST, pero con limitaciones. Estas tablas admiten autocommit solo para operaciones de escritura y requieren herramientas externas como Spark para su optimización y mantenimiento. Cabe destacar que, si bien las externally-managed tables pueden leer datos en formato v3, el soporte de escritura permanece limitado a la especificación v2, según la documentación de Snowflake.
La distinción se vuelve crítica para las organizaciones que planifican su arquitectura de datos. Las Snowflake-managed tables ofrecen soporte completo para v3, incluyendo deletion vectors, mientras que las externally-managed tables con frecuentes row-level deletes requieren un mantenimiento externo regular para evitar la degradación del rendimiento.
Limitaciones de la vista previa y perspectivas futuras
Al ser una función en vista previa pública, el soporte de v3 está destinado a la evaluación y pruebas, y no al uso en producción. Las limitaciones actuales incluyen la falta de soporte para row-level equality deletes y ciertas propiedades de las tablas. Las características estándar de Snowflake, como Fail-safe, tablas híbridas y evolución de esquema nativa, siguen sin estar disponibles para las tablas Iceberg.
Snowflake no ha anunciado un cronograma para la disponibilidad general, y la hoja de ruta probablemente dependerá de los comentarios de los clientes durante el periodo de vista previa. Las áreas de desarrollo futuro incluyen ampliar el soporte de escritura de v3 a las externally-managed tables y proporcionar rutas de migración claras de las tablas v2 a las v3.
El anuncio posiciona a Snowflake de manera más competitiva en el mercado del open lakehouse, donde la interoperabilidad se ha convertido en un diferenciador clave a medida que las empresas buscan evitar la dependencia de proveedores mientras mantienen un alto rendimiento en diversas cargas de trabajo de datos.
Sources
- Snowflake

