Snowflake kündigte im März 2026 die öffentliche Vorschau für die Unterstützung von Apache Iceberg v3 an – der neuesten Version des Open-Source-Tabellenformats, das die plattformübergreifende Dateninteroperabilität ermöglicht. Das Update führt Schlüsselfunktionen ein, darunter row-level deletes, Clustering für verwaltete Tabellen und einen neuen Variant data type für semistrukturierte Daten, was eine signifikante Erweiterung von Snowflakes offenen Data-Lakehouse-Fähigkeiten darstellt.
Die neuen Funktionen bedienen die steigende Nachfrage von Organisationen nach Flexibilität bei der Verwaltung von Daten über mehrere Plattformen hinweg ohne Vendor-Lock-in. Laut der Ankündigung von Snowflake führt die v3-Spezifikation auch Strategien für Copy-on-Write (CoW) und Merge-on-Read (MoR) ein, was Nutzern Flexibilität im Umgang mit Datenaktualisierungen und Löschungen bietet.
Darüber hinaus umfasst das Update row lineage capabilities, die Anwendungsfälle für Change Data Capture (CDC) ermöglichen, indem sie Änderungen auf Zeilenebene nachverfolgen und Organisationen eine klare Historie der Datenänderungen liefern. Diese Funktionalität ist besonders wertvoll für Compliance- und Audit-Anforderungen in regulierten Branchen.
Zwei unterschiedliche Verwaltungsmodelle
Die Implementierung von Snowflake unterteilt den Support für Iceberg-Tabellen in zwei Modelle mit signifikanten funktionalen Unterschieden. Snowflake-managed tables bieten vollständige ACID-Transaktionen, Unterstützung für Multi-Statement-Transaktionen und Clustering-Fähigkeiten durch das CLUSTERING KEY-Feature zur Leistungsoptimierung. Diese Tabellen profitieren von Snowflakes automatisiertem Lifecycle-Management, einschließlich Kompaktierung.
Im Gegensatz dazu integrieren sich externally-managed tables in externe Kataloge wie AWS Glue oder REST-Systeme, bringen jedoch Einschränkungen mit sich. Diese Tabellen unterstützen Autocommit lediglich für Schreiboperationen und erfordern externe Tools wie Spark zur Optimierung und Wartung. Bemerkenswert ist, dass externally-managed Tabellen zwar Daten im v3-Format lesen können, die Schreibunterstützung laut der Dokumentation von Snowflake jedoch auf die v2-Spezifikation beschränkt bleibt.
Diese Unterscheidung ist entscheidend für Organisationen, die ihre Datenarchitektur planen. Snowflake-managed tables bieten vollständige v3-Funktionalität, einschließlich Löschvektoren, während externally-managed Tabellen bei häufigen row-level deletes regelmäßige externe Wartung erfordern, um Leistungsabfälle zu verhindern.
Vorschau-Beschränkungen und Zukunftsaussichten
Als öffentliche Vorschaufunktion ist die v3-Unterstützung zur Bewertung und Erprobung gedacht und nicht für den Produktionseinsatz vorgesehen. Zu den aktuellen Einschränkungen zählt der Mangel an Unterstützung für row-level equality deletes und bestimmte Tabelleneigenschaften. Standardfunktionen von Snowflake wie Fail-safe, Hybridtabellen und native Schema Evolution bleiben für Iceberg-Tabellen weiterhin nicht verfügbar.
Snowflake hat keinen Zeitplan für die allgemeine Verfügbarkeit angekündigt, wobei der Fahrplan voraussichtlich vom Kundenfeedback während der Vorschauphase abhängen wird. Zukünftige Entwicklungsbereiche umfassen die Erweiterung der v3-Schreibunterstützung auf externally-managed Tabellen und die Bereitstellung klarer Migrationspfade von v2- zu v3-Tabellen.
Die Ankündigung positioniert Snowflake wettbewerbsfähiger im Open-Lakehouse-Markt, in dem Interoperabilität zu einem wichtigen Differenzierungsmerkmal geworden ist, da Unternehmen bestrebt sind, Vendor-Lock-in zu vermeiden und gleichzeitig eine hohe Leistung über verschiedene Daten-Workloads hinweg beizubehalten.
Sources
- Snowflake

