Databricks dévoile son architecture LTAP pour surmonter les limites des systèmes HTAP
Lors de son Data+AI Summit 2026, Databricks a annoncé le lancement imminent de LTAP, une architecture de traitement des données qui vise à éliminer la nécessité de copier les données, les flux ETL, les répliques et les pipelines. LTAP, qui signifie Lake Transactionnal/Analytical Processing, se présente comme une réponse aux défis des systèmes hybrides transactionnels et analytiques (HTAP).
La combinaison des traitements analytiques (OLAP) et transactionnels (OLTP) n’est pas une nouveauté. Cependant, Databricks affirme que les systèmes HTAP actuels ne parviennent pas à éliminer la duplication des données, peuvent engendrer des conflits entre moteurs, et reposent souvent sur des formats de stockage propriétaires. Au lieu de regrouper ces moteurs, Databricks propose une unification de la couche logicielle de stockage, utilisant des formats comme Apache Parquet sous Delta ou Apache Iceberg.
Ali Ghodsi, cofondateur et CEO de Databricks, a déclaré : « Vous pouviez déjà effectuer des opérations OLTP auparavant. Mais vous ne pouviez pas utiliser Iceberg ou Delta comme base de données centrale derrière vos applications nécessitant une faible latence. Aujourd’hui, c’est possible. »
Reynold Xin, cofondateur et architecte en chef, a rappelé que, traditionnellement, les systèmes OLTP et OLAP nécessitent des pipelines complexes de Change Data Capture (CDC) pour gérer la transition entre les formats de données.
Pour simplifier ce processus, Databricks s’appuie sur Neon, une solution acquise pour environ 1 milliard de dollars en mai 2025, qui transforme PostgreSQL en une base de données serverless. Cette architecture, désormais connue sous le nom de Lakebase, découple le stockage du calcul, permettant une gestion plus efficace des données.
Nikita Shamgunov, vice-président chez Databricks, a expliqué que cette nouvelle approche vise à améliorer la cohérence transactionnelle tout en réduisant la latence des écritures grâce à des services appelés Safekeepers et PageServers.
Cependant, des experts, comme Vladimir Churyukin de ServiceNow, soulignent que le volet OLTP pourrait manquer de performances dans ce nouveau système. Churyukin a noté que PostgreSQL gère souvent des requêtes avec une latence de quelques centaines de microsecondes, ce qui pourrait être difficile à atteindre avec le stockage Iceberg.
Malgré ces doutes, l’architecture LTAP pourrait s’avérer efficace pour les applications analytiques, même en quasi-temps réel. Databricks a également annoncé une croissance de son chiffre d’affaires récurrent annuel (ARR) atteignant 6,9 milliards de dollars, avec une augmentation de 80 % par rapport à l’année précédente.
La société prévoit de partager une librairie open source pour faciliter l’intégration de LTAP dans le projet PostgreSQL, ce qui pourrait offrir des perspectives intéressantes sur son fonctionnement.
Source : Databricks Data+AI Summit 2026.
