Apache Kafka et Java

Découvrir

Nos actualités

Apache Kafka et Java : fiabilité, scalabilité et réactivité pour vos architectures événementielles

Dans un contexte technologique en constante évolution, les entreprises doivent concevoir des systèmes capables de traiter des volumes massifs de données en temps réel, tout en garantissant performance, fiabilité et évolutivité. Ainsi, les architectures monolithiques traditionnelles, souvent rigides et peu adaptées au changement, laissent progressivement place à des systèmes distribués et orientés événements, capables de répondre aux besoins modernes en termes de scalabilité, réactivité et résilience.

C’est précisément dans cette dynamique que s’inscrit Apache Kafka, une plateforme de streaming distribuée conçue pour gérer des flux de données en continu de manière efficace. Grâce à son modèle « publish/subscribe », sa persistance native des messages et ses capacités de réplication, Kafka est devenu un pilier des architectures événementielles, notamment dans les environnements microservices, cloud-native, ou encore Big Data.

Par ailleurs, couplé à l’écosystème Java — et plus précisément au framework Spring Boot — Kafka permet une intégration fluide dans des applications modernes. En effet, Spring simplifie considérablement le développement d’applications basées sur Kafka, en apportant abstraction, injection de dépendances, gestion simplifiée de la configuration ainsi qu’un fort support communautaire.

Du concept à la pratique : implémentation d’un projet Kafka en Java

L’objectif de cet article est d’apporter une vision claire et pragmatique de Kafka et de son utilisation dans des projets Java. Dans un premier temps, nous allons découvrir les principes fondamentaux de Kafka, puis explorer ses cas d’usage les plus courants. Enfin, nous mettrons en œuvre un exemple simple en Java avec Spring Boot, le tout orchestré via Docker, afin de permettre une mise en place rapide et reproductible.

Qu'est-ce qu'Apache Kafka ?

Une brique fondatrice des architectures modernes

À l’ère du cloud computing, des microservices et des systèmes fortement découplés, le besoin de traiter, transporter et réagir à des événements en temps réel est devenu central dans les systèmes d’information.
Dans ce contexte, Apache Kafka s’est imposé comme un outil incontournable. Bien plus qu’un simple système de messagerie, Kafka est aujourd’hui considéré comme la colonne vertébrale des architectures événementielles modernes. Cette reconnaissance repose principalement sur trois piliers :

Le modèle Pub/Sub (publish/subscribe)
Le stockage persistant des messages
Le traitement en temps réel

Les composants fondamentaux de Kafka

Afin de bien comprendre le fonctionnement de Kafka, il est essentiel de saisir le rôle de ses composants clés. En effet, chacun d’eux joue une fonction bien définie dans l’acheminement, le stockage et la consommation des messages au sein de l’écosystème Kafka.

Producteurs (Producers)

Concrètement, les producteurs sont les applications ou services qui génèrent des messages et les transmettent à Kafka. Ces messages sont ensuite publiés dans des topics, qui jouent le rôle de canaux de diffusion.
Autrement dit, le producteur ne se préoccupe pas de savoir qui consommera le message : il se contente de transmettre l’information au bon endroit, au bon moment.

Un producteur Kafka peut choisir dynamiquement :

Le topic cible.
La clé du message (qui peut influencer la partition choisie).
Le contenu du message (payload).

Kafka se charge ensuite de distribuer le message dans une partition du topic. En utilisant une clé, on peut garantir que des messages similaires vont dans la même partition — ce qui est crucial pour certains traitements ordonnés.

Topics

Un topic représente un canal logique de communication dans Kafka, comparable à une file de messages ou à une table de logs. C’est au sein de ces topics que les producteurs publient leurs messages, tandis que les consommateurs viennent les lire.

Par ailleurs, chaque topic est divisé en une ou plusieurs partitions, qui constituent des unités de stockage et de parallélisation.

Plus précisément, une partition est un journal ordonné de type append-only (écriture uniquement en fin), dans lequel chaque message se voit attribuer un offset unique, c’est-à-dire un identifiant propre au message dans la partition.

Grâce à ce mécanisme, Kafka peut scaler horizontalement : plusieurs producteurs ou consommateurs peuvent ainsi travailler simultanément sur différentes partitions.

Enfin, Kafka garantit l’ordre des messages à l’intérieur d’une même partition, mais pas entre plusieurs partitions, ce qui constitue un compromis entre performance et ordre strict.

Consommateurs (Consumers)

Les consommateurs sont les applications chargées de lire les messages stockés dans les topics. Kafka adopte ici un modèle de type pull : autrement dit, c’est le consommateur qui vient chercher les messages à son propre rythme, plutôt que de les recevoir automatiquement dès leur publication.

Par ailleurs, les consommateurs peuvent être regroupés en groupes de consommateurs. Ce mécanisme offre plusieurs avantages majeurs :

Il permet de répartir automatiquement les partitions entre les membres du groupe, assurant ainsi un équilibrage de charge.
Il garantit que chaque message est traité une seule fois, par un seul membre du groupe.
Il favorise une scalabilité horizontale, en facilitant l’ajout de nouveaux consommateurs pour gérer un volume croissant de messages.

En complément, chaque consommateur est responsable de la gestion de son propre offset (c’est-à-dire sa position dans la partition).
Ce fonctionnement offre une grande souplesse, notamment en permettant la reprise après une panne, la relecture de messages, ou encore un traitement personnalisé selon les besoins de l’application.

Brokers

Un broker Kafka est un serveur chargé de stocker les données et de traiter les requêtes en provenance des producteurs et des consommateurs. Dans une architecture distribuée, plusieurs brokers sont regroupés au sein d’un cluster Kafka, où ils collaborent pour assurer la performance et la résilience du système.

Plus précisément, les brokers ont pour missions de :

Héberger les partitions associées à différents topics,
Répliquer les données afin de garantir une tolérance aux pannes,
Distribuer les messages et gérer leur répartition en fonction de la charge.

Par ailleurs, chaque partition est hébergée sur un ou plusieurs brokers :

Une partition principale, appelée leader, est responsable des opérations de lecture et d’écriture ;
Les autres brokers hébergent des répliques secondaires, qui sont synchronisées automatiquement avec la partition leader.

Grâce à ce mécanisme de réplication, Kafka assure une haute disponibilité : même en cas de panne d’un broker, les données restent accessibles et le système peut continuer à fonctionner sans interruption.

Pourquoi utiliser Kafka ?

✅ Cas d’usage fréquents :

Traitement d’événements en temps réel : Kafka collecte et transmet des données en continu (capteurs IoT, logs, métriques…) pour des analyses ou actions immédiates.
Communication asynchrone entre microservices : Kafka permet de découpler les services en assurant un échange de messages fiable, scalable et sans dépendance directe.
Intégration entre systèmes legacy et cloud : Kafka sert de passerelle pour synchroniser des applications historiques avec des services modernes ou cloud-native.
Collecte de données massives (Big Data) : Kafka centralise et distribue de gros volumes de données vers des systèmes analytiques (Hadoop, Spark, Elasticsearch…).

✅ Avantages :

Haute performance : peut gérer des millions d’événements/seconde
Scalabilité horizontale : partitionnement automatique
Durabilité : messages persistés sur disque
Tolérance aux pannes : via réplication

Implémentation d’un exemple simple avec Java, Spring Boot et Docker

Après la théorie, place à l’action.

Désormais, nous allons mettre en œuvre un exemple fonctionnel, dans lequel un producteur Kafka envoie des messages à un consommateur, le tout développé en Java avec Spring Boot, puis exécuté localement via Docker Compose.

Stack technique utilisée

Pour cet exemple, nous utiliserons les outils suivants :

Spring Boot : pour créer rapidement une application Java prête à l’emploi.

Spring for Apache Kafka (spring-kafka) : module d’intégration Kafka pour Spring.
Apache Kafka + Zookeeper : les deux sont déployés localement via Docker, grâce aux images officielles de Confluent.

Exemple simple : Producteur et Consommateur

application.yml (Spring Boot)

Dans ce fichier, nous définissons les paramètres de connexion de Kafka côté consommateur :

spring: kafka: bootstrap-servers: localhost:9092 consumer: group-id: group-id-demo auto-offset-reset: earliest

				
					spring:
  kafka:
    bootstrap-servers: localhost:9092
    consumer:
      group-id: group-id-demo
      auto-offset-reset: earliest

bootstrap-servers : l’adresse du broker Kafka (ici, en local).

group-id : identifiant du groupe de consommateurs (nécessaire pour la gestion des offsets).

auto-offset-reset: earliest : permet de lire les messages depuis le début si aucun offset n’est stocké.

Producteur Kafka :

Le producteur est un service Spring Boot qui utilise un KafkaTemplate pour envoyer des messages dans un topic donné.

				
					@Service
public class KafkaProducerService {

    private final KafkaTemplate<String, String> kafkaTemplate;

    public KafkaProducerService(KafkaTemplate<String, String> kafkaTemplate) {
        this.kafkaTemplate = kafkaTemplate;
    }

    public void send(String topic, String message) {
        kafkaTemplate.send(topic, message);
    }
}

				
					@Service
public class KafkaConsumerService {

    @KafkaListener(topics = "demo-topic", groupId = "group-id-demo")
    public void listen(String message) {
        System.out.println("Message reçu : " + message);
    }
}

Le KafkaTemplate est injecté automatiquement par Spring.

La méthode send() prend en paramètre le nom du topic et le contenu du message à publier.

Consommateur Kafka :

Le consommateur utilise l’annotation @KafkaListener pour écouter un topic spécifique et traiter les messages reçus.

@KafkaListener permet d’abonner automatiquement cette méthode au topic demo-topic.

Le message est reçu de manière asynchrone et affiché dans la console.

Docker Compose pour lancer Kafka localement

Voici un fichier docker-compose.yml minimal pour lancer rapidement un environnement Kafka local :

				
					version: '3'
services:
  zookeeper:
    image: confluentinc/cp-zookeeper:7.6.0
    environment:
      ZOOKEEPER_CLIENT_PORT: 2181

  kafka:
    image: confluentinc/cp-kafka:7.6.0
    depends_on:
      - zookeeper
    ports:
      - "9092:9092"
    environment:
      KAFKA_BROKER_ID: 1
      KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://localhost:9092
      KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR: 1

Le service Zookeeper est nécessaire pour la coordination du cluster Kafka.

Le broker Kafka est configuré pour s’exposer en local sur le port 9092.

Lancer et tester l’application

Démarrer Kafka localement : docker-compose up -d
Lancer votre application Spring Boot (mvn spring-boot:run ou via votre IDE).
Injecter un message (ex. via un contrôleur REST ou en appelant directement le service producteur).
Observer les logs : le message est reçu par le consommateur et affiché en console.

Cette démonstration constitue une base solide pour comprendre le fonctionnement de Kafka avec Java. À partir de cette structure, on peut facilement :

Gérer plusieurs topics.
Sérialiser/désérialiser des objets complexes (JSON, Avro…).
Intégrer Kafka Streams pour le traitement côté consommateur.