Reliability Engineering: High Availability, Resilience & Observability
Moderne IT-systemen zijn complex, gedistribueerd en continu in beweging. Betrouwbaarheid ontstaat niet vanzelf — het is iets wat je actief moet bouwen, monitoren en verbeteren.
In deze training leer je hoe je systemen ontwikkelt en beheert die stabiel blijven onder druk, fouten gecontroleerd opvangen en continu inzicht geven in hun gedrag. De focus ligt niet alleen op infrastructuur, maar juist op applicaties en microservices: hoe software zich gedraagt in productie en wat nodig is om die betrouwbaar te houden.
Je werkt met principes uit Site Reliability Engineering (SRE) en leert hoe development en operations samenkomen in een DevOps-werkwijze. Je ziet hoe keuzes in applicatiegedrag, afha…
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
Moderne IT-systemen zijn complex, gedistribueerd en continu in beweging. Betrouwbaarheid ontstaat niet vanzelf — het is iets wat je actief moet bouwen, monitoren en verbeteren.
In deze training leer je hoe je systemen ontwikkelt en beheert die stabiel blijven onder druk, fouten gecontroleerd opvangen en continu inzicht geven in hun gedrag. De focus ligt niet alleen op infrastructuur, maar juist op applicaties en microservices: hoe software zich gedraagt in productie en wat nodig is om die betrouwbaar te houden.
Je werkt met principes uit Site Reliability Engineering (SRE) en leert hoe development en operations samenkomen in een DevOps-werkwijze. Je ziet hoe keuzes in applicatiegedrag, afhankelijkheden en integraties direct invloed hebben op beschikbaarheid, performance en herstel.
Je leert hoe je omgaat met failures in de praktijk: van retries en backpressure tot circuit breakers en graceful degradation. Niet als losse patronen, maar als onderdeel van systemen die onder echte belasting blijven functioneren.
Observability speelt een centrale rol: je werkt met metrics, logs en traces en leert hoe je SLI’s, SLO’s en error budgets gebruikt om betrouwbaarheid meetbaar te maken en te sturen op gebruikerservaring.
Daarnaast krijg je inzicht in data reliability en distributed systems gedrag, zoals consistency trade-offs (CAP en PACELC), zodat systemen niet alleen beschikbaar zijn, maar ook correct blijven functioneren.
De training richt zich op de volledige lifecycle: bouwen, deployen, monitoren, valideren en verbeteren. Je leert hoe je reliability actief test met resilience testing en chaos engineering, en hoe je structureel verbetert op basis van productie-data.
Het lesmateriaal (slides) is Nederlandstalig en sluit aan op de
praktijk in moderne IT-organisaties.
Deze training is beschikbaar als klassikale training en als
e-learning. De klassikale training kan zowel op locatie als
virtueel (via Microsoft Teams of Zoom) worden gevolgd. De
e-learning is volledig Nederlandstalig en voorzien van Nederlandse
ondertiteling.
Voor wie:
Deze training is gericht op technische professionals die betrokken
zijn bij het bouwen, draaien en verbeteren van moderne
IT-systemen.
Denk aan:
- DevOps en platform engineers
- Software engineers
- Solution en cloud architects
- IT managers en technisch verantwoordelijken
Wat je leert:
- Hoe systemen en microservices zich gedragen onder fouten en piekbelasting
- High availability en failover in de praktijk (zones, regio’s, dependencies)
- Resilience strategieën zoals retries, backpressure, circuit breakers en graceful degradation
- Hoe je SLI’s, SLO’s en error budgets gebruikt om reliability te sturen
- Observability met metrics, logs en traces en de stap naar system intelligence
- Trade-offs in distributed systems zoals CAP, PACELC en consistency vs availability
- Hoe je data reliability borgt (replicatie, recovery, integriteit en consistency)
- Hoe je reliability valideert met testing en chaos engineering
Resultaat:
Na deze training kun je:
- Systemen en microservices betrouwbaarder maken in productie
- Problemen sneller detecteren, begrijpen en oplossen met observability
- Betere keuzes maken in hoe systemen omgaan met failures en afhankelijkheden
- Reliability koppelen aan gebruikerservaring en business impact
- Effectiever samenwerken binnen DevOps teams
- Structureel werken aan verbetering van betrouwbaarheid in plaats van alleen incidenten oplossen
Cursusagenda
Wat je leert in deze training Reliability Engineering
- Architectuur in de praktijk
Begrijp hoe systemen in de praktijk continu veranderen en waarom eenvoud en trade-offs bepalend zijn voor beheerbaarheid en betrouwbaarheid. - Scope, mindset en een gedeelde taal
Introductie in reliability engineering, SLI/SLO en error budgets als stuurmiddel voor productie-systemen. - Software resilience en ontwerpen voor falen
Maak applicaties en microservices robuust met patronen zoals retries, backoff, circuit breakers en isolatie. - High availability architectuur
Begrijp hoe systemen beschikbaar blijven met redundantie, failover en beperking van blast radius. - Veilige veranderingen en delivery-betrouwbaarheid
Werk met CI/CD, GitOps en progressive delivery om veilig en gecontroleerd wijzigingen door te voeren. - Data-betrouwbaarheid en state management
Beheers data consistency, replicatie en herstel in distributed systemen. - Resilience validatie en chaos engineering
Test en valideer gedrag onder stress met realistische scenario’s en experimenten. - System intelligence en observability
Gebruik metrics, logs en traces om systemen te begrijpen en te sturen. - Adoptie, governance en reliability maturity
Implementeer structurele verbetering met governance, platform engineering en continue feedbackloops.
Deze training helpt je om systemen niet alleen te bouwen, maar ze ook betrouwbaar te laten draaien in de praktijk.
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

