📋 Plan de continuité et reprise (PCA/PRA)
| Formation | BTS SIO option SISR — IRIS Mediaschool |
|---|---|
| Bloc | B3 — Cybersécurité des services informatiques |
| Module | M3.4 — Disponibilité, intégrité et confidentialité |
| Durée | 7 heures |
| Prérequis | Administration systèmes et réseaux, notions de virtualisation et sauvegarde |
🎯 Objectifs
- Distinguer PCA (Plan de Continuité d'Activité) et PRA (Plan de Reprise d'Activité)
- Réaliser une analyse d'impact sur l'activité (BIA — Business Impact Analysis)
- Définir les objectifs de temps et de point de reprise (RTO / RPO)
- Concevoir une stratégie de sauvegarde adaptée (règle 3-2-1)
- Planifier et conduire des tests de reprise
- Comprendre les solutions de haute disponibilité et de reprise après sinistre
📖 PCA et PRA : définitions
Le Plan de Continuité d'Activité (PCA)
Le PCA (ou BCP — Business Continuity Plan) est l'ensemble des mesures visant à assurer la continuité des activités essentielles de l'entreprise en cas d'incident majeur. Il couvre l'aspect organisationnel, humain et technique. L'objectif est de minimiser les interruptions et maintenir un niveau minimal de service.
Le Plan de Reprise d'Activité (PRA)
Le PRA (ou DRP — Disaster Recovery Plan) est le volet informatique du PCA. Il définit les procédures pour restaurer le SI après une catastrophe (cyberattaque, incendie, inondation, panne majeure) afin de reprendre l'activité normale dans les délais acceptables.
| Critère | PCA | PRA |
|---|---|---|
| Périmètre | Ensemble de l'entreprise (RH, locaux, SI) | Systèmes d'information uniquement |
| Objectif | Maintenir l'activité minimale | Restaurer le SI |
| Déclenchement | Pendant la crise | Après le sinistre |
| Norme de référence | ISO 22301 | ISO 27031 |
📖 BIA — Business Impact Analysis
Objectifs de la BIA
L'analyse d'impact sur l'activité (BIA) est la première étape de tout projet PCA/PRA. Elle consiste à :
- Identifier les processus métier critiques (sans lesquels l'entreprise ne peut pas fonctionner)
- Quantifier les impacts d'une interruption (financier, réglementaire, réputationnel)
- Définir les dépendances entre processus et systèmes
- Déterminer les seuils d'intolérance à l'interruption
Exemple de BIA
| Processus | Systèmes associés | Impact financier/h | Criticité |
|---|---|---|---|
| Prise de commande en ligne | Site e-commerce, DB clients | 50 000 €/h | 🔴 Critique |
| Messagerie interne | Exchange / Microsoft 365 | 5 000 €/h | 🟠 Élevée |
| Comptabilité | ERP, serveur de fichiers | 2 000 €/h | 🟡 Moyenne |
| Intranet RH | Portail RH | 200 €/h | 🟢 Faible |
📖 RTO et RPO
RTO — Recovery Time Objective
Le RTO (Objectif de Temps de Reprise) est la durée maximale acceptable d'interruption d'un service. C'est le temps dont dispose l'équipe IT pour remettre le service en fonctionnement. Un RTO de 4h signifie que le service doit être restauré dans les 4 heures suivant l'incident.
RPO — Recovery Point Objective
Le RPO (Objectif de Point de Reprise) est la perte de données maximale acceptable, exprimée en durée. Un RPO de 1h signifie qu'en cas de sinistre, on peut tolérer de perdre au maximum 1h de données. Le RPO détermine la fréquence des sauvegardes.
Exemple :
Sinistre survient à 14h00
RPO = 1h → dernière sauvegarde à 13h00 → perte maximale des données de 13h à 14h
RTO = 4h → système restauré au plus tard à 18h00
Chronologie :
13h00 ─── Sauvegarde ─── 14h00 ─── SINISTRE ─── 18h00
↑ ↑ ↑
RPO (1h) Incident Service rétabli
(RTO = 4h)
Réduire le RTO et le RPO coûte exponentiellement plus cher. Un RTO de 4h et RPO de 1h peut coûter 10x moins cher qu'un RTO de 1h et RPO de 5 minutes. La BIA permet de justifier le niveau d'investissement face aux coûts d'interruption.
📖 Stratégie de sauvegarde — Règle 3-2-1
La règle 3-2-1
- 3 copies des données (1 production + 2 sauvegardes)
- 2 types de supports différents (ex : disque interne + bande ou NAS)
- 1 copie hors site (site secondaire, cloud)
Types de sauvegardes
| Type | Données sauvegardées | Durée | Espace |
|---|---|---|---|
| Complète | Toutes les données | Longue | Maximum |
| Incrémentielle | Données modifiées depuis la dernière sauvegarde (complète ou incrémentielle) | Courte | Minimum |
| Différentielle | Données modifiées depuis la dernière sauvegarde complète | Moyenne | Intermédiaire |
| Snapshot | État instantané (VM, système de fichiers) | Très courte | Variable |
Stratégie GFS (Grand-Father-Father-Son)
La stratégie de rotation GFS permet de conserver des sauvegardes sur différentes périodes :
- Son : sauvegardes journalières conservées 7 jours
- Father : sauvegardes hebdomadaires conservées 4 semaines
- Grand-Father : sauvegardes mensuelles conservées 12 mois
# Script de sauvegarde Linux avec rsync
#!/bin/bash
DATE=$(date +%Y%m%d_%H%M)
BACKUP_DIR="/mnt/nas/backup"
SOURCE="/var/www /etc /home"
# Sauvegarde incrémentielle avec rsync
rsync -avz --delete \
--link-dest="$BACKUP_DIR/latest" \
$SOURCE \
"$BACKUP_DIR/$DATE"
# Mettre à jour le lien symbolique "latest"
rm -f "$BACKUP_DIR/latest"
ln -s "$BACKUP_DIR/$DATE" "$BACKUP_DIR/latest"
# Supprimer les sauvegardes de plus de 30 jours
find "$BACKUP_DIR" -maxdepth 1 -type d -mtime +30 -exec rm -rf {} \;
echo "Sauvegarde $DATE terminée" | mail -s "Backup OK" admin@iris.fr
📖 Solutions de haute disponibilité et reprise
| Solution | RTO | RPO | Coût |
|---|---|---|---|
| Cold Standby (site froid) | Heures à jours | Dernier backup | Faible |
| Warm Standby (site tiède) | Minutes à heures | Minutes | Moyen |
| Hot Standby (site chaud) | Secondes à minutes | Secondes | Élevé |
| Active-Active | Basculement automatique | Quasi zéro | Très élevé |
Veeam Backup & Replication — exemple de configuration
# Veeam Backup — Powershell VeeamPSSnapIn
Add-PSSnapin VeeamPSSnapIn
# Créer un job de sauvegarde
$server = Get-VBRServer -Name "vsphere.iris.local"
$vm = Find-VBRViEntity -Name "SRV-WEB-01" -Server $server
Add-VBRViBackupJob `
-Name "Backup_SRV-WEB-01" `
-Entity $vm `
-BackupRepository (Get-VBRBackupRepository -Name "NAS-Backup") `
-GFSKeepMonthly 12 `
-GFSKeepWeekly 4 `
-GFSKeepYearly 2
# Vérifier les points de restauration
Get-VBRRestorePoint -Backup "Backup_SRV-WEB-01" |
Select-Object Name, CreationTime, PointType |
Sort-Object CreationTime -Descending |
Select-Object -First 10
📖 Tests du PRA
Un PRA non testé n'est pas fiable. Les tests permettent de valider les procédures, mesurer les RTO/RPO réels et former les équipes :
| Type de test | Description | Fréquence |
|---|---|---|
| Test de restauration | Restaurer quelques fichiers ou une VM depuis la sauvegarde | Mensuel |
| Test à blanc (Tabletop) | Simulation sur tableau blanc, sans basculement réel | Trimestriel |
| Test de basculement partiel | Basculement d'un ou deux services vers le site secondaire | Semestriel |
| Test de basculement complet | Basculement de tous les services, test de la reprise totale | Annuel |
Des études montrent que 50% des entreprises dont le PRA n'a pas été testé échouent à reprendre l'activité dans les délais prévus lors d'un vrai sinistre. Tester régulièrement et mettre à jour le document après chaque changement d'infrastructure est indispensable.
🛠️ Outils / Ressources
- Veeam Backup & Replication : solution de sauvegarde/réplication VM
- Acronis Cyber Backup : sauvegarde multi-plateformes
- Bacula, Amanda : solutions de sauvegarde open source
- rsync + cron : sauvegarde incrémentielle Linux
- AWS Backup / Azure Backup : sauvegarde cloud
- ISO 22301 : norme internationale de continuité d'activité
- Guide ANSSI — Gestion des crises cyber
📝 QCM — Testez vos connaissances
- Quelle est la différence fondamentale entre PCA et PRA ?
- Un RPO de 4 heures signifie-t-il que le système doit être restauré en 4 heures ?
- Décrivez la règle de sauvegarde 3-2-1.
- Quelle est la différence entre une sauvegarde incrémentielle et différentielle ?
- Qu'est-ce qu'une analyse BIA et pourquoi précède-t-elle la rédaction du PRA ?
- Pourquoi faut-il tester régulièrement son PRA ?
📝 Afficher les corrections
- Le PCA couvre la continuité globale de l'entreprise (RH, locaux, processus), le PRA se concentre sur la restauration du SI. Le PRA est le volet informatique du PCA.
- Non — Le RPO est la perte de données maximale acceptable, pas le délai de restauration. Un RPO de 4h signifie qu'on peut perdre au plus 4h de données (la dernière sauvegarde date d'au plus 4h avant le sinistre). C'est le RTO qui définit le délai de restauration.
- 3 copies des données, sur 2 supports différents, dont 1 copie hors site. Garantit la récupération même en cas de destruction physique du site principal ou de défaillance d'un type de support.
- Incrémentielle : sauvegarde uniquement les données modifiées depuis la dernière sauvegarde (complète ou incrémentielle) — chaîne de restauration longue mais espace minimal. Différentielle : depuis la dernière complète uniquement — restauration plus rapide, espace intermédiaire.
- La BIA identifie les processus critiques, leurs dépendances SI et les impacts d'une interruption. Elle permet de définir les RTO/RPO par service et de prioriser les investissements de continuité selon les enjeux métier réels.
- Car un PRA non testé comporte souvent des erreurs, des lacunes ou des configurations obsolètes. Les tests valident les procédures, mesurent les délais réels, détectent les problèmes avant une vraie crise et forment les équipes aux procédures d'urgence.
