Cheatsheet sur les bases de données (certification AWS Solution Architect Associate) [FRENCH]

Cet article présente des éléments clés sur les services de base de données en vue de la préparation à la certification AWS Solution Architect Associate.

Service Description
S3 - BLOBs
- Stockage de sites web statiques
Base de données sur EC2 - Contrôle complet sur la base de données
- Moteur de base de données non disponible avec RDS
Athena - Serverless
- Exécute les requêtes en parallèle
- Sauvegarde des résultats des requêtes dans S3
DynamoDB - Base de données NoSQL (document Clé-valeur) pour des données modifiées dynamiquement
- DynamoDB Accelerator (DAX) fournit des temps de réponse en microsecondes
- DynamoDB Streams capture les événements de modification sur les données dans les tables; les enregistrements sont organisés en shards
- DynamoDB Transactions simplifie la coordination des changements dans et à travers les tables (utilise le principe ACID)
- Query effectue une recherche d’items sur es valeurs de la clé primaire
- Scan effectue une lecture de tous les éléments d’une table
- Strongly consistent read (SCR) vs Eventually consistent reads (ECR)
- Capacité : Read Capacity Unit (/s) = 1 SCR ou 2 ECR / item (jusqu’à 4 Ko); Write Capacity Unit (/s) : 1 / item (jusqu’à 1 Ko)
- HTTP 400 est retourné en cas de dépassement
- Adapté pour des structures des données imprévisibles et sous forme de paires nom/valeur
- Adapté en cas de besoin de performances d’E/S plus élevées
- Dimensionnement dynamique
ElastiCache - Stockage temporaire rapide pour de petites quantités de données
- Adapté si les données sont hautement volatiles
- ElastiCache Events permet de déclencher un trigger lors des événements d’ajout de noeud, de modification d’un groupe de sécurité, …
- Parameter Groups permet de spécifier les paramètres utilisés sur le cluster pour contrôler l’utilisation de la mémoire, les stratégies d’éviction, …
- Stratégies de cache : lazy loading (charge les données dans le cache seulement quand c’est nécessaire) ou write through (ajoute les données dans le cache à chaque fois que les données sont écrites dans la base de données)
ElastiCache pour Memcached - Base de données en mémoire (clé-valeur) pour le cache de base de données
- Chaque noeud a son propre endpoint. Le cluster a son propre endpoint pour la configuration.
- Subnet group permet de spécifier un ensemble de subnets où les clusters peuvent tourner
ElastiCache pour Redis - Base de donnés en mémoire (clé-valeur) pour le stockage des sessions Web, les classements
- Repose sur le paradigme publish/subscribe
Neptune - Base de données de type graphe pour les données fortement connectées, basée sur les relations entre les objets
RDS - Bases de données relationnelles OLTP (MySQL, PostgreSQL, MariaDB, Oracle, SQL Server)
- DB Security Groups permet le contrôle d’accès à une instance DB qui ne se trouve pas dans un VPC
- RDS Performance Insights permet de surveiller la charge de l’instance de DB pour analyser et résoudre les problèmes de performance de base de données
- Adapté en cas de besoin d’une base de données relationnelle pour OLTP, si les données sont bien structurées ou dans le cas d’une application existante nécessitant un SGBDR
RDS Aurora - Base de données relationnelle OLTP compatible MySQL, PostgreSQL
- Aurora Serverless permet de démarrer et d’arrêter l’instance et de faire varier la capacité de calcul automatiquement en fonction des besoins
- Endpoints : cluster (pour l’instance primaire), instance (pour une instance spécifique du cluster), reader (pour les réplicas en lecture)
- Aurora MySQL parallel query permet de paralléliser les E/S et du calcul (pour les requêtes intensives)
- DB Cluster permet de créer des clusters d’instances (instance Primary DB et Aurora Replica)
- DB Cluster Configurations permet de sélectionner l’optimisation pour la mémoire ou la performance (burstable)
- Multi Master permet de créer des instances MySQL en lecture/écriture sur plusieurs AZ
- RDS events permet d’être notifié des changements dela configuration de la base de données
RedShift - Base de données OLAP (relationnelle avec stockage par colonne)
- Adapté pour le Data Warehouse, dans le cas d’un volume massif de données
- Database Audit Logging trace les authentifications, les changements de définition de la base de données, les tentatives d’authentification, de connexion, etc …
- Database Querying Options permet de se connecter à un cluster et de lancer des requêtes SQL via ODBC et JDBC
- Enhanced VPC Routing permet d’utiliser VPC pour gérer les flux de données entre le cluster et les autres ressources; utilise VPC Flow Logs pour surveiller COPY et UNLOAD
- Le Leader Node reçoit les requêtes des applications client, analyse les requêtes, développe les plans d’exécution des requêtes et coordonne l’exécution en parallèle sur les Compute Nodes
- Redshift Spectrum permet de lancer des requêtes de plusieurs exabytes de données dans S3 sans avoir à charger ou transformer les données
- Ne support qu’une seule AZ
- Types de noeuds : DS (Dense Storage : utilise HDD, pour les grands volumes de données), DC (Dense Compute : utilise SSD, pour les charges de travail intensives)
SimpleDB Base de données simple quand il y a peu d’enregistrements

Migration des données :

Service Description
Database Migration Service - Migration de bases de données hétérogènes
- Schema Conversion Tool (SCT) permet de convertir le schéma de base de données source vers un format cible
- Basic Schema Copy permet de migrer des éléments de base du schéma
Migration Hub - Traçage du progrès des migrations
Server Migration Service (SMS) - Automatisation de la migration d’un grand nombre de serveurs (dont des bases de données) on-premise
- Version améliorée de EC2 VM Import

Comments

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×