Ref: SIBD004

Cassandra - Big Data

Présentiel - 21h

Objectifs

A l'issue de cette formation vous serez capable de : 

  • Connaître les apports de Cassandra
  • Savoir l'installer et le configurer
  • Maîtriser le CQL
  • Administrer et sécuriser un cluster Cassandra
  • Effectuer des calculs distribués avec Spark.

Syllabus

Introduction

  • Historique, fonctionnalités de Cassandra, licence
  • Format des données,"key-value", traitement de volumes importants,
  • haute disponibilité, système réparti de base de données, ...

Installation et configuration

  • Prérequis.
  • Plate-formes supportées.
  • Etude du fichier de configuration : conf/cassandra.yaml
  • Répertoire de travail, de stockage des données, gestion de la mémoire.
  • Démarrage d'un noeud et test de l'interface cliente cqlsh.

CQL

  • Commandes de base : connexion au système de base de données, création de colonnes, insertion, modification recherche,
  • Le CQL : Cassandra Query Language. Exécution de scripts.
  • Comment écrire des requêtes? Approches.
  • Limitations du CQL.

Gestion de la grappe

  • Principe.Préparation du premier noeud : adresse d'écoute.
  • Configuration de nouveaux noeuds.Notion de bootstrapping et de token.
  • Paramètres listen_address et rpc_address.
  • Réplication : topologie du réseau et EndpointSnitch.Stratégie de réplication. Ajout de noeuds, suppression.
  • Architecture de stockage mémoire et disque dur, gestion des tombstones, bloom-filter
  • Travaux pratique : Mise en place d'une configuration de production (multi-datacenters, multi-racks)

Supervision

  • OpsCenter : installation, lancement et découverte.
  • Supervision avec nodetool cfstats
  • Principe des accès JMX. Exports JMX vers des outils de supervision comme Nagios.
  • Démonstration avec Prométheus et Kibana.

Exploitation

  • Gestion des noeuds Cassandra.
  • Sauvegardes, snapshots et export au format JSON.
  • Principe de cohérence, digest request et read repair.

Support Hadoop

  • Principe de map/reduce. Implémentation Hadoop et intégration Hadoop/Cassandra.
  • Support Spark   Description rapide de l'architecture spark. Mise en oeuvre depuis Cassandra.
  • Execution d'application Spark s'appuyant sur une grappe Cassandra.
  • Performance     Outil de test de performance Cassandra-stress
  • Mise en place d'un plan de stress et paramétrage

Comment ?

Méthodes pédagogiques

1 poste et 1 support par stagiaire

8 à 10 stagiaires par salle

Remise d'une documentation pédagogique papier ou numérique pendant le stage

La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience

Évaluation

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne

Attestation de fin de stage remise au stagiaire

Participez à la prochaine session !

S'inscrire

Admission

A qui s’adresse cette formation

Cette formation s'adresse à des Chefs de projet, gestionnaires de bases de données.

Prérequis

Connaissances générales sur les bases de données.

Coût de la formation

Frais pédagogiques

1810€ HT

Tarif Inter-entreprise par personne

Aides au financement

Des dispositifs variés et aides au fnancement existent. N’hésitez pas à nous constulter pour en savoir plus.

En savoir plus sur les dispositifs de financement.

Le Pont Learning