Big Data

Hadoop & Distributions Ecosystem

You want to store and use information from Big Data through the Hadoop Framework?

Our consultant trainers will give you the benefit of their field experience to help you install, configure, interface and use the modules you need. 

Through case studies you will learn how to use Hadoop Distributed File System (HDFS), YARN, MapReduc, Cassandra, MongoDB.

You will also discover how NoSQL databases work, clusters to build a sustainable architecture and administer your database.  

Hadoop Apache what is it for ?

Its storage capacities and its ability to process and combine data at a lower cost allow the Hadoop Framework to serve as a :

 

  • Sandbox: massive storage + processing capabilities = sandbox for discovering and implementing patterns for prescriptive instruction
  • Data lake: to store raw data for data scientists and analysts
  • Complementing Data Warehouses: some data sets are downloaded directly from the Data Warehouses to Hadoop, and some new data types go directly to Hadoop.
  • Data store: to manage connected objects (IOTs) that need to know what to communicate and when to act.
  • Recommendation creator: Its analytical tools analyze large amounts of data in real time to quickly predict consumer preferences before they have time to leave the web page.

And what about Cloudera?

Cloudera is the most popular Hadoop distribution (it even bought out Hortonworks). It has customizable features:

  • Security
  • Governance
  • SQL
  • Scripting languages (Java ...)
  • Management/administration consoles

 

Our training courses

Filter by

ecosysteme hadoop & distributions

BigQuery

In-site training + virtual classrooms

Duration: 21 hours

Next session : 11/21/2022

ecosysteme hadoop & distributions

BigData avec MongoDB

In-site training + virtual classrooms

Duration: 21 hours

Next session : 09/12/2022

Duration: 21 hours

Next session : 09/26/2022

Duration: 21 hours

Next session : 09/21/2022

ecosysteme hadoop & distributions

Introduction à NoSQL

In-site training + virtual classrooms

Duration: 7 hours

Next session : 09/01/2022

ecosysteme hadoop & distributions

Cassandra - Big Data

In-site training + virtual classrooms

New

Duration: 21 hours

Next session : 09/01/2022

Stroke 1 Created with Sketch.
Stroke 1 Created with Sketch.
Loading...

News

Trends

Google Analytics et CNIL : l’étau semble se resserrer autour des “gatekeepers” du web.

Après l’adoption du Digital Markets Act, l’étau semble se resserrer autour des “gatekeepers” du web. Les gatekeepers, c’est le nom donné aux sociétés technologiques qui jouent le rôle d’intermédiaires gérant l’accès à l’information en ligne. Et aujourd’hui, c’est Google Analytics qui est dans la ligne de mire de la CNIL (Commission nationale de l’informatique et des libertés). Cette dernière s’est en effet récemment emparée de l’épineux sujet des transferts de données hors UE…

LePont

LePont, à l’origine avec Salesforce et un groupement de signataires de l’Initiative “1 000 Femmes dans la Tech”

Dans un contexte qui allie pénurie mondiale de talents dans le numérique à sous-représentation des femmes dans les emplois Tech, il semble de plus en plus nécessaire de mettre en place des initiatives afin de favoriser l’accessibilité des métiers du numérique aux femmes. A l’occasion de la 6ème édition de Viva Technology, qui s’est déroulée du 15 au 18 juin 2022 à Paris, LePont est à l’origine avec Salesforce et un groupement de premiers signataires comme Accenture, Publicis, Capgemini, Deloitte Digital ou encore L’Ecole 42., de l’initiative “1000 Femmes de la Tech”.

Trends

Data Analyst & sport, l'équipe gagnante - 2ème partie

Suite de l'article publié le 21 décembre sur le métier de Data Analyst dans la sphère sportive.