ELAS – Le moteur de recherche et d’analyse distribué Elasticsearch

Référence : ELAS
Durée : 3 jours (21 heures)

Présentation

Construit sur la base du moteur d’indexation et de recherche Lucene, Elasticsearch a su tirer le maximum de cette librairie open source en y ajoutant des facilités d’interrogation et des fonctions de distribution en cluster autorisant une excellente montée en charge.
Aujourd’hui grâce à sa grande tolérance aux pannes, sa capacité à traiter de gros volumes de données et ses fonctionnalités d’analyse, Elasticsearch est devenu un moteur de recherche très populaire et cela bien au-delà du cercle des développeurs Java, premiers utilisateurs de Lucene.

Cette formation s’adresse à tous ceux désireux d’exploiter ce système de gestion de données. Les API, les stratégies d’indexation et de requêtage seront passées en revue. Par ailleurs, nous ne ferons pas l’impasse sur les principes architecturaux tant ils sont au cœur de la valeur ajoutée d’Elasticsearch. Un TP fil rouge réaliste accompagnera les stagiaires tout au long de leur apprentissage pour ainsi illustrer les cas d’utilisation où le moteur de recherche prend tout son sens.

Programme

Découverte
  • Une surcouche de Lucene
  • Les apports à la librairie historique
  • Une API CRUD simplifiée
  • Vous avez dit NoSQL ?
Architecture logiciel
  • Les nœuds, les indexes et les shards
  • Clusterisé par nature
  • Shard primaire et répliqué
  • Installation et paramétrage
Au cœur de l’API
  • API REST HTTP
  • De nombreux SDK (Java, Python…)
  • Exemples CRUD
  • Illustration avec Curl
  • Intégration dans une application existante
Modélisation des données
  • Les enjeux du mapping
  • Les types de données
  • Analysé ou pas ?
  • Choix de l’analyseur
  • Définir son propre analyseur
  • Relation parent/enfant ou nested objects ?
Focus sur la recherche
  • Recherche simple et composée
  • Filtres et requêtes
  • Tri et pagination des résultats
  • L’agrégation
  • Recherche géospatiale
  • La Percolation (Percolate Query)
Gestion du scoring
  • La fréquence des termes
  • Fréquence des termes dans l’index
  • Le nombre de documents
  • Le facteur taille du champ
  • Les boost
Visualisation des données avec Kibana
  • Kibana : sidebar, searchbar, toolbar, timefilter
  • Les Search (ou vues) avec Discover
  • Les Vizualisation (ou métriques et graphiques) avec Vizualize
  • Gestion des objets : import, export, partage…
Administration et outillage
  • Traitements pipeline
  • Supervision du cluster
  • Sauvegarde et restauration
  • Optimisation des performances
  • La sécurité
  • Collecter les données avec Logstash

Prochaines sessions inter-entreprises

Toulouse :
Du 19 au 21 février 2020
Du 04 au 06 mars 2020
Du 17 au 19 juin 2020
Du 15 au 17 juillet 2020

Paris :
Du 27 au 29 novembre 2019
Du 18 au 20 décembre 2019
Du 01 au 03 avril 2020
Du 16 au 18 septembre 2020
Du 25 au 27 novembre 2020
Du 16 au 18 décembre 2020

Méthode pédagogique

65% de travaux pratiques

Audience

Architectes et chefs de projets techniques, développeurs

Versions des technologies

Elasticsearch 7.x

Pré-requis

Quelques notions NoSQL, REST

Tarif

1595 €

Votre nom (obligatoire)

Votre email (obligatoire)

Votre société (obligatoire)

Votre demande

Mélissa LAJUBERTIE – SOPRA STERIA

« Formation très complète et bien structurée avec TP pour mettre en pratique la théorie. Formateur au top! »