ELAS – Le moteur de recherche et d’analyse distribué Elasticsearch

Référence : ELAS
Durée : 3 jours (21 heures)

Présentation

Construit sur la base du moteur d’indexation et de recherche Lucene, Elasticsearch a su tirer le maximum de cette librairie open source en y ajoutant des facilités d’interrogation et des fonctions de distribution en cluster autorisant une excellente montée en charge.
Aujourd’hui grâce à sa grande tolérance aux pannes, sa capacité à traiter de gros volumes de données et ses fonctionnalités d’analyse, Elasticsearch est devenu un moteur de recherche très populaire et cela bien au-delà du cercle des développeurs Java, premiers utilisateurs de Lucene.

Cette formation s’adresse à tous ceux désireux d’exploiter ce système de gestion de données. Les API, les stratégies d’indexation et de requêtage seront passées en revue. Par ailleurs, nous ne ferons pas l’impasse sur les principes architecturaux tant ils sont au cœur de la valeur ajoutée d’Elasticsearch. Un TP fil rouge réaliste accompagnera les stagiaires tout au long de leur apprentissage pour ainsi illustrer les cas d’utilisation où le moteur de recherche prend tout son sens.

Programme

Découverte
  • Une surcouche de Lucene
  • Les apports à la librairie historique
  • Une API CRUD simplifiée
  • Vous avez dit NoSQL ?
Architecture logiciel
  • Les nœuds, les indexes et les shards
  • Clusterisé par nature
  • Shard primaire et répliqué
  • Installation et paramétrage
Au cœur de l’API
  • API REST HTTP
  • De nombreux SDK (Java, Python…)
  • Exemples CRUD
  • Illustration avec Curl
  • Intégration dans une application existante
Modélisation des données
  • Les enjeux du mapping
  • Les types de données
  • Analysé ou pas ?
  • Choix de l’analyseur
  • Définir son propre analyseur
  • Relation parent/enfant ou nested objects ?
Focus sur la recherche
  • Recherche simple et composée
  • Filtres et requêtes
  • Tri et pagination des résultats
  • L’agrégation
  • Recherche géospatiale
  • La Percolation (Percolate Query)
Gestion du scoring
  • La fréquence des termes
  • Fréquence des termes dans l’index
  • Le nombre de documents
  • Le facteur taille du champ
  • Les boost
Visualisation des données avec Kibana
  • Kibana : sidebar, searchbar, toolbar, timefilter
  • Les Search (ou vues) avec Discover
  • Les Vizualisation (ou métriques et graphiques) avec Vizualize
  • Gestion des objets : import, export, partage…
Administration et outillage
  • Traitements pipeline
  • Supervision du cluster
  • Sauvegarde et restauration
  • Optimisation des performances
  • La sécurité
  • Collecter les données avec Logstash

Prochaines sessions inter-entreprises

Toulouse :
Du 17 au 19 février 2021
Du 03 au 05 mars 2021
Du 16 au 18 juin 2021
Du 19 au 21 juillet 2021

Classe virtuelle :
Du 05 au 07 avril 2021
Du 15 au 17 septembre 2021
Du 24 au 26 novembre 2021
Du 15 au 17 décembre 2021

Nous dispensons nos formations dans toute la France, contactez-nous!

Méthode pédagogique

65% de travaux pratiques

Audience

Architectes et chefs de projets techniques, développeurs

Versions des technologies

Elasticsearch 7.x

Pré-requis

Quelques notions NoSQL, REST

Tarif

1595 €

    Votre nom (obligatoire)

    Votre email (obligatoire)

    Votre société (obligatoire)

    Votre demande

    captcha

    Mélissa LAJUBERTIE – SOPRA STERIA

    « Formation très complète et bien structurée avec TP pour mettre en pratique la théorie. Formateur au top! »