ELAS – Le moteur de recherche et d’analyse distribué Elasticsearch

Référence : ELAS
Durée : 3 jours (21 heures)

Présentation

Construit sur la base du moteur d’indexation et de recherche Lucene, Elasticsearch a su tirer le maximum de cette librairie open source en y ajoutant des facilités d’interrogation et des fonctions de distribution en cluster autorisant une excellente montée en charge.
Aujourd’hui grâce à sa grande tolérance aux pannes, sa capacité à traiter de gros volumes de données et ses fonctionnalités d’analyse, Elasticsearch est devenu un moteur de recherche très populaire et cela bien au-delà du cercle des développeurs Java, premiers utilisateurs de Lucene.

Cette formation s’adresse à tous ceux désireux d’exploiter ce système de gestion de données. Les API, les stratégies d’indexation et de requêtage seront passées en revue. Par ailleurs, nous ne ferons pas l’impasse sur les principes architecturaux tant ils sont au cœur de la valeur ajoutée d’Elasticsearch. Un TP fil rouge réaliste accompagnera les stagiaires tout au long de leur apprentissage pour ainsi illustrer les cas d’utilisation où le moteur de recherche prend tout son sens.

Programme

Découverte
  • Une surcouche de Lucene
  • Mais qu’est ce que Lucene ?
  • Les apports à la librairie historique
  • Une API CRUD simplifiée
  • Vous avez dit NoSQL ?
  • Les entités d’ES
Architecture logiciel
  • Les nœuds, les indexes et les shards
  • Clusterisé par nature
  • Shard primaire et répliqué
  • Installation et paramétrage
Au cœur de l’API
  • API REST HTTP
  • De nombreux SDK (Java, Python…)
  • Exemples CRUD
  • Illustration avec Curl et NodeJS
  • Protocoles natifs
  • Intégration dans une application Java
Modélisation des données
  • Les enjeux du mapping
  • Les types de données
  • Analysé ou pas ?
  • Choix de l’analyseur
  • Stratégie de jointure
  • Gestion des nested
  • Parent/Enfant avec le type join
Focus sur la recherche
  • Query DSL (Domain Specific Language)
  • Filtres et requêtes
  • Utilisation de Kibana
  • Cumuler filtres et requêtes
  • Les types de recherche (exact, partial, proximity matching…)
  • Recherche géospatiale
  • Mise en cache
  • L’agrégation
  • La Percolation (Percolate Query)
Gestion du scoring
  • Les boost values
  • La fréquence des termes
  • Fréquence des termes dans l’index
  • Le nombre de documents
  • Le facteur taille du document
  • Les fonctions de boost
  • Extension par scripts
Administration et outillage
  • Traitements pipeline
  • Supervision du cluster
  • Sauvegarde et restauration
  • Optimisation des performances
  • La sécurité
  • Collecter les données avec Logstash
  • Installation d’extensions
  • Les plugins essentiels

Prochaines sessions inter-entreprises

Toulouse :
Du 20 au 22 février 2019
Du 06 au 08 mars 2019
Du 19 au 21 juin 2019
Du 15 au 17 juillet 2019

Paris :
Du 16 au 18 septembre 2019
Du 03 au 05 avril 2019
Du 27 au 29 novembre 2019
Du 18 au 20 décembre 2019

Méthode pédagogique

65% de travaux pratiques

Audience

Architectes techniques, développeurs

Versions des technologies

Elasticsearch 6.x

Pré-requis

Quelques notions NoSQL, REST

Tarif

1595 €

Votre nom (obligatoire)

Votre email (obligatoire)

Votre société (obligatoire)

Votre demande