Apache Solr – od podstaw do zaawansowanego
Kategoria: Elasticsearch / Apache Solr
Czas trwania: 3 dni
Adresaci szkolenia
Szkolenie jest skierowane przede wszystkim do programistów, chcących poznać zasady działania wyszukiwarki pełno-tekstowej oraz nauczyć się budowy systemów wyszukiwania w oparciu o jeden z najpopularniejszych silników wyszukiwania Apache Solr.
Krótki opis
W czasie szkolenia uczestnik zdobędzie ogólną wiedzę związaną z wyszukiwaniem pełno-tekstowym oraz nauczy się podstawowej obsługi silnika wyszukiwania Apache Solr, która pozwoli mu wykorzystać tę technologię w projektach wdrożeniowych. Zostanie również wprowadzony w zaawansowane zagadnienia związane z wydajnością, czy zarządzaniem klastrem.
Wymagania
Ze względu na zakres szkolenia – od podstaw do zaawansowanego, nie jest wymagana znajomość Apache Solr, ani tematyki wyszukiwania. Uczestnik musi posiadać jedynie elementarną wiedzę na temat aplikacji webowych napisanych w Javie.
Program
Szkolenie porusza zagadnienia, zawarte w szkoleniu na poziomie podstawowym oraz zaawansowanym
1. Wstęp
• Podstawy Apache Solr
• Przegląd funkcjonalności
• Przykłady zastosowań
• Apache Lucene
• Przygotowanie środowiska
• Panel administracyjny
• Solr cores
• Operacje CRUD
2. Indeksowanie
• Metody indeksowania danych
• Index Handlers
• DataImportHandler
• Apache Tika
• Commitowanie dokumentów
• Indeksowanie batchowe
3. Wyszukiwanie
• Podstawowe parametry
• Stronicowanie
• Pseudo pola
• Parsery zapytań
• Boostowanie
• Filtrowanie wyników
• Facety
• Grupowanie wyników
• Highlighting
4. Model danych
• Schema
• Typy pól
• Atrybuty
• Char filters
• Tokenizery
• Filtry
• Pola dynamiczny
• Kopiowanie pól
5. Skalowanie
• Architektura master – slave
• Konfiguracja
• Replikacja
• Repeater
• Wiele masterów
• Wstęp do Solr Cloud
6. Produkcyjny Apache Solr
• Wymagania sprzętowe
• Ustawienia JVM
• Logowanie
7. Java API – Solr
8. Indeksowanie
• Struktura indeksu
• Zagnieżdżone dokumenty
• Content Streams
9. Wyszukiwanie
• Metody budowania podpowiedzi
• Spellchecker
• More like this
• Clustering
• Terms Component
• Term Vector Component
• Stats Component
• Elevation Component
• Wyszukiwanie przestrzenne
• Zapytania funkcyjne
10. Model danych
• Schemaless
• Schema API
• Zaawansowane atrybuty
• DocValues
11. Trafność wyszukiwania
• Co to jest?
• Ranking
• Obsługa języka
• Wyszukiwanie fonetyczne
• Własny analyzer
• eDismax vs Standard Parser
12. Architektura
• Budowanie klastra
• Zarządzanie klastrem
• Transaction log
• ZooKeeper
• Wybór lidera
• Routing
• Collection API
13. Zaawansowane ustawienia
• Configuration API
• Solrconfig.xml
• Schema factory
• Codec factory
• Directory Factory
• Index Segments
• Garbage collector
• Cache
14. Utrzymanie
• Logi I logowanie zdarzeń
• Monitoring
• Backup
• Instalowanie Apache Solr jako usługi
15. Ekosystem
• SiLK, Logstash, Banana
Informacje organizacyjne szkolenie stacjonarne
Zapewniamy:
- komfortowe, klimatyzowane sale szkoleniowe zlokalizowane w centrum miasta,
- przerwy kawowe: kawa z ekspresu, różne rodzaje herbat, woda, soki, ciastka, owoce,
- lunch: dwudaniowy obiad.
Informacje organizacyjne szkolenia on-line
- Zapewniamy dostęp do platformy do komunikacji audio/wideo (MS TEAMS)
- Uczestnicy szkolenia muszą dysponować laptopem/komputerem z dostępem do Internetu.
Uczestnicy szkolenia otrzymują:
- materiały szkoleniowe – autorskie prezentacje trenerów
- notatniki, długopisy (szkolenie stacjonarne)
- certyfikat ukończenia szkolenia CTS
Szkolenie prowadzone jest standardowo w języku polskim. W grupach zamkniętych możemy zorganizować szkolenie w języku angielskim.
Godziny zajęć: 09:30 – 15:00
Miejsce zajęć: Warszawa – siedziba CTS