🎯 Definicja
Wektorowe Bazy Danych (np. Pinecone, Weaviate, Milvus) działają jako pamięć długoterminowa dla modeli językowych. Pozwalają LLM-om “pamiętać” informacje spoza ich treningu (np. Twoje prywatne maile, dokumentację firmy) poprzez wyszukiwanie semantyczne.
🔑 Kluczowe punkty
- Semantic Search: Szukanie po znaczeniu, nie po słowach kluczowych (np. szukając “smutny film” znajdzie “Dramat”, mimo że słowa są inne).
- Embeddingi: Teksty zamienione na ciągi liczb (wektory). Podobne teksty są blisko siebie w przestrzeni matematycznej.
- RAG: Baza wektorowa karmi LLM wiedzą w czasie rzeczywistym.
📚 Szczegółowe wyjaśnienie
Jak to działa?
- Użytkownik wysyła pytanie.
- System zamienia pytanie na wektor (Embedding).
- Baza danych szuka wektorów “najbliższych” temu pytaniu (kosinusowe podobieństwo).
- Znalezione fragmenty tekstów są doklejane do promptu LLM.
- LLM odpowiada, korzystając z tej wiedzy.
💡 Przykład zastosowania
Chatbot obsługi klienta. Zamiast trenować model na nowo (co kosztuje miliony), wrzucasz instrukcje PDF do bazy wektorowej. Gdy klient pyta o “zwrot towaru”, baza znajduje odpowiedni fragment regulaminu i chatbot go cytuje.
📌 Źródła
- “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”.
👽 Brudnopis
- Bazy wektorowe rozwiązały problem “nieaktualnej wiedzy” w modelach (GPT-4 wiedział tylko rzeczy do 2023 roku; z bazą wektorową wie to, co wrzuciłeś przed chwilą).