DField SolutionsMérnöki stúdió · Budapest
Loading · Töltődik
Ugrás a tartalomhoz

Embedding

Kapcsolódó szolgáltatás AI megoldások

MEGHATÁROZÁS

Szöveg vektoros reprezentációja (pl. 1536 dimenziós float). Ha két szöveg embeddingje közel van, jelentésük is közel van. RAG-ben ez alapján választjuk ki a releváns chunkokat.

KAPCSOLÓDÓ FOGALMAK06
  • RAG (Retrieval-Augmented Generation)

    Olyan AI-architektúra, ahol a modell minden válasz előtt lekér releváns dokumentumokat a saját adattáradból, és csak a kontextusra támaszkodva válaszol. 80%-ban kivédi a hallucinációt.

  • LLM (Nagy nyelvi modell)

    Milliárdos paraméterszámú neurális modell (GPT-4, Claude, Mistral), ami szöveget generál. Produkcióban ritkán használjuk csupaszon · mindig retrieval és guardrails rétegbe csomagolva.

  • Vector adatbázis

    Adatbázis, ami embedding-vektorok gyors közelséges keresésére specializálódott (pgvector, Qdrant, Weaviate). A RAG retrieval-rétegének mérnöki alapja.

  • Eval (LLM-kiértékelés)

    Automatizált tesztkészlet, ami minden release előtt lefuttat ~50–200 arany (golden) kérdést a modellen, és megnézi hogy a válasz minőségmetrikái (pontosság, faktualitás, latency) átmentek-e a küszöbön.

  • Guardrail

    Input- vagy output-réteg, ami szűri a modell kérdést/válaszát (PII-scrubber, prompt-injection-detektor, JSON-schema validáció, tiltott témák). Nem kerül a modell-hívás elé/után, hanem azok körül.

  • AI-ügynök (Agent)

    Olyan LLM-alapú szoftver, ami eszközöket (API, keresés, DB-lekérdezés) tud hívni, memóriája van, és több lépéses feladatot old meg. Produkcióban minden iteráción guardrail + eval fut.

EMLÍTÉSEK A BLOGON08