RAG adatszivárgás · hogyan ne szivárogjon ki ügyféladat 2026-ban
A RAG nem csak válaszgenerálás · adatszivárogtató vektor, ha nem vigyázol. 7 minta + 4 réteg védelem.
A RAG nem csak válaszgenerálás · adatszivárogtató vektor, ha nem vigyázol. 7 minta + 4 réteg védelem.
A legtöbb RAG-adatszivárgási incidens, amit 2025-ben láttunk, nem a modellből jött. Az infrastruktúrából. Ez a hét konkrét minta, amit minden RAG-projekten átfuttatunk, és a négy-rétegű védekezés, amit alkalmazunk.
A multi-tenant SaaS klasszikus bugja: a vektor DB nem szűr tenant-ID-ra, így A user kérdésére B tenant dokumentumai jönnek vissza. A pgvector `WHERE tenant_id = $1` klauzula nem opcionális · a hiánya MNB-audit finding, ami élesben kerül 10M+ Ft-ba.
A system prompt, ami tartalmaz belső üzleti logikát vagy ügyfélnevet, kivehető egy jól strukturált prompttal. Tedd minimálisra, amit system promptban adsz meg · a titkokat tool-hívásokba.
Az embedding-vektorok nem titkosítottak. Ha kiteszed őket egy public endpointra (ami gyakori, ha a kereső-API visszaadja a similarity score-okat), egy támadó rekonstruálhatja az eredeti szöveget. Ne legyen publikus endpoint raw embedding-re.
Az LLM provider cache (OpenAI prompt caching, Anthropic cache) timing side-channelt nyit: ugyanaz a cache kulcs gyorsabb válasz = ugyanolyan system prompt. Ezzel egy támadó megállapíthatja, hogy más tenantok milyen rendszer-promptot használnak.
A Datadog/CloudWatch loggolás gyakran lekérdezi a retrieval eredményét debug céllal. Ha a dokumentum tartalmaz személyes adatot (ami RAG esetén tipikus), az most a log-rendszeredben van, GDPR szempontból nem a megfelelő helyen. PII-redaction minden log-pointon.
Ha az A user egy bizalmas dokumentumot töltött fel és kérdezett rá, a RAG-cache (ha egyáltalán cache-elsz válaszokat) ezt kiadhatja B usernek ugyanarra a kérdésre. A válasz-cache kulcsa mindig tartalmazza a user/tenant ID-t.
A legtöbb RAG-UI forrást jelez: ez a válasz ezekből a doksikból jön'. Ha a forrás URL tartalmaz user-ID-t vagy belső doc-ID-t, egy támadó kikövetkeztetheti a doksi létezését, még ha nem is férhet hozzá. Az attribution legyen címszint, ne link.
Az AI-biztonsági audit checklistunk 15 kérdése pont ezekre a pontokra tér rá · futtasd le a sajátodon: /tools/ai-security-audit

Szerző
Alapító, DField Solutions
Pénzügyi cégeknél és kreátor-eszközöknél is építettem már olyan rendszereket, amik nap mint nap élesben futnak. Budapesttől San Franciscóig · startupoknak és nagyobb vállalatoknak egyaránt.
Folytatás
HASONLÓ TÉMÁJÚ PROJEKTEK