pgvector 10M+ soron · index-döntés, query-mintak, valodi teljesítmény
pgvector 10M soron nem ijeszto · ha a megfeleloo indexet választod. HNSW vs IVFFlat, filter-minták, valódi számok.
pgvector 10M soron nem ijeszto · ha a megfeleloo indexet választod. HNSW vs IVFFlat, filter-minták, valódi számok.
A pgvector-nek 'játék-skálájú' a híre. A hír elavult. Produkciós RAG-ot üzemeltetünk 10M+ soros pgvector-ben, p95 query-latencia 80ms alatt. A kulcs a megfelelo index + a szürö-baráti query. Itt van hogyan.
A legtöbb RAG query tenant_id, document_type vagy recency alapján szür a hasonlóság elott. A pgvector 0.5+ hozta a rendes szürt HNSW-t, de a naiv query-k még mindig túl sokat scan-elnek. Mindig elobb a szelektív szürot alkalmazd.
-- JÓ: tenant-szuro elobb szukit, vektor-kereses kicsi halmazon
SELECT * FROM chunks
WHERE tenant_id = $1 AND created_at > now() - interval '30 days'
ORDER BY embedding <=> $2
LIMIT 10;
-- Index: btree (tenant_id, created_at) + HNSW az embedding-enHa a p95 200ms fölé kúszik, 95%-ban az index nem kerul hasznalatba. Futtasd az EXPLAIN ANALYZE-t, ellenorizd, hogy a HNSW-index megy-e, nem sequential scan. Általában egy WHERE-klauzula tiltja le az indexet.

Szerző
Alapito, DField Solutions
Pénzügyi cégeknél és kreátor-eszközöknél is építettem már olyan rendszereket, amik nap mint nap élesben futnak. Budapesttől San Franciscóig · startupoknak és nagyobb vállalatoknak egyaránt.
Folytatás
HASONLÓ TÉMÁJÚ PROJEKTEK