Metadatafiltering

Vector-databases voor embeddings met Pinecone

James Chapman

Curriculum Manager, DataCamp

Metadatafiltering

{
    "genre": "action",
    "year": 2020,
    "color": "blue",
    "fit": "straight",
    "price": 29.99,
    "is_jeans": true,
    "areas": ["London", "Kent", "Bath"]
}
  • Metadata kan strings, getallen, Booleans en lijsten met strings zijn
  • Metadatafiltering: verkleint de zoekruimte en verlaagt de query-latency
1 https://docs.pinecone.io/docs/metadata-filtering
Vector-databases voor embeddings met Pinecone

Metadatafiltering

index.query(
    vector=[-0.250919762305275, ...],

filter={
"genre": {"$eq": "documentary"}, "year": 2019
},
top_k=1 )
1 https://docs.pinecone.io/docs/metadata-filtering
Vector-databases voor embeddings met Pinecone

Metadatafilters

 

  • $eq - Gelijk aan (getal, string, boolean)
  • $ne - Niet gelijk aan (getal, string, boolean)
  • $gt - Groter dan (getal)
  • $gte - Groter of gelijk aan (getal)
  • $lt - Kleiner dan (getal)
  • $lte - Kleiner of gelijk aan (getal)
  • $in - In array (string of getal)
  • $nin - Niet in array (string of getal)
1 https://docs.pinecone.io/docs/metadata-filtering
Vector-databases voor embeddings met Pinecone

Metadatafiltering - groter dan

index.query(
    vector=[-0.250919762305275, ...],

filter={
"year": {"$gt": 2019},
},
top_k=1,
include_metadatas=True
)
{'matches': [{'id': '1', 'score': 0.0478537641,
              'values': [],
              'metadata': {'genre': 'action', 'year': 2020}}],
 'namespace': '',
 'usage': {'read_units': 5}}
Vector-databases voor embeddings met Pinecone

Laten we oefenen!

Vector-databases voor embeddings met Pinecone

Preparing Video For Download...