Penyaringan metadata

Database Vektor untuk Embeddings dengan Pinecone

James Chapman

Curriculum Manager, DataCamp

Penyaringan metadata

{
    "genre": "action",
    "year": 2020,
    "color": "blue",
    "fit": "straight",
    "price": 29.99,
    "is_jeans": true,
    "areas": ["London", "Kent", "Bath"]
}
  • Metadata bisa berupa string, number, boolean, dan list string
  • Penyaringan metadata: mengurangi ruang pencarian dan latensi kueri
1 https://docs.pinecone.io/docs/metadata-filtering
Database Vektor untuk Embeddings dengan Pinecone

Penyaringan metadata

index.query(
    vector=[-0.250919762305275, ...],

filter={
"genre": {"$eq": "documentary"}, "year": 2019
},
top_k=1 )
1 https://docs.pinecone.io/docs/metadata-filtering
Database Vektor untuk Embeddings dengan Pinecone

Filter metadata

 

  • $eq - Sama dengan (number, string, boolean)
  • $ne - Tidak sama dengan (number, string, boolean)
  • $gt - Lebih besar dari (number)
  • $gte - Lebih besar atau sama dengan (number)
  • $lt - Lebih kecil dari (number)
  • $lte - Lebih kecil atau sama dengan (number)
  • $in - Dalam array (string atau number)
  • $nin - Tidak dalam array (string atau number)
1 https://docs.pinecone.io/docs/metadata-filtering
Database Vektor untuk Embeddings dengan Pinecone

Penyaringan metadata - lebih besar dari

index.query(
    vector=[-0.250919762305275, ...],

filter={
"year": {"$gt": 2019},
},
top_k=1,
include_metadatas=True
)
{'matches': [{'id': '1', 'score': 0.0478537641,
              'values': [],
              'metadata': {'genre': 'action', 'year': 2020}}],
 'namespace': '',
 'usage': {'read_units': 5}}
Database Vektor untuk Embeddings dengan Pinecone

Ayo berlatih!

Database Vektor untuk Embeddings dengan Pinecone

Preparing Video For Download...