Filtraggio dei metadati

Database vettoriali per Embeddings con Pinecone

James Chapman

Curriculum Manager, DataCamp

Filtraggio dei metadati

{
    "genre": "action",
    "year": 2020,
    "color": "blue",
    "fit": "straight",
    "price": 29.99,
    "is_jeans": true,
    "areas": ["London", "Kent", "Bath"]
}
  • I metadati possono essere stringhe, numeri, booleani e liste di stringhe
  • Filtraggio dei metadati: riduce lo spazio di ricerca e la latenza delle query
1 https://docs.pinecone.io/docs/metadata-filtering
Database vettoriali per Embeddings con Pinecone

Filtraggio dei metadati

index.query(
    vector=[-0.250919762305275, ...],

filter={
"genre": {"$eq": "documentary"}, "year": 2019
},
top_k=1 )
1 https://docs.pinecone.io/docs/metadata-filtering
Database vettoriali per Embeddings con Pinecone

Filtri sui metadati

 

  • $eq - Uguale a (numero, stringa, booleano)
  • $ne - Diverso da (numero, stringa, booleano)
  • $gt - Maggiore di (numero)
  • $gte - Maggiore o uguale a (numero)
  • $lt - Minore di (numero)
  • $lte - Minore o uguale a (numero)
  • $in - In array (stringa o numero)
  • $nin - Non in array (stringa o numero)
1 https://docs.pinecone.io/docs/metadata-filtering
Database vettoriali per Embeddings con Pinecone

Filtraggio metadati - maggiore di

index.query(
    vector=[-0.250919762305275, ...],

filter={
"year": {"$gt": 2019},
},
top_k=1,
include_metadatas=True
)
{'matches': [{'id': '1', 'score': 0.0478537641,
              'values': [],
              'metadata': {'genre': 'action', 'year': 2020}}],
 'namespace': '',
 'usage': {'read_units': 5}}
Database vettoriali per Embeddings con Pinecone

Passons à la pratique !

Database vettoriali per Embeddings con Pinecone

Preparing Video For Download...