Filtrage par métadonnées

Bases de données vectorielles pour les intégrations avec Pinecone

James Chapman

Curriculum Manager, DataCamp

Filtrage par métadonnées

{
    "genre": "action",
    "year": 2020,
    "color": "blue",
    "fit": "straight",
    "price": 29.99,
    "is_jeans": true,
    "areas": ["London", "Kent", "Bath"]
}
  • Les métadonnées peuvent être des chaînes, nombres, booléens et listes de chaînes
  • Filtrage par métadonnées : réduit l’espace de recherche et la latence de requête
1 https://docs.pinecone.io/docs/metadata-filtering
Bases de données vectorielles pour les intégrations avec Pinecone

Filtrage par métadonnées

index.query(
    vector=[-0.250919762305275, ...],

filter={
"genre": {"$eq": "documentary"}, "year": 2019
},
top_k=1 )
1 https://docs.pinecone.io/docs/metadata-filtering
Bases de données vectorielles pour les intégrations avec Pinecone

Filtres de métadonnées

 

  • $eq - Égal à (nombre, chaîne, booléen)
  • $ne - Différent de (nombre, chaîne, booléen)
  • $gt - Supérieur à (nombre)
  • $gte - Supérieur ou égal à (nombre)
  • $lt - Inférieur à (nombre)
  • $lte - Inférieur ou égal à (nombre)
  • $in - Dans le tableau (chaîne ou nombre)
  • $nin - Pas dans le tableau (chaîne ou nombre)
1 https://docs.pinecone.io/docs/metadata-filtering
Bases de données vectorielles pour les intégrations avec Pinecone

Filtrage par métadonnées - supérieur à

index.query(
    vector=[-0.250919762305275, ...],

filter={
"year": {"$gt": 2019},
},
top_k=1,
include_metadatas=True
)
{'matches': [{'id': '1', 'score': 0.0478537641,
              'values': [],
              'metadata': {'genre': 'action', 'year': 2020}}],
 'namespace': '',
 'usage': {'read_units': 5}}
Bases de données vectorielles pour les intégrations avec Pinecone

Passons à la pratique !

Bases de données vectorielles pour les intégrations avec Pinecone

Preparing Video For Download...