Metadaten-Filterung

Vektordatenbanken für Einbettungen mit Pinecone

James Chapman

Curriculum Manager, DataCamp

Metadaten-Filterung

{
    "genre": "action",
    "year": 2020,
    "color": "blue",
    "fit": "straight",
    "price": 29.99,
    "is_jeans": true,
    "areas": ["London", "Kent", "Bath"]
}
  • Metadaten können Strings, Zahlen, Booleans und Listen von Strings sein
  • Metadaten-Filter: verkleinern den Suchraum und die Query-Latenz
1 https://docs.pinecone.io/docs/metadata-filtering
Vektordatenbanken für Einbettungen mit Pinecone

Metadaten-Filterung

index.query(
    vector=[-0.250919762305275, ...],

filter={
"genre": {"$eq": "documentary"}, "year": 2019
},
top_k=1 )
1 https://docs.pinecone.io/docs/metadata-filtering
Vektordatenbanken für Einbettungen mit Pinecone

Metadaten-Filter

 

  • $eq – Gleich (Zahl, String, Boolean)
  • $ne – Ungleich (Zahl, String, Boolean)
  • $gt – Größer als (Zahl)
  • $gte – Größer oder gleich (Zahl)
  • $lt – Kleiner als (Zahl)
  • $lte – Kleiner oder gleich (Zahl)
  • $in – In Array (String oder Zahl)
  • $nin – Nicht in Array (String oder Zahl)
1 https://docs.pinecone.io/docs/metadata-filtering
Vektordatenbanken für Einbettungen mit Pinecone

Metadaten-Filterung – größer als

index.query(
    vector=[-0.250919762305275, ...],

filter={
"year": {"$gt": 2019},
},
top_k=1,
include_metadatas=True
)
{'matches': [{'id': '1', 'score': 0.0478537641,
              'values': [],
              'metadata': {'genre': 'action', 'year': 2020}}],
 'namespace': '',
 'usage': {'read_units': 5}}
Vektordatenbanken für Einbettungen mit Pinecone

Lass uns üben!

Vektordatenbanken für Einbettungen mit Pinecone

Preparing Video For Download...