Vektör sorgulama

Pinecone ile Vektör Veritabanları ve Embeddings

James Chapman

Curriculum Manager, DataCamp

Sorgulamanın gücü

 

  • Sorgulama: bir giriş vektörüne en çok anlamsal olarak benzer vektörleri getirir

Bir kullanıcı girdisinin gömülüp Pinecone vektör veritabanında sorgulanması.

Pinecone ile Vektör Veritabanları ve Embeddings

.query() yöntemi

index.query(

vector=[-0.250919762305275, ...],
top_k=3
)
{'matches': [{'id': '1', 'score': 0.0478537641, 'values': []},
             {'id': '2', 'score': 0.046000585, 'values': []},
             {'id': '3', 'score': 0.0458319113, 'values': []}],
 'namespace': '',
 'usage': {'read_units': 5}}
Pinecone ile Vektör Veritabanları ve Embeddings

.query() yöntemi

index.query(
    vector=[-0.250919762305275, ...],
    top_k=3,

include_values=True
)
{'matches': [{'id': '1', 'score': 0.0478537641, 'values': [-0.0131468913, ...]},
             {'id': '2', 'score': 0.046000585, 'values': [-0.0120476764, ...]},
             {'id': '3', 'score': 0.0458319113, 'values': [0.00285418332, ...]}],
 'namespace': '',
 'usage': {'read_units': 5}}
Pinecone ile Vektör Veritabanları ve Embeddings

Sorgulama için okuma birimleri (RU)

 

  • Sorgulama için RU hesaplamak daha zordur
  • Şunlara bağlıdır:
    • Ad alanındaki kayıt sayısı
    • Kayıt boyutu
      • Vektör boyutu
      • Meta veri miktarı

Sorgulamada tüketilen RU'ların tablosu.

1 https://docs.pinecone.io/guides/organizations/manage-cost/understanding-cost#query
Pinecone ile Vektör Veritabanları ve Embeddings

Uzaklık metrikleri

 

Kosinüs benzerliği: iki vektör arasındaki açıyı gösterir.

1 https://docs.pinecone.io/guides/indexes/understanding-indexes#distance-metrics
Pinecone ile Vektör Veritabanları ve Embeddings

Uzaklık metrikleri

 

Öklid uzaklığı: iki vektör arasındaki düz çizgi mesafesi.

1 https://docs.pinecone.io/guides/indexes/understanding-indexes#distance-metrics
Pinecone ile Vektör Veritabanları ve Embeddings

Uzaklık metrikleri

 

Noktasal çarpım: değerin vektörler arası açıdan nasıl hesaplandığı.

1 https://docs.pinecone.io/guides/indexes/understanding-indexes#distance-metrics
Pinecone ile Vektör Veritabanları ve Embeddings

Uzaklık metriğini ayarlama

pc.create_index(
    name="datacamp-index", 
    dimension=1536,

metric='dotproduct',
spec=ServerlessSpec( cloud='aws', region='us-east-1' ) )
  • metric'cosine', 'euclidean', 'dotproduct'
Pinecone ile Vektör Veritabanları ve Embeddings

Sıra sizde: sorgulayın!

Pinecone ile Vektör Veritabanları ve Embeddings

Preparing Video For Download...