Consulta de vectores

Bases de datos vectoriales para incrustaciones con Pinecone

James Chapman

Curriculum Manager, DataCamp

El poder de consultar

 

  • Consultar: obtener los vectores más semánticamente similares a un vector de entrada

Una entrada de usuario se incrusta y se usa para consultar una base de datos vectorial Pinecone.

Bases de datos vectoriales para incrustaciones con Pinecone

El método .query()

index.query(

vector=[-0.250919762305275, ...],
top_k=3
)
{'matches': [{'id': '1', 'score': 0.0478537641, 'values': []},
             {'id': '2', 'score': 0.046000585, 'values': []},
             {'id': '3', 'score': 0.0458319113, 'values': []}],
 'namespace': '',
 'usage': {'read_units': 5}}
Bases de datos vectoriales para incrustaciones con Pinecone

El método .query()

index.query(
    vector=[-0.250919762305275, ...],
    top_k=3,

include_values=True
)
{'matches': [{'id': '1', 'score': 0.0478537641, 'values': [-0.0131468913, ...]},
             {'id': '2', 'score': 0.046000585, 'values': [-0.0120476764, ...]},
             {'id': '3', 'score': 0.0458319113, 'values': [0.00285418332, ...]}],
 'namespace': '',
 'usage': {'read_units': 5}}
Bases de datos vectoriales para incrustaciones con Pinecone

Unidades de lectura (RUs) para consultas

 

  • Para consultas, los RUs son más difíciles de calcular
  • Dependen de:
    • N.º de registros en el espacio de nombres
    • Tamaño de los registros
      • Dimensionalidad del vector
      • Cantidad de metadatos

Tabla de RUs consumidas al consultar.

1 https://docs.pinecone.io/guides/organizations/manage-cost/understanding-cost#query
Bases de datos vectoriales para incrustaciones con Pinecone

Métricas de distancia

 

La similitud coseno: muestra el ángulo entre dos vectores.

1 https://docs.pinecone.io/guides/indexes/understanding-indexes#distance-metrics
Bases de datos vectoriales para incrustaciones con Pinecone

Métricas de distancia

 

La distancia euclídea: muestra la distancia en línea recta entre dos vectores.

1 https://docs.pinecone.io/guides/indexes/understanding-indexes#distance-metrics
Bases de datos vectoriales para incrustaciones con Pinecone

Métricas de distancia

 

El producto punto: cómo se calcula el valor a partir del ángulo entre vectores.

1 https://docs.pinecone.io/guides/indexes/understanding-indexes#distance-metrics
Bases de datos vectoriales para incrustaciones con Pinecone

Configurar la métrica de distancia

pc.create_index(
    name="datacamp-index", 
    dimension=1536,

metric='dotproduct',
spec=ServerlessSpec( cloud='aws', region='us-east-1' ) )
  • metric'cosine', 'euclidean', 'dotproduct'
Bases de datos vectoriales para incrustaciones con Pinecone

¡Tu turno de consultar!

Bases de datos vectoriales para incrustaciones con Pinecone

Preparing Video For Download...