Upsert in batch

Database vettoriali per Embeddings con Pinecone

James Chapman

Curriculum Manager, DataCamp

Limiti degli upsert

 

  1. Frequenza richieste
  2. Dimensione richieste

 

  • Batching: spezzare le richieste in chunk più piccoli

 

Limiti di Pinecone

1 https://docs.pinecone.io/reference/quotas-and-limits#rate-limits
Database vettoriali per Embeddings con Pinecone

Definire una funzione di chunking

def chunks(iterable, batch_size=100):

it = iter(iterable)
chunk = tuple(itertools.islice(it, batch_size))
while chunk:
yield chunk
chunk = tuple(itertools.islice(it, batch_size))
Database vettoriali per Embeddings con Pinecone

Batching sequenziale

  • Dividere le richieste e inviarle in sequenza una per una
pc.Pinecone(api_key="YOUR API KEY")
index = pc.Index('datacamp-index')


for chunk in chunks(vectors): index.upsert(vectors=chunk)

Pro:

  • Risolve limiti di frequenza e dimensione

Contro:

  • Molto lento!
Database vettoriali per Embeddings con Pinecone

Batching parallelo

  • Dividere le richieste e inviarle in parallelo
pc = Pinecone(api_key="YOUR_API_KEY", pool_threads=30)


with pc.Index('datacamp-index', pool_threads=30) as index:
async_results = [index.upsert(vectors=chunk, async_req=True) for chunk in chunks(vectors, batch_size=100)]
[async_result.get() for async_result in async_results]
Database vettoriali per Embeddings con Pinecone

Passiamo alla pratica!

Database vettoriali per Embeddings con Pinecone

Preparing Video For Download...