Vektoraufnahme

Vektordatenbanken für Einbettungen mit Pinecone

James Chapman

Curriculum Manager, DataCamp

Index erstellen und verbinden

pc = Pinecone(api_key="API_KEY")

pc.create_index(
    name='datacamp-index',
    dimension=1536,
    spec=ServerlessSpec(
        cloud='aws', 
        region='us-east-1'
    )
)

index = pc.Index('datacamp-index')
Vektordatenbanken für Einbettungen mit Pinecone

Vektoren ingestieren

vectors = [
    {
        "id": "0",
        "values": [0.025525547564029694, ..., 0.0188823901116848]
    },
        ...,
    {
        "id": "9",
        "values": [0.020712468773126602, ..., 0.006418442353606224]
    },
]
Vektordatenbanken für Einbettungen mit Pinecone

Checking dimensionality

vector_dims = [len(vector['values']) == 1536 for vector in vectors]

all(vector_dims)
True
PineconeApiException: (400)
Reason: Bad Request
HTTP response headers: HTTPHeaderDict({'Date': 'Fri, 17 May 2024 10:54:57 GMT', ...
HTTP response body: {"code":3,"message":"Vector dimension 256 does not match the
dimension of the index 1536","details":[]}
Vektordatenbanken für Einbettungen mit Pinecone

Vektoren upserten

  • .upsert(): Update oder insert
index.upsert(

vectors=vectors
)
index.describe_index_stats()
{'dimension': 1536,
 'index_fullness': 0.0,
 'namespaces': {'': {'vector_count': 10}},
 'total_vector_count': 10}
Vektordatenbanken für Einbettungen mit Pinecone

Vektoren mit Metadaten ingestieren

vectors = [
    {
        "id": "0",
        "values": [0.025525547564029694, ..., 0.0188823901116848]
        "metadata": {"genre": "productivity", "year": 2020}
    },
        ...,
]
  • Metadaten: Daten über Daten!
    • Nützlich für Metadata FilteringKapitel 2
Vektordatenbanken für Einbettungen mit Pinecone

Upsert von Vektoren mit Metadaten

index.upsert(
    vectors=vectors
)

Denk dran, diese Struktur zu nutzen:

    {
        "id": "0",
        "values": [0.025525547564029694, ..., 0.0188823901116848]
        "metadata": {"genre": "productivity", "year": 2020}
    },
        ...,
Vektordatenbanken für Einbettungen mit Pinecone

Lass uns üben!

Vektordatenbanken für Einbettungen mit Pinecone

Preparing Video For Download...