Introduction aux index Pinecone

Bases de données vectorielles pour les intégrations avec Pinecone

James Chapman

Curriculum Manager, DataCamp

Logo Pinecone

 

Vous apprendrez à…

  • Créer des index et ingérer des vecteurs
  • Récupérer et interroger des vecteurs
  • Créer des applications IA courantes

 

→ Construire et faire évoluer des applications GenAI !

 

 

recherche sémantique

Bases de données vectorielles pour les intégrations avec Pinecone

Index

 

  • Stocker des vecteurs
  • Servir des requêtes et autres opérations sur vecteurs
  • Un index contient des enregistrements pour chaque vecteur, avec métadonnées
  • Possibilité de créer plusieurs index

Un classeur à quatre tiroirs, chacun contenant plusieurs dossiers.

Bases de données vectorielles pour les intégrations avec Pinecone

Basé sur pods

Un pod contenant plusieurs index.

  • Choisir le matériel pour créer l’index → pods
  • Le type de pod détermine le stockage, la latence des requêtes et le débit

Serverless

Index stockés dans le cloud.

  • Aucune gestion des ressources
  • Les index se dimensionnent automatiquement
  • S’exécutent dans le cloud et stockent en blob
  • Plus simple et souvent moins coûteux

Ce que nous utiliserons dans ce cours

1 https://docs.pinecone.io/guides/indexes/understanding-indexes
Bases de données vectorielles pour les intégrations avec Pinecone

Créer une clé API Pinecone

 

  1. Créez un compte Pinecone Starter → pinecone.io
  2. Allez à « API Keys »
  3. Copiez votre clé API

Page d’accueil de Pinecone

Page des clés API de Pinecone

Bases de données vectorielles pour les intégrations avec Pinecone

Créer un index serverless

from pinecone import Pinecone, ServerlessSpec


pc = Pinecone(api_key="API_KEY")
pc.create_index(
name='datacamp-index',
dimension=1536,
spec=ServerlessSpec(
cloud='aws', region='us-east-1'
)
)
Bases de données vectorielles pour les intégrations avec Pinecone

Vérifier nos index

pc.list_indexes()
{'indexes': [{'dimension': 1536,
              'host': 'datacamp-index-1eef0f4.svc.aped-4627-b74a.pinecone.io',
              'metric': 'cosine',
              'name': 'datacamp-index',
              'spec': {'serverless': {'cloud': 'aws', 'region': 'us-east-1'}},
              'status': {'ready': True, 'state': 'Ready'}}]}
Bases de données vectorielles pour les intégrations avec Pinecone

Passons à la pratique !

Bases de données vectorielles pour les intégrations avec Pinecone

Preparing Video For Download...