Preguntas y respuestas con documentos

Trabajar con Hugging Face

Jacob H. Marquez

Lead Data Engineer

¿Qué es Q&A con documentos?

$$

  • Responde preguntas sobre el contenido del documento
  • Requiere un documento y una pregunta
  • Da respuestas directas o parafraseadas

$$

Pregunta: "¿Cuál es el ingreso total del T3?"

Un documento

Trabajar con Hugging Face

Casos de uso de Q&A con documentos

Casos de uso en legal, finanzas y soporte

$$

  • 📑 Legal: Identificar cláusulas de contratos

$$

  • 💰 Finanzas: Extraer cifras clave

$$

  • 🤓 Soporte: Recuperar respuestas de manuales
Trabajar con Hugging Face

Automatizar consultas de RR. HH. con Q&A

$$

  • 📄 Info guardada en US-Employee_Policy.pdf

$$

  • 🤖 Construye un sistema para extraer respuestas

$$

  • 🕑 Ahorra tiempo y esfuerzo de RR. HH.

$$

RR. HH. está desbordado

Trabajar con Hugging Face

Extraer texto con pypdf

from pypdf import PdfReader


# Load the PDF file reader = PdfReader("US-Employee_Policy.pdf")
# Extract text from all pages document_text = "" for page in reader.pages:
document_text += page.extract_text()
Welcome to the US Employee Policy document...
Trabajar con Hugging Face

Crear un pipeline de Q&A

# Load the question-answering pipeline
qa_pipeline = pipeline(
    task="question-answering",
    model="distilbert-base-cased-distilled-squad")


question = "How many volunteer days are offered annually?"
# Get the answer from the QA pipeline result = qa_pipeline(question=question, context=document_text)
print(f"Answer: {result['answer']}")
Answer: 1
Trabajar con Hugging Face

Integrarlo todo

$$

  • 📄 Usa PdfReader de pypdf para cargar y leer PDFs
  • 🔎 Extrae texto con .pages y .extract_text() en document_text
  • 🤔 Configura un pipeline de question-answering
  • ❓ Pasa question y context al pipeline
  • ⏰ Envuelve en funciones para automatizar consultas

Q&A con documentos

RR. HH. construyendo cultura de empresa

Trabajar con Hugging Face

¡Vamos a practicar!

Trabajar con Hugging Face

Preparing Video For Download...