Retrieval Augmented Generation (RAG) dengan LangChain
Meri Nova
Machine Learning Engineer

Mengenkode potongan sebagai satu vektor dengan komponen non-zero

Mengenkode potongan sebagai satu vektor dengan komponen non-zero

Mengenkode dengan pencocokan kata dengan sebagian besar komponen zero

TF-IDF: Mengenkode dokumen menggunakan kata-kata yang membuat dokumen unik

BM25: Membantu mengurangi kejenuhan dari kata berfrekuensi tinggi dalam pengkodean
from langchain_community.retrievers import BM25Retrieverchunks = [ "Python was created by Guido van Rossum and released in 1991.", "Python is a popular language for machine learning (ML).", "The PyTorch library is a popular Python library for AI and ML." ]bm25_retriever = BM25Retriever.from_texts(chunks, k=3)
results = bm25_retriever.invoke("When was Python created?")
print("Most Relevant Document:")
print(results[0].page_content)
Dokumen Paling Relevan:
Python was created by Guido van Rossum and released in 1991.
retriever = BM25Retriever.from_documents( documents=chunks, k=5 )chain = ({"context": retriever, "question": RunnablePassthrough()} | prompt | llm | StrOutputParser() )
print(chain.invoke("How can LLM hallucination impact a RAG application?"))
Aplikasi RAG dapat menghasilkan jawaban yang melenceng atau tidak akurat.
Retrieval Augmented Generation (RAG) dengan LangChain