Retrieval Augmented Generation (RAG) com LangChain
Meri Nova
Machine Learning Engineer







vector_store = Chroma.from_documents( documents=chunks, embedding=embedding_model )retriever = vector_store.as_retriever( search_type="similarity", search_kwargs={"k": 2} )
from langchain_core.prompts import ChatPromptTemplateprompt = ChatPromptTemplate.from_template(""" Use os trechos de contexto a seguir para responder à pergunta no final. Se não souber a resposta, diga que não sabe. Contexto: {context} Pergunta: {question} """)
llm = ChatOpenAI(model="gpt-4o-mini", api_key="...", temperature=0)
from langchain_core.runnables import RunnablePassthrough from langchain_core.output_parsers import StrOutputParserchain = ({"context": retriever, "question": RunnablePassthrough()}| prompt| llm| StrOutputParser())
result = chain.invoke({"question": "What are the key findings or results presented in the paper?"})
print(result)
- Desempenho máximo: modelos RAG batem recordes em QA de domínio aberto...
- Geração melhor: modelos RAG produzem linguagem mais específica, diversa e factual...
- Uso dinâmico de conhecimento: a memória não-paramétrica permite que modelos RAG acessem e ...
Retrieval Augmented Generation (RAG) com LangChain