langchain을 활용하여 짧은 문장을 rag로 통해 답변을 검색, 생성 하려고 합니다


langchain으로 입력하여 답변 추론를 한번하고 다음 입력에 전에 입력한 값을 참고하게 하여서 답변들이 이어지게 하고 싶은데

전에 입력한 값들을 저장해서 입력값에 참고하려고 값을 넣으면 넣을수록 답변이 쌓여서 모델 추론속도가 너무 느려지는데 방법이 있을까요?