https://github.com/e-p-armstrong/augmentoolkit
raw 텍스트를 넣으면 AI 어시스턴트 스타일 멀티턴 대화 챗봇용 instruct 데이터셋을 만들어준다고 하는데... 과연 잘 돌아갈지?

아래 그림에 보면 파란색 상자의 부분이 llm 에 의존해서 처리하는거 같은데 어느정도 강한 모델을 써야지 제대로 돌아갈거 같네요. 로컬 모델로 저런 데이터셋 정제처리가 어느정도나 될지 궁금합니다.