RAG 관련해서 청크 질문드립니다. - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3404명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

질문 RAG 관련해서 청크 질문드립니다.

ㅇㅇ (61.33)

추천 2 비추천 0 댓글 12 조회수 750 작성일 2024-04-30 01:03:14

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/104952441

안녕하세요.

최근 RAG 관련 연구개발 중 문득 든 생각에 질문드리고자 합니다.

보통 RAG Basic한 것은, 문서가 기니 이걸 청크로 잘라서 요약&오버랩 등등 으로

처리하곤 하는데 경우에 따라서 반드시 청크할 필요가 있나? 싶어서 의문이 들었습니다.

예를 들어 뉴스의 경우 :

- 사용자 질문 : a 의 한달간 발생한 것들 중 이슈가 될만한 뉴스 알려줘

- RAG 내부 동작 (간략) : 1) A와 한달간을 정규화 (SQL 쿼리를 위한 A, 한달간 데이터 포맷)-> 뉴스 DB(일반 db)에 있는 해당 a 키워드의 한달 (24-03-30 ~ 24-04-30) 의 뉴스 데이터 (본문) 추출

2) 임베딩 모델로 벡터화 (벡터 db에 저장)

- 뉴스 본문이므로 청크할 필요가 적음 (Input 길이보다 대부분 짧으므로)

3) 이슈가 될만한 뉴스 알기 위해 랭킹 알고리즘 혹은 LLM 프롬포트로 상위 문서 찾기 (상위 문서 K = 3)

4) 상위 문서 3개 추출 후, LLM 활용해서 답변 요약 생성

예를 들어 설명하였으나, 혹시 저 과정이 틀린점이 없는지도 질문 드립니다.

그리고 벡터DB화 할때, 저 방식은 번거로운거 같은데 뉴스를 수집하고 바로 벡터 DB화 시키고 쿼리 단계에서 일반 DB (SQL문 가능한 오라클DB 또는 MYSQL) 은 사용하지 않나요? 쿼리 단계에서 키워드 / 날짜 / 토픽 (혹은 의도) 로 추출 할 필요가 있는데, 이걸 임베딩만으로 부랴부랴 하기엔 불안해서 필터링 작업 (NER 등) 을 사용해서 추출한 후 쿼리에 맞게 정규화해서 하는게 낫지 않을까 싶어서요.

혹시 경험 있으신분들 조언 부탁드립니다.

요약하자면,

1) 청크를 반드시 해야하는지 (상황에 따라)

2) 벡터 DB 선후에 대해서

3) 질문 단계에서 필터링 작업을 쓰는게 더 좋은지

입니다. 논문 참고할시 보통 저러는거 같은데 1,2)은 명확히 알기가 어렵더군요 실무적으로 확인하고 싶어서...

댓글 [12] 글쓰기

CRLF

2024-04-30 01:46:47 답글

*수정됨

청크를 나누는 이유중에 큰 것 하나는 LLM의 컨텍스트 제한 때문이라고 생각합니다.
어차피 기사 3개 분량이라면, LLM이 허용할 만 할 것 같은데, 꼭 나눌 필요가 있나라는 생각이드네요.

펼쳐보기▼

ㅇㅇ (61.33)

2024-04-30 04:14:18 삭제 수정 답글

음 답변 감사합니다. 절대적은 아니군요

펼쳐보기▼

ㅇㅇ (210.91)

2024-04-30 02:24:20 삭제 수정 답글

저도 아직 부족하다는걸 감안하고 들어주세요.
질문을 넣으면 이미 일반 SQL DB에서 빼와 벡터db에 넣은뒤 llm에 연결해서 답변을 하겠다는거져?

우선 질문이 한달이라고 질문해도 llm이 한달을 정확히 인식 못할 확률이 높으니 db에서 특정 기간의 데이터를 가져오게할려면
사용자의 질문 중 기간과 관련된게 있을 경우 그 기간을 설정하는부분과 a와 관련된 기사를 백터db에 넣는 부분은 따로 짜줘야할겁니다.

기사 3개 분량이면 양이 좀 되서 청크를 안할경우 속도 차이가 좀 있을거 같네요.

펼쳐보기▼

ㅇㅇ (61.33)

2024-04-30 04:16:35 삭제 수정 답글

*수정됨

네, 질문 처리 단계에서 llm이 의도 파악, 특히 날짜 부분에서 종종 잘못 이해하기에 따로 작업을 해줘야하지 않나 싶었습니다.  그런데 질문 마다 벡터 db에 넣는게 좀 그래서 벡터 db 자체를 날짜 key를 기반으로 날짜별로 문서 집합을 이루게 한 후, 그다음엔 상위 문서 추출 해서 llm 으로 답변 요약 해야하지않을까? 생각 되더라구요.  청크는 처음엔 안하더라도 기사 3개~ 이상일시에는 각각의 기사를 요약 한 후 붙이는 식으로 하면 되지 않을까 도 고민해봤습니다만... 의견 감사합니다.

펼쳐보기▼

ㅇㅇ (210.91)

2024-04-30 04:36:15 삭제 수정 답글

님이 올려주신 vaiv 보니까 llm 부분은 그냥 요즘 신문기사 다 벡터 db에 박은 뒤 거기서 요약 or 그냥 물어볼만한걸 다 학습시킨거 둘 중 하나인거 같아요.
아래 날자 정하는건 클릭으로 직접 정하는거고 밑에 신문기사 나오는건 llm이랑 상관없이 그냥 검색엔진에서 관련 키워드가 들어간 기사들만 불러오네요.
결론은 님이 생각하시는것만큼 어려운 방식이 아니네요.

아래 한달 정한게 바로 llm에 연결되서 자동으로 llm이 검색해오신다 생각하신거 같은데 눈속임일 뿐입니다 ㅎㅎ

펼쳐보기▼

ㅇㅇ (61.33)

2024-04-30 04:47:05 삭제 수정 답글

*수정됨

음... 몇번 테스트 해보니 날짜인식을 아에 못하더라구요... 2024년 4월 xx일 또는 최근 일주일 등 날짜 지정해서 해봐도 21년 갤럭시 비즈 a 출시한 뉴스를 가져오지 않나...  근데 이게 회사에서는 광범위하게 "사용자가 어떤걸 물어도 뉴스 같은 문서들을 기반으로 다 요약해서 대답해주는것" 이라는 추상적인거라 정의내리기가 어렵네요.. .감사합니다

펼쳐보기▼

ㅇㅇ (210.91)

2024-04-30 04:49:54 삭제 수정 답글

그러면 둘 중 하나입니다, 진짜 그 달력에서 정한 날짜를 시스템 프롬프트에 넣어서 llm이 계산하게 해주거나
아니면 그냥 날짜 db 연동쪽이 고장나서 이상한 기간의 기사를 가져오거나

님이 생각하시는 방식으로 구현되면 진짜 좋겠지만 지금은 힘들어보이니 쉽게 한번 구현한 후 조금씩 고쳐나거는건 어떨까 싶습니다. 화이팅!

펼쳐보기▼

ㅇㅇ (61.33)

2024-04-30 04:54:53 삭제 수정 답글

답변 감사합니다. 몇번 더 테스트 해보니 날짜를 디테일하게 주면  레퍼런스 뉴스 자체가 아에안뜨고 답변 요약에서 21년 내용나오는거보니,  그... 말씀하신대로 눈속임? 같긴합니다.    우선 베이직한 rag부터 해보고 조금씩 바꾸는 식으로 해야할듯싶습니다. 답변 감사합니다 !

펼쳐보기▼

1945Y

2024-04-30 02:34:56 답글

제일 쉬운거...
1달치 뉴스 제목을 한꺼번에 LLM에 넣고, "이슈가 될 만한 것만 골라서, 내림차순으로 정리해줘"
컨텍스트 길이가 넘친다면, 적당히 잘라서 넣어가면서, 대답을 완성해나가면 될 듯

형아가 하고 있는건 rag를 쓸게 아니라, autogen 같은걸 써야 풀 수 있는걸로 보이는데.. 아닌가?
https://www.microsoft.com/en-us/research/project/autogen/

Microsoft Research

AutoGen - Microsoft Research

AutoGen allows developers to build LLM applications via multiple agents that can converse with each other to accomplish tasks.

*수정됨

제일 쉬운거...
1달치 뉴스 제목을 한꺼번에 LLM에 넣고, "이슈가 될 만한 것만 골라서, 내림차순으로 정리해줘"
컨텍스트 길이가 넘친다면, 적당히 잘라서 넣어가면서, 대답을 완성해나가면 될 듯

형아가 하고 있는건 rag를 쓸게 아니라, autogen 같은걸 써야 풀 수 있는걸로 보이는데.. 아닌가?

펼쳐보기▼

ㅇㅇ (61.33)

2024-04-30 04:13:56 삭제 수정 답글

음... 지금 벤치마킹하는게  https://stock.vaiv.kr/ai-search/news   이 사이트와 유사한거라서 내부적으로 어떻게 개발할지 논의 중인데 rag 시스템을 쓴게 아닌가 싶습니다. 아직 정확히 어떻게 개발할지가 논의안되서 위 예시는 제가 임의로 작성한건데 뭔가 핀트가 안맞는거같아서 그렇습니다...

국내뉴스 AI검색

vaiv stock, 바이브스탁

주식 & AI어시스턴트 데모 서비스

음... 지금 벤치마킹하는게  https://stock.vaiv.kr/ai-search/news   이 사이트와 유사한거라서 내부적으로 어떻게 개발할지 논의 중인데 rag 시스템을 쓴게 아닌가 싶습니다. 아직 정확히 어떻게 개발할지가 논의안되서 위 예시는 제가 임의로 작성한건데 뭔가 핀트가 안맞는거같아서 그렇습니다...

펼쳐보기▼

h2hare

2024-05-02 07:05:54 답글

이거 한번 참조 해보시겠어요?
https://www.youtube.com/watch?v=980oyIufuVQ

YouTube

그랩의 LLM Application In Production 공유회

* 본 영상은 현재 공개된 영상이나 향후 비공개 처리 될 수 있음을 미리 알립니다안녕하세요. Project Pluto의 SWE 그랩입니다. 이번 공유회 내용은 대략 아래와 같은 주제들을 다룹니다.1. Introduction to Super News2. RAG In Productio…

*수정됨

이거 한번 참조 해보시겠어요?

펼쳐보기▼

ㅇㅇ (1.212)

2024-05-03 07:32:30 삭제 수정 답글

좀 다른내용이긴하지만 CRAG 논문같은거 참고하시면 개발진행하시는데 도움되실거같아 남겨요 https://arxiv.org/abs/2401.15884

arXiv.org

Corrective Retrieval Augmented Generation

Large language models (LLMs) inevitably exhibit hallucinations since the accuracy of generated texts cannot be secured solely by the parametric knowledge they encapsulate. Although retrieval-augmented generation (RAG) is a practicable complement to LLMs, it relies heavily on the relevance of retrieved documents, raising concerns about how the model behaves if retrieval goes wrong. To this end, we propose the Corrective Retrieval Augmented Generation (CRAG) to improve the robustness of generation. Specifically, a lightweight retrieval evaluator is designed to assess the overall quality of retrieved documents for a query, returning a confidence degree based on which different knowledge retrieval actions can be triggered. Since retrieval from static and limited corpora can only return sub-optimal documents, large-scale web searches are utilized as an extension for augmenting the retrieval results. Besides, a decompose-then-recompose algorithm is designed for retrieved documents to selectively focus on key information and filter out irrelevant information in them. CRAG is plug-and-play and can be seamlessly coupled with various RAG-based approaches. Experiments on four datasets covering short- and long-form generation tasks show that CRAG can significantly improve the performance of RAG-based approaches.

*수정됨

좀 다른내용이긴하지만 CRAG 논문같은거 참고하시면 개발진행하시는데 도움되실거같아 남겨요

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28559083

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6010

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27090

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8906

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4183 질문 Llama2 파인 튜닝해서 api 호출

sumsumoksu (180.81) 2024.05.14 373 0

4182 일반 GPT-4o는 GPT-4에 비해 한국어 생성 속도가 3.4배 빨라졌다. [2]

도지도지 2024.05.14 934 6

4181 일반 언젠가는 gpt4o 같은 걸 로컬에서 돌릴날이 올까요? [6]

돌돌돌돌 2024.05.14 930 6

4180 질문 [뉴비주의] 말뭉치 데이터를 학습하려면..? [1]

ㅇㅇ (223.39) 2024.05.14 400 0

4179 일반 이번에 공개된 gpt-4o의 성능 벤치마크인데 drop은 왜 떨어진거려나요 [9]

그래요 2024.05.14 837 1

4178 일반 GPT4o 플랫폼에 공개됐군요 [5]

감별사 2024.05.14 844 2

4177 일반 Gemma 토크나이저 확장 관련 임베딩 초기화 방식 ㅠㅠ [2]

넙적곰치 2024.05.14 298 0

4176 질문 Llama3 8B 튜닝 과정인데 외계어문제.. ㅠㅠ [16]

eke 2024.05.14 718 -1

4175 일반 llm 한국어 학습할 때 데이터에 관하여 궁금증

ㅇㅇ (119.200) 2024.05.14 270 0

4174 일반 chatGPT4O 요약 [2]

Aimyon 2024.05.13 1181 5

4173 일반 aka Llama-3 70B 한국어 [7]

zzzzz5 2024.05.13 1734 15

4172 질문 안녕하세요 Llama3 8B 튜닝 뉴비 좀 도와주십시오 ㅠ [9]

eke 2024.05.13 614 0

4171 일반 llama3 8B (fp16) 70B (Q6_K) 돌려봤음 [9]

게지네 2024.05.13 698 2

4170 일반 앞으로 3090 보기는 다시 쉬워지겠네요 [5]

whs 2024.05.13 941 1

4169 질문 vllm 이 동시 사용시 빠른 이유가 궁금합니다. [6]

끼랑까랑 2024.05.13 504 0

4168 학습 llama 2 train 성공 및 의문점 + llama 3 예정 [2]

ㅇㅇ (61.33) 2024.05.13 540 5

4167 일반 sLLM instruction tuning 데이터 [2]

asdfnlasdf 2024.05.13 404 1

4166 일반 일본에서 자체적으로 구운 13B 모델 [8]

ㅇㅇ 2024.05.12 786 7

4165 스터디 매니폴드 가설 - 생성형AI 의 원리를 이해하기 위한 핵심 전제 [7]

hkhk 2024.05.12 1428 50

글쓰기

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.