흔히 모델 공개할때 


다음 3가지로 공개되곤 하는데 개념이 좀 헷갈려서 질문드립니다.

예 : llama 


llama  :

- base 모델, 특별히 instruction 포맷 데이터를 학습하지 않은 backborn 모델

- 의문점 : 제가 알기론 이 모델도 결국 미세조정하면서 instruction 학습한 걸로 아는데 그럼 제가 잘못 안건지?

        아니면 지시어(instruction) 보다 질/답 쌍에만 포커싱한 모델인지?   

       예 :    요약의 경우      베이스 모델 :    input (뉴스기사)  / output (해당기사 요약)     ,    instruction 모델 :   input (이거 뉴스 요약해주세요  뉴스 기사 내용)   /  output (해당 기사 요약)



llama instruction :

- instruction 포맷 데이터로 미세 조정한 모델 

- 아래의 chat 포맷과 다른 점은 질문/답변 쌍으로 학습한거고, chat 모델은 대화? 형식으로 학습한건데 솔직히 별차이 없는거같습니다

- 다만 instruction 인 만큼 지시어에 특히 추가학습한 모델이 아닌가 싶습니다. 


llama chat :

- 위에서 설명했지만 실상 큰차이는 없고 chat 포맷에 맞게 학습, 대화형식에 중점 



최근 llama 3 모델이 공개대면서  일반 llama 3과 llama 3 instruction이 공개되면서 문득 개념이 헷갈려서 질문 드립니다.

이외에 다른 모델 (미스트랄, 솔라 등) 이런 경우엔 아에 언급이 없거나, 혹은 instruction 만 있는 둥 종종 헷갈리더라구요 

제가 이해한 바로는 그냥 미세조정할때의 형식 차이로만 알고 있긴한데...

경험상 이미 추가학습한 모델보다 차라리 좀더 베이직(?) 한 모델에 미세조정하는게 성능이 더 좋게나오기도 했고,


제가 찾아봐도,  instruction ㅎ고 chat 은 저렇게 나오던데, base 경우엔 명확하게 알수가 없네요 제가 못찾는건지...

차이점에 대해 이해한게 맞는지 문의드립니다!