문득 최근 llm 모델 나오면서 착오가 자꾸 생겨서 여쭤봅니다.

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3408명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

질문 문득 최근 llm 모델 나오면서 착오가 자꾸 생겨서 여쭤봅니다.

ㅇㅇ (61.33)

추천 6 비추천 0 댓글 4 조회수 480 작성일 2024-04-24 01:14:10

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/104413692

흔히 모델 공개할때

다음 3가지로 공개되곤 하는데 개념이 좀 헷갈려서 질문드립니다.

예 : llama

llama :

- base 모델, 특별히 instruction 포맷 데이터를 학습하지 않은 backborn 모델

- 의문점 : 제가 알기론 이 모델도 결국 미세조정하면서 instruction 학습한 걸로 아는데 그럼 제가 잘못 안건지?

아니면 지시어(instruction) 보다 질/답 쌍에만 포커싱한 모델인지?

예 : 요약의 경우 베이스 모델 : input (뉴스기사) / output (해당기사 요약) , instruction 모델 : input (이거 뉴스 요약해주세요 뉴스 기사 내용) / output (해당 기사 요약)

llama instruction :

- instruction 포맷 데이터로 미세 조정한 모델

- 아래의 chat 포맷과 다른 점은 질문/답변 쌍으로 학습한거고, chat 모델은 대화? 형식으로 학습한건데 솔직히 별차이 없는거같습니다

- 다만 instruction 인 만큼 지시어에 특히 추가학습한 모델이 아닌가 싶습니다.

llama chat :

- 위에서 설명했지만 실상 큰차이는 없고 chat 포맷에 맞게 학습, 대화형식에 중점

최근 llama 3 모델이 공개대면서 일반 llama 3과 llama 3 instruction이 공개되면서 문득 개념이 헷갈려서 질문 드립니다.

이외에 다른 모델 (미스트랄, 솔라 등) 이런 경우엔 아에 언급이 없거나, 혹은 instruction 만 있는 둥 종종 헷갈리더라구요

제가 이해한 바로는 그냥 미세조정할때의 형식 차이로만 알고 있긴한데...

경험상 이미 추가학습한 모델보다 차라리 좀더 베이직(?) 한 모델에 미세조정하는게 성능이 더 좋게나오기도 했고,

제가 찾아봐도, instruction ㅎ고 chat 은 저렇게 나오던데, base 경우엔 명확하게 알수가 없네요 제가 못찾는건지...

차이점에 대해 이해한게 맞는지 문의드립니다!

댓글 [4] 글쓰기

뉴비챗

2024-04-24 01:42:53 답글

base 모델은 그냥 llm이 PLM학습한대로 다음단어를 예측하게끔 되어있는 모델임. 예를들어 대한민국의 수도는 서울인데 라고 프롬프팅하면 그뒤에 면적은 얼마고 인구는 얼마다 라고 이어서 말해주고. Instruct 나  chat모델은 대화형 데이터셋 을가지고 대화형으로 llm을 사용할수있게 파인튜닝 해놓은 모델임. 보통은 instruct나 chat모델을 다운받아 사용함.

펼쳐보기▼

ㅇㅇ

2024-04-24 03:55:42 답글

답변감사합니다. 혹시 파인튜닝하려고 할때는 어떤 모델로 하시나요? base 또는 instruct  chat  중에서요

펼쳐보기▼

뉴비챗

2024-04-24 04:11:00 답글

목적에 맞게 하시면 됩니다 보통은 inst나 chat

펼쳐보기▼

ㅇㅇ

2024-04-24 04:14:41 답글

음... 이해했습니다 감사합니다

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28596396

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6020

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27149

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8932

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4145 자료 IBM에서 아파치2 라이센스로 코딩모델 출시 [5]

이하비스 2024.05.09 323 2

4144 일반 호기심에 번역한거 비교해봄 [12]

pussydestroyer 2024.05.08 756 1

4143 스터디 트랜스포머도 깊게 생각을 하려면 메모장이 필요해요 - Vision Transformers Need Registers [21]

hkhk 2024.05.08 1220 42

4142 스터디 디퓨전 모델이 학습하는 원리 - 어디까지 암기이고 어디부터 학습일까? - 디퓨전 모델은 정말 이해를 하고서 이미지를 만드는걸까? [12]

hkhk 2024.05.08 1261 40

4141 질문 업무 목적으로 한국어 튜닝해서 사용하시는 분 계신가요? [7]

페르미 2024.05.08 656 0

4140 일반 (구글x서울디지털재단)2024 서울 프롬프톤(AI 프롬프트엔지니어링 해커톤) 참가자 모집(기간 연장, ~5.15) [9]

ljhljhljh 2024.05.08 1009 11

4139 일반 A100 40GB로 llama3 70B 구동은 되는지? [3]

ㅇㅇ (203.252) 2024.05.08 749 2

4138 일반 ms가 500b 모델을 학습중이라고 합니다 [3]

그래요 2024.05.08 496 3

4137 질문 베이스라인 모델 선정 방법

레바 2024.05.08 342 0

4136 일반 판매자 정보 실수 - 4060ti 16gb dual 또는 3way 를 위한 핫딜 정보 [11]

ㅇㅇ 2024.05.07 739 5

4135 질문 vllm 활용 추론 관련해서 질문드립니다. [10]

Dikko 2024.05.07 516 0

4134 질문 3090(24gb) 대신 4060ti 16gb 2개 사용하는건 추천 안 하시나요? [7]

ㅇㅇ (110.8) 2024.05.07 549 0

4133 일반 런팟 NFS 마운트 안되나요?

ㅇㅇ (121.135) 2024.05.07 168 0

4132 정보 gpt2-chatbot돌아옴 [15]

HyperBlaze456 2024.05.07 1941 12

4131 질문 gpu 4개를 공냉으로 구성하면 IDC입고 필수일까요? [13]

ㅇㅇ (203.245) 2024.05.07 585 0

4130 일반 rag를 사용할때 로컬모델의 경우 모르는것을 모른다고 잘 하던가요? [7]

호옹이 2024.05.07 640 2

4129 질문 exllamav2로 양자화 한 exl2 모델에 대해 질문 있습니다 [4]

ㅇㅇ (220.78) 2024.05.07 332 0

4128 일반 Langchain, Rag 질문 있습니다 [1]

ㅇㅇ (119.200) 2024.05.07 398 0

4127 질문 학습시 eos 토큰이 잘 안나오는 이유 [22]

ㅇㅇ (61.33) 2024.05.07 634 1

4126 일반 커맨드 R 플러스 로컬에서? [6]

감별사 2024.05.06 540 1

글쓰기

전체글 개념글