트레이닝 데이터가 실제로 적용될 때의 형태 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3400명 알림수신 167명 @바바리맨

제한없는 언어모델을 위한 채널

질문 트레이닝 데이터가 실제로 적용될 때의 형태

추천 0 비추천 0 댓글 1 조회수 407 작성일 2024-04-17 09:23:12

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/103865957

LLM의 트레이닝 데이터가 실제로 적용될 때의 형태에 대해 궁금한게 있습니다.

LLM 트레이닝은 기본적으로 다음 토큰의 확률을 예측하는 것으로 알고 있습니다. 그렇다면 아래와 같은 질문-답변쌍을 모델에 학습시킬 때,

질문: "안녕하세요! 오늘 파리로 가나요?"

답변: "네, 그렇습니다만...."

실제 모델이 학습하는 쌍은

데이터셋1: [(안녕하세요! 오늘 파리로 가나요?), (네,)]

데이터셋2: [(안녕하세요! 오늘 파리로 가나요? 네,), (그렇습니다만)]

데이터셋3: [(안녕하세요! 오늘 파리로 가나요? 네, 그렇습니다만), (...)]

이렇게 학습데이터가 구성되어서 학습이 이루어지는거 맞나요?

만약 그렇다면 데이터에서 예측에 참고하는 텍스트의 길이는 보통 어느정도까지 두는지 궁금합니다..!

댓글 [1] 글쓰기

ㅇㅇ (14.32)

2024-04-17 10:48:06 삭제 수정 답글

Axolotl의 conversation dataset 참고

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28516304

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 5996

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27001

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8881

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5089

공지 신문고

바바리맨 2023.04.18 2239

숨겨진 공지 펼치기(1개)

4052 질문 5090사기 vs m4 맥스튜디오 사기 [13]

돌돌돌돌 2024.04.24 725 2

4051 정보 merge kit에 Evolutionary Model Merging추가 [1]

jackofmaster 2024.04.24 272 3

4050 일반 GDDR7 모듈들 출시되는거 보면 5090은 36기가로 나올 수도 있을듯 [5]

iau 2024.04.24 513 6

4049 일반 wavecoder ultra 6.7B - 마이크로소프트 [4]

zzzzz5 2024.04.24 425 5

4048 질문 님들 제가 지금 exllamav2로 llama3 70b instruct 모델 변환중인데... [10]

ㅇㅇ (220.78) 2024.04.24 543 0

4047 질문 LlamaModel에서 gate구조에 대한 궁금증 [3]

에라 2024.04.24 338 1

4046 정보 애플의 완전 오픈소스 모델: OpenELM [13]

jackofmaster 2024.04.24 1490 14

4045 질문 문득 최근 llm 모델 나오면서 착오가 자꾸 생겨서 여쭤봅니다. [4]

ㅇㅇ (61.33) 2024.04.24 477 6

4044 질문 특정 도메인에 대한 지식 학습 [7]

뉴비챗 2024.04.23 581 0

4043 일반 뇌에서 순수하게 언어 처리 부분만 떼어내면 어느정도의 시냅스가 있을까 [1]

iau 2024.04.23 355 1

4042 일반 저러면 8B 다국어 모델은 어느 정도 나오려나 [1]

딸기맛봇치 2024.04.23 476 1

4041 일반 phi-3 mini 벤치마크 점수 [3]

처음입니다 2024.04.23 609 8

4040 일반 젠장 또 라마3야 [11]

사과는맛있어맛있으면바나나 2024.04.23 1532 16

4039 공지 llama3 시대를 기념하여 공지글 한번 리프레쉬했으면 합니다. [4]

hkhk 2024.04.23 258 1

4038 정보 phi 3 mini출시 [6]

jackofmaster 2024.04.23 547 3

4037 질문 컴퓨터 사양 조언을 구하고 싶습니다 [8]

지능순 2024.04.23 333 0

4036 질문 안녕하세요 뉴비입니다 [14]

kixerfx 2024.04.23 346 0

4035 정보 원하는 모델을 gguf로 변환 해줍니다. [2]

zzzzz5 2024.04.23 566 5

4034 질문 LLaMa-3-70B 4bit 돌려보는 중인데 이상동작을 합니다.. [3]

처음입니다 2024.04.23 619 0

4033 일반 지금 와서 드는 생각 - ChatGPT 는 20B 모델인가? [7]

hkhk 2024.04.23 799 7

전체글 개념글