한국어 모델 알파카 "KoAlpaca" - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3403명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

자료 한국어 모델 알파카 "KoAlpaca"

추천 2 비추천 0 댓글 0 조회수 638 작성일 2023-03-22 18:16:00 수정일 2023-03-24 06:48:10

https://arca.live/b/alpaca/72395099

얼마 전 Stanford에서 Alpaca라는, LLAMA 기반 Instruct-following하는 모델을 공개했죠!

연구팀에서는 모델 데모 공개와 함께 5만2천개의 데이터셋을 공개했는데요.

이번에 KoAlpaca 라는 이름으로 한국어 Alpaca 모델을 학습해보았습니다!

Alpaca에서 공개한 데이터셋을 번역하고, ChatGPT로 답변을 생성해 한국어 기반 데이터셋을 제작했고, Alpaca 모델을 학습한 방식과 동일한 방식으로 학습을 진행한 한국어 Alpaca 모델입니다.

데이터셋과 모델, 그리고 직접 테스트 해 볼 수 있는 카카오톡 봇 그리고 Telegram Bot까지 함께 공개합니다

- 공식 깃헙: https://github.com/Beomi/KoAlpaca

- 카카오톡 봇: http://pf.kakao.com/_wdRxcxj *주의: 카톡봇은 아직 맥락을 이해하지 않습니다. (1회성 답변)

- 텔레그램 봇: https://github.com/Beomi/KoAlpaca *텔레그램 봇은 일부 맥락을 넣어주고 있습니다.

다양한 모델 크기와 여러가지 백본 모델로 학습한 결과물도 함께 공개했는데요,

KoAlpaca는 백본 모델로 한국어 모델은 Polyglot-ko(5.8B)모델을, 영문+한국어 기반 모델은 LLAMA를 사용하였습니다.

Polyglot-ko 5.8B 기반 [Full Finetune] -> https://huggingface.co/beomi/KoAlpaca-Polyglot
Meta LLAMA 7B 기반 [Full Finetune] -> https://huggingface.co/beomi/KoAlpaca
Meta LLAMA 65B 기반 [LoRA] -> https://huggingface.co/beomi/KoAlpaca-65B-LoRA

*LLAMA 13B, 30B LoRA는 학습 예정입니다. (참고: LLAMA 13B는 찬성님(@deep-diver)이 학습하신 chansung/koalpaca-lora-13b가 공개되어있습니다.)

*Meta의 LLAMA 모델은 한국어 데이터셋을 충분히 학습하지 않아서, 실제 Inference를 돌려보았을 때 한국어 성능이 낮게 나오는 이슈가 있습니다.

다양하게 써 보시고, KoAlpaca에도 많은 관심 부탁드립니다 :)

---

기대되는 모델중 하나

댓글 [0] 글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28538508

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6003

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27060

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8897

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5097

공지 신문고

바바리맨 2023.04.18 2244

숨겨진 공지 펼치기(1개)

자료 알파카 로라버전 4비트 양자화 모델(13b, 30b)

변태Lv1 2023.03.22 235 0

자료 한국어 모델 알파카 "KoAlpaca"

변태Lv1 2023.03.22 639 2

정보 현재까지 트레이닝 된 라마 모델들 토큰 한도가 2024로 제한되어 있는거 같음.

변태Lv1 2023.03.22 186 0

학습 LLM LoRA로 단기간에 자국어로 파인튜닝 하는법

변태Lv1 2023.03.22 325 0

학습 3060으로도 가능할듯한 koGPT LoRA 학습시키기.py [1]

변태Lv1 2023.03.22 481 0

정보 4bit 모드에서 로라 적용 방법

변태Lv1 2023.03.22 133 0

학습 3090도 가능한 라마-7b 로컬에서 LoRA 파인튜닝 하기.py

변태Lv1 2023.03.22 1035 0

자료 그래픽카드 없이 알파카, llama 로컬에서 돌리기.exe (챈럼발 cpp빌드)

변태Lv1 2023.03.22 288 0

자료 코랩 LLaMA 7b,13b,30b 4비트 + SillyLossy 모딩 태번

변태Lv1 2023.03.22 214 0

정보 [Alpaca-LoRA] LLaMA 모델에 LoRA를 적용한 사례.git

변태Lv1 2023.03.22 164 0

정보 gpu 서버 대여해서 LLaMa 4bit 돌리기

변태Lv1 2023.03.22 339 0

자료 cpp 기반 원클릭 llama, alpaca 구동 "달라이"

변태Lv1 2023.03.22 156 1

정보 우바부가 (우가우가,oobabooga,textui) 명령 플래그 모음

변태Lv1 2023.03.22 690 0

정보 bitsandbytes 윈도우용 DLL 컴파일하기

변태Lv1 2023.03.22 118 0

정보 우바부가에서 4비트 LLaMA 구동법 상세설명

변태Lv1 2023.03.22 307 0

자료 허깅페이스에 올라온 LLaMA Transformer 형식으로 변환한 파일들

변태Lv1 2023.03.22 164 0

정보 llama 깃허브 llama-dl 리포지토리 현재 내려감

변태Lv1 2023.03.22 92 0

정보 3/14 스탠포드 대학에서 llama 7b를 파인튜닝해 [알파카 7b]를 공개

변태Lv1 2023.03.22 303 0

전체글 개념글