RWKV를 잇는 진정한 오픈소스 LLM MAP-NEO - 개념글 모음

개념글 모음

알림 알림 중 알림 취소

구독자 2725명 알림수신 77명

각 채널의 개념글을 모은 게시판입니다.

Ai 언어모델 로컬 일반 RWKV를 잇는 진정한 오픈소스 LLM MAP-NEO

추천 22 비추천 0 댓글 4 조회수 846 작성일 2024-05-10 21:44:45

https://arca.live/b/alpaca/105894354

개념글 모음

기존 LLM들은 대부분 다 가중치와 학습 방법 정도만 공개하고, 데이터셋은 공개하지 않는, 핵심이 빠진 실망스러운 오픈 소스였습니다.

물론, 대부분의 경우 파인튜닝만 할 수 있기에 데이터셋을 공개하지 않아도 문제는 없었으나, 모델에서 특정한 문제가 나온다면 그 원인을 파악할 수 없다는 단점이 있죠.

이는 커뮤니티의 참여가 필요한 부분이지만, 대부분 base 모델을 학습시켜주는 대기업들은 자체적으로 데이터셋을 모으며, 그 데이터셋에서는 저작권을 무시하고 가져온 데이터들도 상당할 것입니다. 이로 인해, 대기업들은 이를 공개하지 않죠.

하지만 이번에는 조금 다릅니다. 모든 데이터셋이 오픈돼어있는 매우 드문 경우가 나왔습니다.
https://github.com/multimodal-art-projection/MAP-NEO
https://huggingface.co/NikolayKozloff/neo_7b-Q8_0-GGUF (양자화)
이 모델은 4.5T 토큰으로 학습되었으며, 중문 / 영어로 학습되었습니다. 7B, 2B, Scalinglaw도 있고요, 데이터셋은
https://huggingface.co/datasets/m-a-p/Matrix
서 봐볼 수 있습니다. 구조는 라마2인것 같고요

성능은 모르겠습니다. 일단 당장 대단한 것은, 이전 오픈소스 7B 모델은 2T 토큰이었던 것에 비해 훨씬 더 큰 데이터셋으로 학습되었다는 점이겠네요.

댓글 [4] 글쓰기

2024-05-11 14:46:14 답글

자러감ㅅㄱ

2024-05-12 07:31:12 답글

ㅇㅇ (210.91)

2024-05-13 01:55:15 삭제 수정 답글

중국 애들 국가에서 AI사업을 엄청나게 밀어주며 지원을 해준다하고 인재도 많으니 엄청나네요

펼쳐보기▼

2024-05-13 05:47:30 답글

확실히 어디던지 결국 천재나 재능있는 사람들의 비율은 일정한 것 같더라구요

펼쳐보기▼

전체글 Ai 언어모델 로컬 채널

최근 최근 방문 채널

최근 방문 채널

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28514848

2936250 몬무스 짤 후지사와 카미야/우메와 모모/일상-3 [2]

Oppai_Loli 21시간전 214 16

2936249 메이플스토리 자랑 가엔슬 노말 첫클 완료 [23]

류요 2시간전 213 9

2936248 유머 유머 "이스라엘산 유대참피" [40]

어디서많이본듯한닉네임 5시간전 5055 65

2936247 Fate/Grand Order 적토마가 하늘을 올려다본다면? [10]

ChickenUnion 2시간전 264 12

2936246 로보토미 코퍼레이션 🎨창작 스포) 쭈글 앤젤라 [9]

배은망덕 2시간전 712 30

2936245 이터널 리턴 🎨창작 셀라 [7]

와간다 2시간전 430 16

2936244 붕괴3rd 님들아 제가 쩌는거 보여줌 [28]

고시아스 2시간전 864 30

2936243 명조 "앙코,,,거긴 오듐싸는곳인데,,,,앗" [49]

ㅇㅇ 2시간전 5544 84

2936242 블루 아카이브 ㅅㅍ)주술회전 범부 근황 [85]

가갸거겨고교구규그기개게긔 3시간전 4902 69

2936241 벽람항로 벽팔륙의 틀서운 이야기 - 나아히 아쥬유 [29]

청포도볶음면 2시간전 639 20

2936240 겨드랑이2d 🔞그림 작가추천 [1]

심야반찬 11시간전 95 5

2936239 명조 스포 CBT2 정출 번역비교 [8]

ㅇㅇ 2시간전 3020 39

2936238 유머 유머 주술회전 최신화 (스포) [108]

ㅇㅇ 3시간전 6980 83

2936237 종합축구 오피셜 [인천] '물병투척 관중' 홈경기 무기한 출입금지 징계, 지정 봉사 100시간 이수 후 해제 [3]

Revenger 3시간전 147 7

2936236 트릭컬 RE:VIVE 이른 아침 트릭컬 글섭,일섭 앱을 발견한 모치국 2편(사진많음, 스압주의) [12]

유루쿠 3시간전 1139 19

2936235 에버소울 짤 이디스 (Ai) [20]

응애애긔뉴비에욤 3시간전 246 9

2936234 블루 아카이브 🎨창작 렌게 라투디 [26]

SSS 2시간전 1251 57

2936233 유희왕 🎨창작 개기일식의 Go [12]

대개장따람라 2시간전 277 21

2936232 Fate/Grand Order 🖼️짤/만화 영령전승이문-아시야 도만 전편 2 [2]

비비밥 05-19 371 5

2936231 남녀역전 리뷰/홍보 재홍보)역전세계의 용사마켓 [8]

글싸개 05-20 312 10

2936230 브라운더스트2 뉴비 확률 봣는데 이게 맞음? [14]

ㅇㅇ 2시간전 730 14

2936229 메이플스토리 자랑 -완- [29]

눈나죽어 13시간전 392 7

2936228 에어소프트 일반 념글 저거 나무위키 원래는 더 심했음 ㅋㅋㅋㅋㅋ [6]

눈나쁠올 2시간전 982 40

2936227 스노우 브레이크 아가원룸 그렇게 노크하면 망가지는데................. [12]

ㅇㅇ 2시간전 563 18

2936226 명조 정보 엉덩이 한남뷰 명당 찾았다 [36]

씹덕게임유저 2시간전 4798 67

2936225 블루 아카이브 아 병림 PD 나간 이유 알았다 [39]

슈슈포포 2시간전 5011 135

2936224 프린세스 커넥트 Re:Dive 공략/정보 [일섭]1시간이나 늦은 전장2(나나카 / 편오이 ) 정보 [11]

이리야온스타인 3시간전 216 14

2936223 블루 아카이브 🎨창작 트위터꼬집밈 보고 그린 이즈나.grim [21]

지르_ 2시간전 1822 60

2936222 블루 아카이브 우리가 해줘야하는건 '응원' 이 아닐까 [49]

대형군붕이 2시간전 4177 186

2936221 블루 아카이브 번역 예상치 못한 복병 [10]

ㅇㅇ 5시간전 2746 36

전체글 Ai 언어모델 로컬 채널