IQ1_S llama.cpp 병합 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3403명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

일반 IQ1_S llama.cpp 병합

추천 0 비추천 0 댓글 1 조회수 269 작성일 2024-03-12 04:36:49 수정일 2024-03-12 04:38:16

https://arca.live/b/alpaca/101023408

https://github.com/ggerganov/llama.cpp/pull/5999

llama.cpp 에서 1.5bit 논문을 보고 영감을 받아서

1.5bit 양자화를 구현했다고 하네요.

병합 된걸로 보여요.

IQ1_S이면 70B를 24GB 1개로 돌릴 수 있을 것 같아요.

ppl 이 5.2로 준수한 편이라고 하네요.

아직 올라온 모델은 못찾겠습니다. 아마 곧 볼 수 있을거 같네요.

(kiqu 누가 만들어주랑)

댓글 [1] 글쓰기

2024-03-12 04:38:18 답글

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28541248

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6005

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27067

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8897

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5099

공지 신문고

바바리맨 2023.04.18 2244

숨겨진 공지 펼치기(1개)

1540 일반 Llama.cpp 질문 있습니다. [5]

jarvis777 2024.04.04 432 0

1539 일반 RWKV 6 학습 21% 상황 [4]

ㅎ헤ㅔ헤헤헤 2024.04.04 693 2

1538 일반 rwkv 6 7B 13% 후기 [7]

ㅎ헤ㅔ헤헤헤 2024.04.04 909 10

1537 일반 구름3 모델 공개 [8]

ㅇㅇ (163.152) 2024.04.04 1511 17

1536 일반 임베딩모델 학습후 특정 단어를 못찾는 경우? [1]

ㅇㅇ (121.135) 2024.04.04 292 0

1535 일반 AI 전략최고위 출범 [3]

zzzzz5 2024.04.04 730 0

1534 일반 뻘글) 70B정도 되면 nvlink가 필요충분이구나 [7]

용바오 (221.146) 2024.04.03 632 1

1533 일반 입문하면서 경험한 점들 [3]

실시간채팅 2024.04.03 718 3

1532 일반 하이파-클로바 테크 리포트 [12]

ㅇㅇ 2024.04.03 731 3

1531 일반 '호랑이' 한국어 LLM 리더보드가 나왔네요 [1]

빠모 2024.04.03 770 4

1530 일반 뉴비) 파인튜닝시 데이터 포맷 질문

ㅇㅇ (175.197) 2024.04.03 221 0

1529 일반 깔끔하게 정제된 데이터셋 있을까요? [2]

ㅇㅇ (106.102) 2024.04.02 488 0

1528 일반 혹시 PLM은 우바부가에서 돌리는 타 페이스북 모델이나 KoLlava와 같이 그냥 돌릴 수가 없나요? [1]

haha 2024.04.02 244 0

1527 일반 p40을 구해왔는데 알고보니 cpu가 F [7]

PRG 2024.04.02 526 5

1526 일반 GPU에서 load_in_4bit 모델 추론시 속도 [4]

ㅇㅇ (223.38) 2024.04.02 449 0

1525 일반 Mamba 리뷰 해봤습니다. (소리 이슈로 재업로드) [15]

버트가조아 2024.04.01 1169 22

1524 일반 Tesla P40 으로 저렴하게 멀티 GPU 사용하는게 막혔네요 [1]

ㅇㅇ (125.133) 2024.03.31 1020 14

1523 일반 top_p top_k는 정말 잘 만든 파라미터인거 같아요 [6]

pussydestroyer 2024.03.30 785 3

1522 일반 DBRX 검열 있네요 [1]

LCA 2024.03.30 612 0

1521 일반 비트넷 b1.58 모델 재현 + 모델 공개 [4]

ㅇㅇ (141.223) 2024.03.29 1311 18

전체글 개념글