llama.cpp로 양자화할때 에러가 뜨는데 무슨 문제려나요 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3403명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

질문 llama.cpp로 양자화할때 에러가 뜨는데 무슨 문제려나요

추천 0 비추천 0 댓글 2 조회수 291 작성일 2024-05-09 06:16:26

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/105759748

(base) server@Server:~/llama.cpp$ ./quantize ./models/Phi-3-mini-4k-instruct/ggml-model-f16.gguf ./models/Phi-3-mini-4k-instruct/ggml-model-Q4_K_M.gguf Q4_K_M

main: build = 913 (eb542d3)

main: quantizing './models/Phi-3-mini-4k-instruct/ggml-model-f16.gguf' to './models/Phi-3-mini-4k-instruct/ggml-model--Q4_K_M.gguf' as Q4_K_M

llama.cpp: loading model from ./models/Phi-3-mini-4k-instruct/ggml-model-f16.gguf

llama_model_quantize: failed to quantize: unknown (magic, version) combination: 46554747, 00000003; is this really a GGML file?

main: failed to quantize model from './models/Phi-3-mini-4k-instruct/ggml-model-f16.gguf'

양자화 하는거 따라해보고 있는데 에러가 뜨고 양자화가 안되네요

베이스모델을 f16 gguf까지는 변화이 됩니다만 (INFO:hf-to-gguf:Model successfully exported to 'models/Phi-3-mini-4k-instruct/ggml-model-f16.gguf')

python3 convert.py ./models/Phi-3-mini-4k-instruct

양자화할때 에러가 뜹니다

댓글 [2] 글쓰기

ㅇㅇ (114.71)

2024-05-09 06:46:02 삭제 수정 답글

16말고 32로 해보셈

펼쳐보기▼

2024-05-09 06:50:42 답글

그렇지 않아도 해봤는데 안됩니다

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28539316

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6004

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27060

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8897

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5097

공지 신문고

바바리맨 2023.04.18 2244

숨겨진 공지 펼치기(1개)

4239 일반 우바부가 잘아는사람있음? [1]

ㅇㅇ (211.118) 2024.05.24 43 0

4238 질문 회사에 RAG 쓰시는 분들에게 질문 [6]

ㅇㅇ (1.232) 2024.05.24 164 0

4237 일반 akallama ollama Modlefile template 오류

억장이 2024.05.24 79 0

4236 일반 앤트로픽이 밑에 소넷 작동원리를 파악한거를 금문교 클로드로 공개했네요 [4]

그래요 2024.05.24 220 5

4235 정보 Cohere에서 신규 모델(Aya 23 8B/35B) 나왔네요 [3]

ㅇㅇ 2024.05.23 380 7

4234 일반 중국발 ai 덤핑에 대해서 말이 많긴 하네요. [4]

감별사 2024.05.23 414 4

4233 스터디 llama2.c 모델 학습 결과 [2]

zzzzz5 2024.05.23 324 8

4232 일반 llama 3 70B -> 4x8B [1]

zzzzz5 2024.05.23 499 8

4231 정보 MacOS chatgpt app waitlist 우회하는 방법

jackofmaster 2024.05.23 253 6

4230 질문 프롬프트 엔지니어링이라는 용어의 범주? [2]

초당옥수꾸 2024.05.23 332 0

4229 일반 흥미로운 일/영 번역모델이 나왔네요 [6]

한가운데 2024.05.23 389 4

4228 질문 unsloth에서 device map 설정 방법 아시는 분 계실까요? [2]

ㅇㅇ (58.234) 2024.05.23 205 0

4227 질문 전력공학이나 전기공학 학습용 데이터같은것도있을까요? [1]

ㅇㅇ (1.235) 2024.05.22 179 0

4226 정보 mistral 7b 0.3출시 [5]

jackofmaster 2024.05.22 626 8

4225 일반 영향 있는 Lora 만드려면 몇번쯤 돌려야 하는거임? [1]

세법상법 2024.05.22 280 1

4224 스터디 딥러닝모델의 망각증상 (Catastrophic Forgetting)에 대한 고찰 [11]

hkhk 2024.05.22 650 31

4223 질문 contex 개념 좀 한번 잡아주세요 [4]

ㅇㅋㄹ 2024.05.22 236 0

4222 일반 Gemini 1.5 Flash 출시

pussydestroyer 2024.05.22 295 2

4221 스터디 TinyStories-Korean 모델 학습 결과 [6]

hkhk 2024.05.22 584 19

4220 일반 클로드 앤스로픽 블로그 - 소넷의 내부 작동을 이해했다 [6]

al06r 2024.05.22 400 8

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.