mlx 를 돌려봤습니다. - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3405명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

일반 mlx 를 돌려봤습니다.

noopSD

추천 2 비추천 0 댓글 2 조회수 361 작성일 2024-04-16 16:04:24

https://arca.live/b/alpaca/103816936

허깅페이스 mlx-community 라는 조직(Organization)이 있습니다.

이곳에 mlx 용으로 변환된 모델이 좀 올라오길래 직접 시도해봤습니다.

정확히는 Mixtral 8x22B v0.1 같은 건 왜 여기에 2bit 양자화로 올리지 않는걸까? 에서 시작했습니다.

### 결과:

위의 그림에서 보다시피, 2비트 양자화로 결과물이 나오긴 하는데, 2비트 양자화는 제대로 안돌아가는듯 합니다.

양자화 되는 속도는 매우 빨랐으며, llama.cpp 에 가장 처음 등장한 Q4_0, Q4_1, Q5_0, Q5_1, Q8_0 같은 것 보다 더 빠르게 양자화를 하는 것 처럼 느껴졌습니다. 즉, 정말 별거 안하는 양자화인 것으로 보입니다.

96GB 이상 램이 있는 Apple Silicon 컴퓨터라면 좀 쓸만할 것 같기도 하구요. M1 Max 64GB 램인 저는 잘 안쓸 것 같네요.

llama.cpp 가 더 많은 선택지를 제공하고 속도도 그럭저럭 나쁘지 않으니까요.

댓글 [2] 글쓰기

LCA

2024-04-26 05:30:13 답글

Mlx가 추론 입출력 속도가 더 빠른가요?

펼쳐보기▼

noopSD

2024-04-26 11:28:23 답글

*수정됨

측정은 안해봤지만 아주 살짝 더 빠른 정도인듯 하구요. 수백개의 GGUF 파일을 들고 있는 저로서는 굳이 이걸 쓸 이유를 못느꼈습니다.

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28576076

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6013

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27121

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8919

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4044 질문 문득 최근 llm 모델 나오면서 착오가 자꾸 생겨서 여쭤봅니다. [4]

ㅇㅇ (61.33) 2024.04.24 480 6

4043 질문 특정 도메인에 대한 지식 학습 [7]

뉴비챗 2024.04.23 596 0

4042 일반 뇌에서 순수하게 언어 처리 부분만 떼어내면 어느정도의 시냅스가 있을까 [1]

iau 2024.04.23 356 1

4041 일반 저러면 8B 다국어 모델은 어느 정도 나오려나 [1]

딸기맛봇치 2024.04.23 479 1

4040 일반 phi-3 mini 벤치마크 점수 [3]

처음입니다 2024.04.23 616 8

4039 일반 젠장 또 라마3야 [11]

사과는맛있어맛있으면바나나 2024.04.23 1548 16

4038 공지 llama3 시대를 기념하여 공지글 한번 리프레쉬했으면 합니다. [4]

hkhk 2024.04.23 263 1

4037 정보 phi 3 mini출시 [6]

jackofmaster 2024.04.23 552 3

4036 질문 컴퓨터 사양 조언을 구하고 싶습니다 [8]

지능순 2024.04.23 338 0

4035 질문 안녕하세요 뉴비입니다 [14]

kixerfx 2024.04.23 348 0

4034 정보 원하는 모델을 gguf로 변환 해줍니다. [2]

zzzzz5 2024.04.23 576 5

4033 질문 LLaMa-3-70B 4bit 돌려보는 중인데 이상동작을 합니다.. [3]

처음입니다 2024.04.23 624 0

4032 일반 지금 와서 드는 생각 - ChatGPT 는 20B 모델인가? [7]

hkhk 2024.04.23 814 7

4031 일반 우바부가 listen 적용시 발생하는 오류 [2]

가우즈먼 2024.04.23 238 -1

4030 질문 양자화도 모르는 그냥 싹다 노베이스인데 궁금해서 올립니다 [5]

백열전구 2024.04.23 511 1

4029 일반 라마3가 나오고 8b하고 70b로 이거저거 해보고 느낌 [2]

그래요 2024.04.23 798 3

4028 일반 llama3 70B 를 GPU 4GB 에서 작동가능? [8]

ㅇㅇ (118.235) 2024.04.23 740 7

4027 질문 AI그림쪽은 AI로 생성한 데이터셋으로 훈련할수록 퀄리티 떨어진다는 논문 있었는데 [4]

iau 2024.04.23 499 1

4026 정보 llama3 의 양자화 버전의 성능은 얼마나 나올까? [6]

hkhk 2024.04.23 838 8

4025 정보 phi 3 기술 보고서 발표 [3]

ㅇㅇ 2024.04.23 614 7

글쓰기

전체글 개념글