라마3를 실리콘 맥미니에서 돌려보았음. - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3334명 알림수신 164명 @바바리맨

제한없는 언어모델을 위한 채널

일반 라마3를 실리콘 맥미니에서 돌려보았음.

추천 8 비추천 2 댓글 9 조회수 837 작성일 2024-04-24 22:54:51

https://arca.live/b/alpaca/104502300

메타가 공개한 라마3를 실리콘 맥미니에서 돌려보았.

https://youtu.be/3ef8ICu-dvc?si=LHwtg9LEzTWubl51

양자화 안된 8B 모델. 영상처럼 mps 가속이라 빠르다
답변의 질은 챗지피티3.5~4 정도의 느낌..좀더 써봐야겠지만~

중요한건 로컬에서 다운받아 돌리는 방식이어서

인터넷이 안되는 곳에서도 챗지피티4급 채팅이 가능하다는 거지요~

시끄럽고 비싸고 뜨거운 쿠다머신들과는 다르게

실리콘맥들은 라마3를 돌려도 조용하고 전기덜먹고 미지근한 정도!!

엔비디야가 이 글을 싫어할듯~

참고로 라마3는 메타(페이스북)가 며칠전 오픈소스로 풀어버린 chatGPT4급 LLM 챗봇모델

mps = 맥 gpu 용 GPGPU

다음번엔 RAG나 파인튜닝 등을 해보겠음.

댓글 글쓰기

2024-04-24 23:32:08 답글

Comfyui 를 비롯 거의모든 파이토치 학습 및 추론이 mps 로 빨라집니다.

펼쳐보기▼

2024-04-25 00:59:31 답글

https://arca.live/b/aiart/85885417 이거 빠르다고 할 수 있나요?

펼쳐보기▼

ㅇㅇ (39.7)

2024-04-25 00:02:47 삭제 수정 답글

맥으로 파인튜닝을한다고??

펼쳐보기▼

2024-04-25 00:11:42 답글

맥스투디오

펼쳐보기▼

ㅇㅇ (210.91)

2024-04-25 00:10:41 삭제 수정 답글

프로맥도 아니고 맥미니에서 파인튜닝이 가능한가요?

펼쳐보기▼

2024-04-25 00:12:28 답글

맥스튜디오

펼쳐보기▼

야옹멍멍용

2024-04-25 02:37:32 답글

몇토큰 정도 나오나요?

펼쳐보기▼

2024-04-25 02:47:25 답글

어케 재나요? 속도는 빠름

펼쳐보기▼

야옹멍멍용

2024-04-25 02:50:17 답글

파이썬 코드로 돌리나요 아니면 oobabooga 같은 프로그램으로 돌리나요? 
콘솔창보면 생성후에 token/s 이런거 나와요

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28174903

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 5820

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 26275

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8539

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 4869

공지 신문고

바바리맨 2023.04.18 2145

숨겨진 공지 펼치기(1개)

1682 일반 라마3 한글특화 튜닝한 Bllossom 사용해보신 분 계신가요? [4]

wk 2024.05.10 225 0

1681 일반 [lmsys] Llama-3-70B가 잘하는 것과 못하는 것 [3]

ㅇㅇ 2024.05.10 334 5

1680 일반 왜 임베딩 벡터는 이렇게 고차원이 되었을까 [5]

iau 2024.05.10 275 0

1679 일반 exllamav2가 최고라고 생각했었는데 vllm은 어떤가요? [6]

호옹이 2024.05.10 205 0

1678 일반 gemma를 ollama에서 서빙을 하려 합니다. [3]

ㅇㅇ (218.145) 2024.05.09 317 0

1677 일반 코딩 llm 자주 사용함? [20]

사과는맛있어맛있으면바나나 2024.05.09 684 2

1676 일반 호기심에 번역한거 비교해봄 [12]

pussydestroyer 2024.05.08 586 1

1675 일반 (구글x서울디지털재단)2024 서울 프롬프톤(AI 프롬프트엔지니어링 해커톤) 참가자 모집(기간 연장, ~5.15) [5]

ljhljhljh 2024.05.08 579 8

1674 일반 A100 40GB로 llama3 70B 구동은 되는지? [3]

ㅇㅇ (203.252) 2024.05.08 526 2

1673 일반 ms가 500b 모델을 학습중이라고 합니다 [2]

그래요 2024.05.08 403 3

1672 일반 판매자 정보 실수 - 4060ti 16gb dual 또는 3way 를 위한 핫딜 정보 [11]

ㅇㅇ 2024.05.07 606 5

1671 일반 런팟 NFS 마운트 안되나요?

ㅇㅇ (121.135) 2024.05.07 144 0

1670 일반 rag를 사용할때 로컬모델의 경우 모르는것을 모른다고 잘 하던가요? [7]

호옹이 2024.05.07 526 2

1669 일반 Langchain, Rag 질문 있습니다 [1]

ㅇㅇ (119.200) 2024.05.07 302 0

1668 일반 커맨드 R 플러스 로컬에서? [6]

감별사 2024.05.06 483 1

1667 일반 llama3 70b aqlm 2bit [5]

jackofmaster 2024.05.06 513 5

1666 일반 14b =/= 220 x 8 MoE [11]

HyperBlaze456 2024.05.05 872 0

1665 일반 대기업 사장님이 직접 배달해주는 GPU [4]

ㅇㅇ (221.141) 2024.05.04 837 5

1664 일반 GLaDOS 성격 코어 (직접 번역) [2]

pussydestroyer 2024.05.03 706 12

1663 일반 ai expo 코리아 왔는데 사람 엄청 많음 + 관람 후기 [20]

hkhk 2024.05.03 1545 18

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.