언어모델 NPU 프로그래밍 가능한 플랫폼 질문드립니다. - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3403명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

질문 언어모델 NPU 프로그래밍 가능한 플랫폼 질문드립니다.

ㅇㅇ (166.104)

추천 1 비추천 0 댓글 8 조회수 589 작성일 2024-05-10 08:50:31

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/105850609

안녕하세요.

현재 LLM Inference 최적화 관련해서 연구하고 있는데 생각하고 있는게 요새 기성품(애플 m시리즈, 인텔 코어 울트라, 스냅드래곤 Elite X 등등..) 들에 SoC 형태로 CPU+NPU, CPU+GPU+NPU 같이 많이 출시를 하고 있는것으로 알고있습니다.

이와 관련해서 NPU를 활용한 LLM Inference 최적화를 생각해보는 중인데, NPU에서 Low-Level 언어를 활용한 프로그래밍이 가능해보이는 적절한 플랫폼을 찾기가 쉽지않네요...

인텔에서 관련해서 공개한 Direct ML을 이용해서 Transformer 모델 Inference관련글도 봤는데 이것도 High-Level에서 이미 만들어진 API를 통해서 만들어서 실질적인 연산 커널 최적화는 어려워보입니다.
(참고: https://devblogs.microsoft.com/directx/introducing-neural-processor-unit-npu-support-in-directml-developer-preview/)

그래서 지금 생각하고 있는건 아무래도 맥북에서 NPU활용한 프로그래밍을 생각해보고 있습니다. 실질적으로 가능할까요? 아니면 NPU 프로그래밍이 가능한 플랫폼을 아시는게 있다면 의견 구하고 싶습니다.

아무래도 이러한 부분에는 경험이 적다보니 의견 공유해주신다면 감사히 듣고싶습니다!

감사합니다.

댓글 [8] 글쓰기

2024-05-10 10:05:55 답글

애플이 직접 개발해서 내놓는 mlx 에서도 ANE 사용 불가능하고 현재 지원할 예정 없습니다

펼쳐보기▼

ㅇㅇ (166.104)

2024-05-11 06:45:18 삭제 수정 답글

의견 감사합니다.. NPU 프로그래밍을 활용한 관련 논문도 찾아보기가 힘든 것 보니 힘들긴한가봅니다.. 답변 감사합니다!

펼쳐보기▼

2024-05-11 07:49:35 답글

의견이 아니고 사실입니다

펼쳐보기▼

2024-05-10 16:22:01 답글

일부 중요한 연산은 npu로 할 수 있는데, 애초부터 모든 모델을 npu에 넣을수도 없고, 문제가 많아요. 간단한 RNN정도는 된다지만 희망을 너무 많이 가지면 실망할 것 같네요

펼쳐보기▼

ㅇㅇ (166.104)

2024-05-11 06:44:15 삭제 수정 답글

넵 감사합니다.. 역시 NPU가 역사가 짧다보니 관련해서 직접 다루어 볼 수 있는 기회가 개인에게는 적은것 같네요.. 답변 감사합니다!

펼쳐보기▼

2024-05-11 04:31:07 답글

로레벨 최적화를 다루는 프레임웍이라면 tinygrad 살펴보시면 어떨까요?

펼쳐보기▼

ㅇㅇ (166.104)

2024-05-11 06:52:52 삭제 수정 답글

오... 이런 프레임워크가 있었군요.... ANE나 TPU관련 자료가 어느정도 존재하기도 하네요.. 감사합니다 좋은 의견 공유감사드립니다!

펼쳐보기▼

2024-05-12 20:04:35 답글

https://github.com/intel/intel-npu-acceleration-library 인텔쪽에서 풀린게 있긴 합니다

GitHub - intel/intel-npu-acceleration-library: Intel® NPU Acceleration Library

Intel® NPU Acceleration Library. Contribute to intel/intel-npu-acceleration-library development by creating an account on GitHub.

인텔쪽에서 풀린게 있긴 합니다

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28534952

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6001

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27052

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8892

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5096

공지 신문고

바바리맨 2023.04.18 2244

숨겨진 공지 펼치기(1개)

4237 일반 akallama ollama Modlefile template 오류

억장이 2024.05.24 7 0

4236 일반 앤트로픽이 밑에 소넷 작동원리를 파악한거를 금문교 클로드로 공개했네요 [2]

그래요 2024.05.24 111 4

4235 정보 Cohere에서 신규 모델(Aya 23 8B/35B) 나왔네요 [2]

ㅇㅇ 2024.05.23 308 4

4234 일반 중국발 ai 덤핑에 대해서 말이 많긴 하네요. [4]

감별사 2024.05.23 328 4

4233 스터디 llama2.c 모델 학습 결과 [2]

zzzzz5 2024.05.23 286 8

4232 일반 llama 3 70B -> 4x8B [1]

zzzzz5 2024.05.23 466 7

4231 정보 MacOS chatgpt app waitlist 우회하는 방법

jackofmaster 2024.05.23 230 6

4230 질문 프롬프트 엔지니어링이라는 용어의 범주? [2]

초당옥수꾸 2024.05.23 310 0

4229 일반 흥미로운 일/영 번역모델이 나왔네요 [6]

한가운데 2024.05.23 373 4

4228 질문 unsloth에서 device map 설정 방법 아시는 분 계실까요? [2]

ㅇㅇ (58.234) 2024.05.23 195 0

4227 질문 전력공학이나 전기공학 학습용 데이터같은것도있을까요? [1]

ㅇㅇ (1.235) 2024.05.22 175 0

4226 정보 mistral 7b 0.3출시 [5]

jackofmaster 2024.05.22 604 8

4225 일반 영향 있는 Lora 만드려면 몇번쯤 돌려야 하는거임? [1]

세법상법 2024.05.22 268 1

4224 스터디 딥러닝모델의 망각증상 (Catastrophic Forgetting)에 대한 고찰 [11]

hkhk 2024.05.22 623 31

4223 질문 contex 개념 좀 한번 잡아주세요 [4]

ㅇㅋㄹ 2024.05.22 230 0

4222 일반 Gemini 1.5 Flash 출시

pussydestroyer 2024.05.22 280 2

4221 스터디 TinyStories-Korean 모델 학습 결과 [5]

hkhk 2024.05.22 569 19

4220 일반 클로드 앤스로픽 블로그 - 소넷의 내부 작동을 이해했다 [6]

al06r 2024.05.22 391 7

4219 일반 님들 책 한권씩만 추천해줘요 [3]

세법상법 2024.05.22 286 1

4218 질문 aphrodite-engine 모델 서비스 [7]

ㅇㅇ 2024.05.22 330 0

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.