Falcon180B 출시 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3450명 알림수신 170명 @바바리맨

제한없는 언어모델을 위한 채널

정보 Falcon180B 출시

변태Lv1

추천 12 비추천 0 댓글 21 조회수 1247 작성일 2023-09-06 17:23:06 수정일 2023-09-06 17:23:21

https://arca.live/b/alpaca/85619089

모델에는 1,800억 개의 매개변수가 있습니다.
3조 5천억 개의 토큰으로 훈련됨(Llama 2의 거의 2배!)
700만 GPU 시간으로 훈련됨(4x Llama 2)
베이스 모델과 채팅 모델이 모두 출시되었습니다
품질은 13개 벤치마크에서 Llama 2 및 GPT-3.5보다 높은 PaLM-2 Large와 동등하므로 이 모델은 대중에게 알려진 최고의 모델 중 하나입니다.
라이선스에는 제한적인 조건이 있습니다. -> 타사에 API 서비스를 제공할 수 없습니다.
채팅 모델은 매우 간단한 형식을 가지고 있습니다.

System: Add an optional system prompt here
User: This is the user input
Falcon: This is what the model generates
User: This might be a second turn input
Falcon: and so on

훈련을 위해서는 많은 GPU가 필요합니다. 추론을 위해 GPTQ/int4를 사용하면 8개의 A100이 필요합니다.
Transformers 지원(오늘 발생한 기존 릴리스 4.33 포함)
- 비트샌드바이트, PEFT 및 GPTQ와 통합됩니다.
- RoPE 스케일링
- 추측적 디코딩 지원
4비트와 8비트에서는 성능 저하가 거의 나타나지 않습니다. 벤치마크 전반에 걸친 성능은 안정적으로 유지됩니다.

* 작업별 필요한 리소스

데모링크: https://huggingface.co/spaces/tiiuae/falcon-180b-demo

허깅링크: https://huggingface.co/tiiuae/falcon-180B

---

유저들의 평가로는 프롬프트 인식률부터 다르다는거 같음
실성능이 gpt3.5 터보에 가까운듯

그런데 필요한 리소스가 추론만 해도 ㄷㄷ

댓글 [21] 글쓰기

ㅇㅇ (211.246)

2023-09-06 17:37:50 삭제 수정 답글

이정도면 이제 로컬이라고 하기엔 좀ㅋㅋ

펼쳐보기▼

변태Lv1

2023-09-06 17:39:46 답글

ㅇㅇ (211.246)

2023-09-06 17:42:41 삭제 수정 답글

근데 qlora가 int4 inference보다 requirement가 작을수가 있음?

펼쳐보기▼

변태Lv1

2023-09-06 17:50:01 답글

뭔가 이상하네

펼쳐보기▼

쿠루가이

2023-09-06 21:35:53 답글

곧 gguf로 변환된게 나옮가요 ㅎㅎ

펼쳐보기▼

신염짱조음

2023-09-06 23:09:28 답글

아 이건 로컬에서는 무리같은데 ㅎㅎ

펼쳐보기▼

serina

2023-09-06 23:40:13 답글

아 저건 런팟으로도 좀 ㅋㅋ

펼쳐보기▼

노랑노랑

2023-09-06 23:58:09 답글

4비트로 바꿔도 저건쫌

펼쳐보기▼

그래요

2023-09-07 00:02:12 답글

*수정됨

와 이건 단순하게 컴퓨팅에 들어간 돈만 100억~150억은 될거 같은데 이걸 공개하네요 집에 a100x8은 하나씩 있다고 생각됩니다(?)

펼쳐보기▼

변태Lv1

2023-09-07 03:18:21 답글

로컬로 못돌린다해도 이런걸 턱하고 내놓는다는게 대단한거 같음

펼쳐보기▼

그래요

2023-09-07 05:17:44 답글

*수정됨

그것이 오일머니니까요 ㅎ 아부다비 대학에 교수로 지인이 갔다 왔는데 대우 엄청나다고 하더라고요

펼쳐보기▼

뉴비챗

2023-09-07 00:21:18 답글

프리트레인때 한글 데이터는 없어서 그런가 한글 입출력은 쓰레기 수준이네요...

펼쳐보기▼

변태Lv1

2023-09-07 02:55:45 답글

이건 좀 아쉽네...

펼쳐보기▼

그래요

2023-09-07 05:18:24 답글

사전학습 데이타중 아랍어도 없는게 신기요 uae에서 만든건데요

펼쳐보기▼

AiDreamGirls

2023-09-07 00:27:46 답글

4090 듀얼이 4비트 양자화된거 엑스라마로 라마2 70b 겨우 돌아가니까

180 b면 단순계산으로는 4090 5개정도 있음 돌릴수 있을거 같기도 하네여. 우리 챈에서 누가 한번 시도해봤으면

근데 이번에는 확실히 3.5에 근접할거 같긴합니다. 그전에 라마2까지는 설레발 좀심하긴했어가지고 ㅎㅎ

매개변수는 chatgpt 3.5가 175B 정도 되니까  거의 삐까드네요. 

빨리 벤치 나왔으면

펼쳐보기▼

그래요

2023-09-07 00:35:00 답글

저거 보면 4비트가 320기가 필요하다는데 런팟으로 돌려보고 싶어도 360기가 정도라 이거 다운받는것만 하세월 같아요

펼쳐보기▼

AiDreamGirls

2023-09-07 00:37:53 답글

헉... 320기가... 4090이 14개 필요하겠네요 ㅠ

펼쳐보기▼

그래요

2023-09-07 02:16:10 답글

그런데 또 원활하게 돌리려면 400g 필요하다고 되어 있어서 조금 더 쓰셔야 할듯요 ㅎㅎ

펼쳐보기▼

변태Lv1

2023-09-07 03:07:48 답글

라마2는 그냥 기본 컨텍스트가 4k로 증가했다는거에 만족
성능은 기대이하였음

펼쳐보기▼

AiDreamGirls

2023-09-07 00:30:05 답글

근데 이게 사실 보니까 매개변수가 올라갈수록 돌리는거 자체도 개빡세긴한데 

답변속도가 엄청 느려지더라구요.

180B짜리는4090 5~6개짜리로 돌려도 속도면에서 처참할거 같긴합니다. ㅎㅎ

펼쳐보기▼

변태Lv1

2023-09-07 03:17:32 답글

초당 한자리 숫자 토큰 나올것으로 예상됨

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30024024

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6126

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27716

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9148

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

500 정보 기계 번역의 패러다임 전환: 대규모 언어 모델의 번역 성능 향상 [5]

산정 2023.09.23 847 9

499 정보 beomi/llama-2-ko-70b가 공개됨 [16]

사과는맛있어맛있으면바나나 2023.09.22 1780 11

498 정보 SLI 크랙하는 방법중 부트영역에 라이센스를 심어 리눅스, 윈도우 모두 지원하는 방법 [1]

꼬로미 2023.09.21 283 2

497 정보 한국어 llama2 모델 komt-llama2-7b-v1 [17]

davidkim (1.215) 2023.09.19 2289 23

496 정보 단 하나의 예제로도 언어모델은 배울 수 있나요? [번역] [3]

산정 2023.09.19 912 9

495 정보 GPTQ보다 빠른 awq 양자화 [5]

novelgif 2023.09.16 1124 6

494 정보 TinyLlama 1.1B 프로젝트 진행 중... [4]

novelgif 2023.09.16 835 5

493 정보 4090 기준 우바부가 exllama v2 70b 2.55비트 양자화 모델 추론속도 [9]

호옹이 2023.09.13 1072 8

492 정보 OmniQuant: 대규모 언어 모델을 위해 전방향으로 보정된 양자화 [3]

변태Lv1 2023.09.12 881 13

491 정보 exllama의 가속화 [exllama_v2]! [5]

변태Lv1 2023.09.12 837 7

490 정보 1.5B가 7B 모델과 성능벤치가 비슷하다..? [2]

ㅎ헤ㅔ헤헤헤 2023.09.12 635 6

489 정보 llama2.mojo가 llama2.c 보다 빠르다네 [14]

ac 2023.09.12 606 9

488 정보 메두사: 다중 디코딩 헤드를 사용한 LLM 생성 가속 기술 [5]

산정 2023.09.12 1046 11

487 정보 새로 나온 기초모델 Persimmon-8B [5]

산정 2023.09.10 635 7

486 정보 NVIDIA TensorRT-LLM 대규모 언어 모델을 크게 향상 [5]

헛소리전문 2023.09.08 642 4

485 정보 Llama.cpp, draft model 지원 [5]

모찌파 2023.09.07 360 6

484 정보 샘플 문장 딱 한개만 학습시키는 방법 [7]

hkhk 2023.09.07 747 5

483 정보 Falcon180B 출시 [21]

변태Lv1 2023.09.06 1248 12

482 정보 AI를 둘러싼 메타 내부의 드라마: 컴퓨팅 파워 갈등과 라마3에 대한 루머 [4]

산정 2023.09.06 631 9

481 정보 텍스트 추출이 너무 귀찮아서 만든 프로그램입니다. [6]

ㅎ헤ㅔ헤헤헤 2023.09.05 1200 12

글쓰기

전체글 개념글