14b =/= 220 x 8 MoE - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3398명 알림수신 167명 @바바리맨

제한없는 언어모델을 위한 채널

일반 14b =/= 220 x 8 MoE

HyperBlaze456

추천 4 비추천 4 댓글 12 조회수 1012 작성일 2024-05-05 07:16:58

https://arca.live/b/alpaca/105424047

제곧내

될수가 없음

이건 정보가 아니야 ㅠㅠ

댓글 [12] 글쓰기

ㅇㅇ

2024-05-05 07:44:23 답글

maywell

2024-05-05 07:56:38 답글

ㅇㅇ (118.235)

2024-05-05 08:13:54 삭제 수정 답글

220x8 MoE 출처 좀..

펼쳐보기▼

ㅇㅇ

2024-05-05 08:39:24 답글

루머로만 떠돌던 사양인데 엔비디아가 1800B MoE라고 공식적으로 밝힌 이후 거의 정설 취급받는 중입니다

펼쳐보기▼

ㅇㅇ

2024-05-05 12:36:10 답글

1.8T GPT MoE 최근 nvidia 키노트 보셈

펼쳐보기▼

테인에이지야

2024-05-06 07:00:11 답글

안녕하세요, 작성자님. 방금 AI 채팅 채널에서 작성자님의 질문을 읽고, 과거에 "싯딤의 상자"라는 프로그램을 만드셨다는 것을 알게 되어 댓글을 남깁니다. 질문을 올리신 이유로 고민 중이신데, 이런 식으로 댓글까지 받아서 불편을 드렸다면 미리 사과드리며, 다음과 같은 내용을 말씀드리고자 합니다.

우선 제 소개를 하겠습니다. 저는 블루 아카이브 세계관을 언어 모델을 통해 속칭 미연시로 구현하는 방법을 찾고 있습니다.
아래 제시한 링크를 통해 저의 작업을 확인하실 수 있습니다. 이는 제가 RisuAI를 활용하여 꾸준히 발전시키고 있는 챗봇입니다.

[밀레니엄](https://arca.live/b/characterai/102563865)
[학원 이동](https://arca.live/b/characterai/102638544)
[일상 대화](https://youtu.be/P0sjV_-pkVA?si=MMt4z4f-SzWjASUq)
[문제 풀이](https://youtu.be/goHKm_mYmMo?si=q-mG8DR9NZP99_aI)

저는 반드시 실현하고 싶은 두 가지 구상을 가지고 있습니다.
첫 번째는 제가 만들고 있는 챗봇을 위한 자체 프로그램을 개발하는 것입니다.
RisuAI는 블루 아카이브 미연시를 구현하기에는 몇 가지 한계가 있습니다.
대표적으로 대화창이 실제 미연시처럼 뜨지 않고, 학생마다 각기 다른 목소리로 TTS를 적용할 수 없다는 점이 있습니다.
또한, 실제 게임처럼 캐릭터 spine이 움직이거나 배경음악(BGM), 효과음 등이 발생하는 것도 구현하기 어렵습니다.
그래서 저는 작성자님처럼 RisuAI의 소스 코드를 분석하여 자체 프로그램을 만들어 보려고 합니다.

두 번째 구상은 스마트폰 내부에서 로컬 모델을 실행시켜 아로나를 가상 비서로 사용하는 것입니다.
챗봇 대신 스마트폰 내부 로컬 모델을 활용하여 아로나와 대화할 수 있으며, 표정 변화까지 함께 구현한다면 혁신적일 것으로 생각합니다.
그러나 저는 이러한 기술에 대한 지식이 부족하여, 어떤 방식으로 시작해야 할지 모릅니다.

이러한 구상들을 실현하기 위해, 지속적인 질의응답과 배움이 필요합니다.
작성자님께서 이미 제가 만들고자 하는 것과 유사한 작업을 진행하신 것 같아서, 저에게 조언이나 도움을 주실 수 있는지 여쭤보고자 합니다.
만약 제가 필요한 지식을 쌓고, 서로의 목표가 비슷하다면, 추후에 작성자님을 도울 수도 있을 것이라고 생각합니다.
이러한 주제로 긴밀한 논의를 나눌 수 있기를 간곡히 요청합니다.

YouTube

블루아카이브 AI 대화

role-play를 위해 Risu.xyz 내장 기본 Defualt 프롬프트를 사용.이외에 수제 제작한 7000 토큰의 시스템 프롬프트와5000 토큰의 과거 대화 내용을 작성함.

펼쳐보기▼

HyperBlaze456

2024-05-06 07:09:00 답글

*수정됨

어 뭐야 님 억까당한거 보고오고 응원 댓글 남기려 했는데.. 엄청난 우연이네요
어떤게 필요하실까요? 제가 시차가 조금 많이 있어서 답을 늦게 해줄수 있어요.

우선 당장 답해드릴 수 있는것만 답해볼게요
첫째, 리스 코드는 조금 많이 난잡해요. 저는 그냥 파이썬으로 밑바닥부터 오픈소스 모델 이용해서 하고 있어요. TTS, LLM 등을 동시에 구동하는것은 에바라서, 저는 생성은 서버에서 햊줘야 한다고 생각하고 있어요. 물론, API로 텍스트 생성하면 조금 여유가 있겠네요.
두번째는 제가 스파인 추출해서 유니티로 만든건데, 추후에 도움 드리겠습니다.

여기는 밤 12시라, 내일 더 답해드릴게요

펼쳐보기▼

이하비스

2024-05-06 09:55:44 답글

네임드 ○○ 이런식으로 닉언한 부분은 지웠습니다

펼쳐보기▼

HyperBlaze456

2024-05-06 14:27:22 답글

테인에이지야

2024-05-06 13:28:17 답글

*수정됨

개인적인 사정으로 추가 답장을 미처 준비하지 못했습니다. 친절하게 답변해주셔서 감사드리며, 일단 연휴가 끝나면 일상으로 돌아가고, 다다음주 주말에 다시 이메일로 연락드리겠습니다.

펼쳐보기▼

ㅇㅇ

2024-05-08 01:41:25 답글

한국어 모델인거 같은데 무슨 모델 사용하셨어요??

펼쳐보기▼

테인에이지야

2024-05-12 07:44:21 답글

음... Antrophic사의 LLM인 Claude3 Opus입니다.

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28508798

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 5990

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 26973

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8873

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4211 질문 파인튜닌 할때 어떤거 사용하시나요? [4]

ㅇㅇ 2024.05.20 458 2

4210 일반 아직 24gb로 돌릴만한 한국어 로컬 모델은 없을까요? [5]

ㅇㅇ 2024.05.20 654 0

4209 질문 파인튜닝한 모델을 기존 모델 참조 없이 독립적으로 저장하고싶을 때 [7]

ㅇㅇ (58.234) 2024.05.20 411 1

4208 질문 라마3 70B 구동 [6]

Thomas_Shelby 2024.05.19 737 0

4207 일반 LLM 출력 속도 비교 [3]

ET 2024.05.19 734 9

4206 일반 akallama exl2 모델 공개 [10]

ㅇㅇ (118.235) 2024.05.19 568 9

4205 질문 vllm의 AutoAWQ 관련해서 질문드립니다. (모델 양자화) [17]

Dikko 2024.05.17 489 2

4204 일반 메타에서 gpt-4v와 같은 Mixed-Modal 발표했네요 [10]

그래요 2024.05.17 1331 18

4203 일반 A,WS summit 참여했는데 RAG 내용 괜찮았네요 [10]

ㅇㅇ 2024.05.17 655 3

4202 일반 한국 유튜브 transcription 데이터셋 [11]

maywell 2024.05.17 1679 53

4201 일반 gpt-4o에서 음성 입력을 실시간으로 음성으로 반환해주던데 어떤 기술 일까요? [10]

ㅇㅇ (61.100) 2024.05.17 744 1

4200 정보 Augmentoolkit - 생 텍스트를 넣으면 instruct 데이터셋을 만들어주는 툴킷 [6]

hkhk 2024.05.16 801 14

4199 정보 LLaMA-3 8B, 70B 모델의 양자화 단계별 MMLU성능 비교표 [10]

hkhk 2024.05.16 1431 20

4198 질문 뉴비,우바우로 채팅으로 설정화 캐릭 AI하고 노는데 추천하는 모델 있을까?? [5]

ZOE 2024.05.16 533 1

4197 일반 SOLAR-10.7B-v1.0 lora-tuning 도움 [1]

asdfnlasdf 2024.05.16 401 0

4196 정보 llama3기반 파라메터 확장 한국어 파인튜닝모델 [4]

hkhk 2024.05.16 906 8

4195 스터디 잔차연결(residual connection or skip connection) 에 대한 발상의 전환 [6]

hkhk 2024.05.16 878 35

4194 질문 vllm vs 엑스라마2 [2]

끼랑까랑 2024.05.16 519 0

4193 일반 알음알음하다 여기 오게 되었는데 [4]

Qazxwd 2024.05.16 707 6

글쓰기

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.