구독자 3338명
알림수신 164명
제한없는 언어모델을 위한 채널
일반
Llama-3-8B-Instruct 262k 컨텍스트 확장 출시
추천
12
비추천
0
댓글
16
조회수
1403
작성일
수정일
댓글
글쓰기
jackofmaster
maywell
PoSE: Efficient Context Window Extension of LLMs via Positional Skip-wise Training
Paper page - PoSE: Efficient Context Window Extension of LLMs via Positional Skip-wise Training
Join the discussion on this paper page
사과는맛있어맛있으면바나나
maywell
사과는맛있어맛있으면바나나
김젤리
maywell
김젤리
변태Lv1
maywell
maywell
변태Lv1
ㅇㅇ
휘진
ㅇㅇ
ㅇㅇ (49.174)
삭제
수정
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
공지
아카라이브 모바일 앱 이용 안내(iOS/Android)
28192344
공지
Ai 언어모델 로컬 채널 이용규정
5828
공지
뉴비에게 도움 되는 글 모음
26315
공지
언어모델 관련 정보취득 /무료체험 가능 사이트
8567
공지
여러분의 학습에 도움을 줄 수 있는 하드웨어 지원
4881
공지
신문고
2150
숨겨진 공지 펼치기(1개)
4173
일반
M4 익스트림 모델이 나온다는 이야기가 있네요.
[4]
251
1
4172
일반
애플, M2 칩을 데이터 센터에서 사용 예정
[3]
233
1
4171
일반
RWKV를 잇는 진정한 오픈소스 LLM MAP-NEO
227
8
4170
질문
언어모델 NPU 프로그래밍 가능한 플랫폼 질문드립니다.
[7]
347
0
4169
일반
라마3 한글특화 튜닝한 Bllossom 사용해보신 분 계신가요?
[9]
439
1
4168
일반
[lmsys] Llama-3-70B가 잘하는 것과 못하는 것
[3]
480
6
4167
일반
왜 임베딩 벡터는 이렇게 고차원이 되었을까
[5]
373
0
4166
질문
하루에 3000만토큰 쯤 쓰는데 로컬로 ..
[21]
516
1
4165
일반
exllamav2가 최고라고 생각했었는데 vllm은 어떤가요?
[7]
302
0
4164
질문
BERT에 관련하여
[3]
316
0
4163
일반
gemma를 ollama에서 서빙을 하려 합니다.
[3]
350
0
4162
질문
llama.cpp로 양자화할때 에러가 뜨는데 무슨 문제려나요
[2]
229
0
4161
질문
Deepspeed 사용하는 방법 아시나요?
[18]
471
0
4160
일반
코딩 llm 자주 사용함?
[20]
747
2
4159
자료
IBM에서 아파치2 라이센스로 코딩모델 출시
[5]
271
2
4158
일반
호기심에 번역한거 비교해봄
[12]
618
1
4157
스터디
비전 트랜스포머에는 레지스터가 필요하다
[19]
750
32
4156
스터디
디퓨전 모델이 학습하는 원리 - 어디까지 암기이고 어디부터 학습일까? - 디퓨전 모델은 정말 이해를 하고서 이미지를 만드는걸까?
[11]
870
34
4155
질문
업무 목적으로 한국어 튜닝해서 사용하시는 분 계신가요?
[6]
435
0
4154
일반
(구글x서울디지털재단)2024 서울 프롬프톤(AI 프롬프트엔지니어링 해커톤) 참가자 모집(기간 연장, ~5.15)
[5]
621
9
사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.