구독자 3405명
알림수신 168명
제한없는 언어모델을 위한 채널
일반
Llama-3-8B-Instruct 262k 컨텍스트 확장 출시
추천
12
비추천
0
댓글
16
조회수
1502
작성일
수정일
댓글
[16]
글쓰기
jackofmaster
maywell
PoSE: Efficient Context Window Extension of LLMs via Positional Skip-wise Training
Paper page - PoSE: Efficient Context Window Extension of LLMs via Positional Skip-wise Training
Join the discussion on this paper page
사과는맛있어맛있으면바나나
maywell
사과는맛있어맛있으면바나나
김젤리
maywell
김젤리
변태Lv1
maywell
maywell
변태Lv1
ㅇㅇ
휘진
ㅇㅇ
ㅇㅇ (49.174)
삭제
수정
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
공지
아카라이브 모바일 앱 이용 안내(iOS/Android)
28577213
공지
Ai 언어모델 로컬 채널 이용규정
6013
공지
뉴비에게 도움 되는 글 모음
27123
공지
언어모델 관련 정보취득 /무료체험 가능 사이트
8920
공지
여러분의 학습에 도움을 줄 수 있는 하드웨어 지원
5113
공지
신문고
2257
숨겨진 공지 펼치기(1개)
4164
스터디
매니폴드 가설 - 생성형AI 의 원리를 이해하기 위한 핵심 전제
[7]
1432
50
4163
일반
무한 어텐션을 활용한 10M 컨텍스트 Gemma
345
4
4162
질문
3090ti 매물이 갑자기 많아지는데
[4]
718
2
4161
일반
일본 쪽 소식 올려도 됨?
[2]
597
5
4160
일반
굉장히 저렴한 DeepSeek-V2 후기
[6]
1307
12
4159
일반
M4 익스트림 모델이 나온다는 이야기가 있네요.
[7]
736
4
4158
일반
애플, M2 칩을 데이터 센터에서 사용 예정
[5]
608
2
4157
일반
RWKV를 잇는 진정한 오픈소스 LLM MAP-NEO
[4]
874
22
4156
질문
언어모델 NPU 프로그래밍 가능한 플랫폼 질문드립니다.
[8]
601
1
4155
일반
라마3 한글특화 튜닝한 Bllossom 사용해보신 분 계신가요?
[11]
994
1
4154
일반
[lmsys] Llama-3-70B가 잘하는 것과 못하는 것
[4]
940
6
4153
일반
왜 임베딩 벡터는 이렇게 고차원이 되었을까
[6]
672
0
4152
질문
하루에 3000만토큰 쯤 쓰는데 로컬로 ..
[22]
890
1
4151
일반
exllamav2가 최고라고 생각했었는데 vllm은 어떤가요?
[7]
502
0
4150
질문
BERT에 관련하여
[3]
495
0
4149
일반
gemma를 ollama에서 서빙을 하려 합니다.
[3]
479
0
4148
질문
llama.cpp로 양자화할때 에러가 뜨는데 무슨 문제려나요
[2]
293
0
4147
질문
Deepspeed 사용하는 방법 아시나요?
[18]
615
0
4146
일반
코딩 llm 자주 사용함?
[23]
1054
2
4145
자료
IBM에서 아파치2 라이센스로 코딩모델 출시
[5]
323
2
사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.