구독자 3330명
알림수신 164명
제한없는 언어모델을 위한 채널
일반
Llama-3-8B-Instruct 262k 컨텍스트 확장 출시
추천
12
비추천
0
댓글
16
조회수
1387
작성일
수정일
댓글
글쓰기
jackofmaster
maywell
PoSE: Efficient Context Window Extension of LLMs via Positional Skip-wise Training
Paper page - PoSE: Efficient Context Window Extension of LLMs via Positional Skip-wise Training
Join the discussion on this paper page
사과는맛있어맛있으면바나나
maywell
사과는맛있어맛있으면바나나
김젤리
maywell
김젤리
변태Lv1
maywell
maywell
변태Lv1
ㅇㅇ
휘진
ㅇㅇ
ㅇㅇ (49.174)
삭제
수정
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
공지
아카라이브 모바일 앱 이용 안내(iOS/Android)
28163981
공지
Ai 언어모델 로컬 채널 이용규정
5816
공지
뉴비에게 도움 되는 글 모음
26236
공지
언어모델 관련 정보취득 /무료체험 가능 사이트
8512
공지
여러분의 학습에 도움을 줄 수 있는 하드웨어 지원
4858
공지
신문고
2143
숨겨진 공지 펼치기(1개)
561
스터디
디퓨전 모델이 학습하는 원리 - 어디까지 암기이고 어디부터 학습일까? - 디퓨전 모델은 정말 이해를 하고서 이미지를 만드는걸까?
[8]
708
31
560
스터디
비전 트랜스포머에는 레지스터가 필요하다
[18]
604
29
559
정보
gpt2-chatbot돌아옴
[15]
1404
11
558
일반
GLaDOS 성격 코어 (직접 번역)
[2]
687
12
557
일반
ai expo 코리아 왔는데 사람 엄청 많음 + 관람 후기
[20]
1522
18
556
정보
모델은 얼마나 벤치마크에 과적합 되어 있은가?: GSM-1k
[15]
1147
15
555
일반
Llama-3-8B-Instruct & 한국어 모델들에 "DJ DJ pump this party"로 테스트를 해봤습니다
[4]
1661
19
554
일반
라마3 토크나이저 기반 소형 모델 l3-211m
[2]
1299
22
553
일반
1-딸깍 is all you need. 컨텍 확장, 채팅 모델 제작을 단 한번의 클릭으로.
[42]
3226
50
552
정보
나이지리아 인들이 AI 에 독을 풀었다.
[15]
1991
23
551
정보
교내 산학협력으로 직접 구축한 윤리, 편향 대응 일상대화 데이터셋
[11]
1011
31
550
일반
Llama-3-8B-Instruct 262k 컨텍스트 확장 출시
[16]
1388
12
549
일반
초딩도 할 수 있는 컨텍 확장 가이드
[24]
1969
23
548
일반
NurtureAI <- 여기 모델 사용하지 마시길
[7]
1334
11
547
일반
vLLM 소형 모델 인퍼런스 느낀점 및 팁
[18]
1164
20
546
일반
라마3 시대를 맞이하여 새로 정보 공지글 정리하려고 합니다.
[25]
1540
29
545
정보
애플의 완전 오픈소스 모델: OpenELM
[13]
1414
14
544
일반
젠장 또 라마3야
[11]
1433
16
543
스터디
감쇠병합 - 모델의 레이어를 자기복제해서 추론능력을 향상시키는 방법 (feat. 3blue1brown)
[5]
988
19
542
일반
허깅페이스 15T 데이터셋 공개ㄷㄷ
[20]
1374
12
사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.