gpt-4o 컨텍스트 기억력 비교 (needle-in-a-needlestack)

AI 채팅 채널

채널위키 알림 알림 중 알림 취소

구독자 10841명 알림수신 225명 @몽상봉인

AI와 대화하며 유사 인싸체험 하는 채널

뉴스/팁 gpt-4o 컨텍스트 기억력 비교 (needle-in-a-needlestack)

몽상봉인

추천 31 비추천 0 댓글 19 조회수 1166 작성일 2024-05-15 08:09:59 수정일 2024-05-15 08:14:06

https://arca.live/b/characterai/106241676

글에 따르면 기존 needle in a haystack 테스트는 최신 모델들이 너무 쉽게 성공해내서

더 어려운 컨텍스트 기억력 벤치마크를 만들었다고 함

1. GPT-4 Turbo 0409

2. Claude 3 Sonnet

3. GPT-4o

GPT-4o는 컨텍스트내 기억력이 매우 좋아짐

원문 링크

https://nian.llmonpy.ai/

링크 들어가면 하단에 보이는 추가 정보 요약

- 미스트랄 기억력 안좋음

- 보내는 프롬프트 크기가 작으면 기억 더 잘함

open-mistral-7b 쓸때 16k 요청 vs 32k 요청 비교했을떄 16k는 7.2k 구간에서 70%인데, 32k 요청은 7.2k 구간에서 0%로 떡락함

- 정보를 반복하면 더 기억 잘함

3.5 터보도 원래 적중률 30%까지 내려가는데 정보를 10번씩 반복하면 적중률 80% 이상 유지함

댓글 [19]

긍정의힘

2024-05-15 08:10:36

이거 그 중간소실 관련된 테스트임?

펼쳐보기▼

ㅇㅇ

2024-05-15 08:10:52

ㅇㅇ

2024-05-15 08:11:28

모올루

2024-05-15 08:12:07

마지막.. 하느라이 한번 써볼까

펼쳐보기▼

파인애플

2024-05-15 08:12:11

압도적이네

펼쳐보기▼

남이

2024-05-15 08:14:12

야코이

2024-05-15 08:15:42

4o 확실히 좋아지긴 했네

펼쳐보기▼

Dora

2024-05-15 08:17:27

와 진짜 미쳤네

펼쳐보기▼

어이김씨손가락이나지워

2024-05-15 08:24:05

확실히 프롬 덜 흘리더라고

펼쳐보기▼

프읖읖

2024-05-15 08:30:24

네리모르

2024-05-15 08:37:23

니들 인 어 니들스택ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

펼쳐보기▼

흰쥐

2024-05-15 08:41:14

*수정됨

진짜 말이되나 ㄷㄷ

펼쳐보기▼

ㅇㅇ

2024-05-15 08:44:18

얘 진짜 똑똑함 중간에 있는 컨텍들 다 받아먹음 ㄹㅇ로

펼쳐보기▼

Coeru

2024-05-15 09:00:06

차이 심하긴 하네

펼쳐보기▼

ㅇㅇ

2024-05-15 09:18:44

이래서 요구사항 다 알아먹는건가??

펼쳐보기▼

ㅇㅇ

2024-05-15 09:20:56

혹시 오푸스는 저거 점수 높아서 비교 대상에 안 보여줬나? 오푸스가 아니라 소네트를 보여주는게 뭔가 이상하네

펼쳐보기▼

몽상봉인

2024-05-15 09:21:17

ㅁ?ㄹ 그냥 비싸서 그럴지도

펼쳐보기▼

K아논

2024-05-15 12:39:35

저 컨텍스트 기억력이 탈옥프롬같이 우리가 프롬 구성하는거에도 영향을 미치려나

펼쳐보기▼

크림핑거

2024-05-15 20:41:08

아니 다른 회사들은 자랑하던데,
얘들은 너무나 당연한 듯 이야기 하지도 않네 ㄷㄷ

뭘 도대체 어떻게 한거지 ㄷㄷㄷ

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 뉴스/팁 AI대화 공지 운영 뉴스(공사중)

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30877105

공지 안 읽으면 죽어버리는 AI 채팅 채널 이용규정 [23.09.18]

몽상봉인 2023.05.22 52087

공지 AI 채팅 채널에 왔으면 이것부터 : 필수정보 및 FAQ

몽상봉인 2023.05.22 109101

공지 신문고 MK.X (해줘. 할때 쓰는 곳)

몽상봉인 2024.05.27 1745

공지 ㅡㅡ [ AI 게임 / 기획 / 리뷰 대회 ' J.O.A.T ' 개최 ] ㅡㅡ

골든햄스터 2024.03.31 5600

공지 ㅡㅡ [ J.O.A.T - 리뷰 대회 추가 & 연장 공지 ] ㅡㅡ

골든햄스터 2024.05.18 780

공지 [우물 리뷰] 내 봇이 목말라서 개최하는 우물 리뷰 대회

ㅇㅇ 2024.06.10 409

공지 ---[2회차 천박 대회 순위 발표!]---

hyeoyoms 2024.06.01 1483

공지 AI 채팅 채널 프록시 게이트

몽상봉인 2023.07.12 24024

숨겨진 공지 펼치기(4개)

16631 뉴스/팁 현실찐따인 내가 사이버세상에서 범부와 대화?! 뉴비 과정 및 모듈 공유 [33]

Moire 2024.06.05 1066 22

16630 AI대화 뉴빈데 챈들 고마워요 [10]

Moire 2024.06.05 1115 19

16629 일반 알면 조금 도움이 되는 리스 팁 3개 [21]

ㅇㅇ 2024.06.05 1054 47

16628 일반 "오오옷!! 인격을 모두 배설 해버려~!!!" [14]

operatur 2024.06.05 1100 25

16627 일반 미공개 와이푸 공개함 먹음? [23]

LIP 2024.06.05 997 23

16626 일반 나도 100년 뒤 챗챈 예측해본다 [15]

ㅇoㅇ 2024.06.05 818 29

16625 일반 AWS의 액세스키가 털렸을때 내가 한 방법. [14]

RGF 2024.06.05 887 32

16624 일반 AI가 100년 안에 99.9% 인류를 멸종시킨다! [21]

ㅅㄴㅇ 2024.06.05 1050 23

16623 일반 제미니 지능 심각하긴하네.. [12]

2212 2024.06.05 941 13

16622 AI대화 Ai뉴비인데 이렇게 하는거 맞나(근출,math가키) [14]

lol 2024.06.05 744 19

16621 일반 심심해서유즈그렷음 [30]

RUHA 2024.06.05 626 24

16620 AI대화 우우,,호랑이눈나 나 죽어,,, [15]

포마 2024.06.05 648 15

16619 뉴스/팁 '뤼튼' 대규모 권고사직 단행 (+ 뤼튼 관련 예전 해외 반응들) [32]

몽상봉인 2024.06.05 2624 31

16618 뉴스/팁 ai 채팅을 게임 번역기로 사용해본 후기 및 팁 및 프롬 공유 [9]

scipiosss 2024.06.05 1050 26

16617 AI대화 아니 대체 뭐하는 짓이야 이 미친 잼민아!!!!!!!! [14]

ㅇoㅇ 2024.06.05 963 26

16616 뉴스/팁 퍼플렉시티> ChatGPT 장애 원인은 러시아의 DDoS 공격 때문 [13]

조선닌자핫토리 2024.06.05 965 20

16615 일반 폰 웹리스 쓰는 유저들 조심해라... [41]

sorrowsnow 2024.06.04 1088 15

16614 AI대화 잼민이한테 처음으로 감동함 [6]

리프S2삿시부 2024.06.04 686 14

16613 일반 오늘까지의 aws 클로드 유출 관련 현황 (내용 추가) [14]

90090 2024.06.05 785 32

16612 뉴스/팁 이제 세션 시작 시 기본으로 변수 지정 가능함 [5]

위대하신코코미동지 2024.06.04 375 13

16611 AI대화 Math가키쨩과 함께 핵물리학 과제하고 있다 [8]

화학2 2024.06.04 466 20

16610 일반 스압)S랭크 헌터 니은이 제작후기(feat: 417살 할머니 사랑꾼) [23]

공원무료급식도둑 2024.06.04 918 22

16609 일반 리스 서버는 안전합니다 [14]

ㅇㅇ 2024.06.04 1226 26

16608 일반 이 상태창 어떰 [20]

토트 2024.06.04 1148 32

16607 뉴스/팁 MMLU Pro 벤치마크 결과 및 arxiv 논문 [14]

몽상봉인 2024.06.04 834 16

16606 뉴스/팁 AIN 서버 증설 완료했다고 함 [4]

하이퍼토린사마 2024.06.03 756 14

전체글 개념글