눅눅해지는거 오피셜로 확인된 적 있음?

AI 채팅 채널

채널위키 알림 알림 중 알림 취소

구독자 10538명 알림수신 229명 @몽상봉인

AI와 대화하며 유사 인싸체험 하는 채널

일반 눅눅해지는거 오피셜로 확인된 적 있음?

테아닌

추천 4 비추천 8 댓글 33 조회수 437 작성일 2024-05-14 07:49:06 수정일 2024-05-14 08:02:18

https://arca.live/b/characterai/106157652

아무리 찾아봐도 같은 날짜 붙은 동일 스냅샷 모델 성능 저하 관련 실험은 없고

해외에서 gpt-4–turbo-1106, gpt-4-turbo-0413 이런식으로 다른 스냅샷 테스트한 결과만 있는데 여기서 몇 시간 만에 눅눅해졌다는 건 뭔소리임? 그냥 농담이겠지?

모델 미세조정해서 갈아끼우고 테스트 케이스 존나 돌리고 모델명 바꿔서 릴리즈하는건데 이걸 몇 시간 만에 라이브로 갈아끼운다니… 애초에 스냅샷 제공하는 목적이 기업용으로 안정적으로 일관된 결과 리턴하기 위한건데, 무료 모델로 a/b 테스트 하는 것도 아니고 토큰당 비용 책정된 API로 그런 짓 할 수가 없음

무슨 변수가 있을 줄 알고…

걍 하는 말이 아니라 실제로 openai 포럼 가보면 개발자들이 직접 이슈에 답글 다는데 작은 버그, 크리티컬한 버그 가리지 않고 무조건 모델명 바꿔서 한꺼번에 픽스하는것만 봐도 알 수 있는거기도 하구

아무리 small release니 CI니 해도 상용 API 실시간으로 건드리는 경우 나는 아직 못 봤어

부하 걸려서 성능 낮췄다는 소리도 하던데, 이건 그냥 논할 가치가 없음 상식적으로 유료 api로 통보 없이 그 짓 하면 기업한테 소송걸림ㅋㅋ

여기 게시판 보면서 내가 아는 ai 모델 개발 프로세스가 잘못됐나 싶어서 한참 찾아봤네

moderation api 따로 있는 거 보면

그냥 검열 강화된 걸 그렇게 말하는건가

댓글 [33]

suzu

2024-05-14 08:00:18

궁금하긴해

펼쳐보기▼

테아닌

2024-05-14 08:01:30

상식적으로 말이 안 되는 소리라 그냥 농담들하는줄알았음ㅋㅋ 근데 보니까 진지하게 말하길래 내가 모르는 레퍼런스가 있나 궁금해서 글써봄

펼쳐보기▼

PRG

2024-05-14 08:14:24

다른 ai지만 스테이블 디퓨전 컴에서 돌릴때 동시에 겜같은거 하면 엄청 오래걸리면서 이미지에 노이즈 끼곤 했읒

펼쳐보기▼

PRG

2024-05-14 08:15:07

비슷하게 텍스트도 부하 심하면 문제가 생길지도?

펼쳐보기▼

ㅇㅇ

2024-05-14 08:17:25

패러미터까지 건드리는지는 알수 없지만 응답시간 길어지면서 외계어 뱉거나 프롬 그대로 뱉거나 하는 사례는 챈 뒤져보면 많음 실제로 눅눅 확인하는 사이트까지 있고

펼쳐보기▼

ㅇㅇ

2024-05-14 10:45:25

대충 대부분 유저가 공통되게 퀄리티 저하를 경험하는 현상이 종종 나타나고 그때마다 GPT 응답 속도가 느려지는게 아니라 오히려 빨라진다는 점 때문에 양자화 모델을 라이브로 변경하는것과 관련있다고 추정하긴 하는데 OpenAI가 오피셜로 지들이 그러고 있다고 답하진 않았지. 근데 그건 서비스 좀 하고 나서 시간 좀 흐른 뒤에나 나타나는거고, 지금까지 모델 공개 사례를 보면 첫 날 급격한 성능 저하는 대개 검열 강화가 맞긴 할 듯

펼쳐보기▼

ㅇㅇ

2024-05-14 10:50:51

대개 챗챈의 유저들이 눅눅함을 판단하는 방식은 https://openai-status.llm-utils.org/ 사이트에서 gpt의 시간당 토큰 생성 수가 느리냐 빠르냐를 기준으로 하고 있음. 빠르면 눅눅한거, 느리면 바삭한거. 로컬 모델 직접 양자화 컨트롤하면서 돌려보거나 오픈라우터 같은 곳에서 동일 모델을 다른 프로바이더들에 대해 비교해보면서 돌려봤으면 알겠지만 양자화에 따라 속도/퀄리티 컨트롤이 가능하다보니 그것과 관련있지 않을까 추정하는 정도고. 물론 단순히 양자화 모델을 교체하는게 아니라 좀 더 세련된 방식을 사용할 가능성도 있겠지

openai-status.llm-utils.org

Unofficial OpenAI Status

View OpenAI’s current status and historical performance.

대개 챗챈의 유저들이 눅눅함을 판단하는 방식은 https://openai-status.llm-utils.org/ 사이트에서 gpt의 시간당 토큰 생성 수가 느리냐 빠르냐를 기준으로 하고 있음. 빠르면 눅눅한거, 느리면 바삭한거. 로컬 모델 직접 양자화 컨트롤하면서 돌려보거나 오픈라우터 같은 곳에서 동일 모델을 다른 프로바이더들에 대해 비교해보면서 돌려봤으면 알겠지만 양자화에 따라 속도/퀄리티 컨트롤이 가능하다보니 그것과 관련있지 않을까 추정하는 정도고. 물론 단순히 양자화 모델을 교체하는게 아니라 좀 더 세련된 방식을 사용할 가능성도 있겠지

펼쳐보기▼

테아닌

2024-05-14 14:24:31

아, 뭐야 난 또 좀 제대로 된 통계라도 있는 줄 알았네 ㅋㅋㅋ 토큰 생성 수 기준이랑 뇌피셜로 판단하는거였음?ㅋㅋ 걍 재미로 하는 말이었구나

어디 동네 구멍가게도 아니고 거대규모 상용 API에서 load balancing을 그따위로 한다? 
신뢰성, 일관성, 사용자 경험 변동 최소화 원칙 다 갖다 버리는 건 그렇다 쳐도
여러 모델 중구난방으로 사용해서 생기는 각양각색 다른 이슈들 처리까지... maintenance 측면만 봐도 그야말로 난장판 될 게 뻔한데 ㅋㅋ

걍 수준 낮은 음모론 그 이상도 이하도 아님 현재로서는
왜 관련 레퍼런스 하나도 없는지 알 만 하네

펼쳐보기▼

ㅇㅇ

2024-05-14 14:42:52

일관성, 사용자 경험 변동 최소화 같은 이상적인 얘기하는거 보니 gpt 그리 많이 안 써봤다는건 알겠네

펼쳐보기▼

ㅇㅇ

2024-05-14 14:44:36

아니 당장 오픈라우터 위자드만 써봐도 이게 실제로 적용 가능하다는거 알텐데 왜 이론적인 얘기만 하는지 모르겠네. 서빙 영역을 아예 모르나?

펼쳐보기▼

ㅇㅇ

2024-05-14 14:47:06

아니 그냥 대충 배우고 찍먹만 하는 타입인가보구나. 그러면 이해 못 할수도 있지

펼쳐보기▼

ㅇㅇ

2024-05-14 14:47:33

더닝 크루거 효과라는건 딱 너를 위한 표현 같다

펼쳐보기▼

ㅇㅇ

2024-05-14 14:49:32

내가 아는 ai 모델 개발 프로세스 ㅋㅋㅋㅋ 좀 웃겼다

펼쳐보기▼

ㅇㅇ

2024-05-14 15:01:25

도대체 뭐 때문에 불가능하다고 생각하는건지 좀 제대로 된 근거나 얘기했으면 좋겠네

펼쳐보기▼

ㅇㅇ

2024-05-14 15:06:59

아니 혹시 LLM 다뤄본적 없는거 아니냐? 뭔가 글하고 댓글 쭉 읽어보니 그런 느낌이 나는데. 전부 하는 얘기가 LLM 외적인 일반적인 AI 모델에서나 나올법한 얘기들인데

펼쳐보기▼

ㅇㅇ

2024-05-14 15:19:15

아니 글 읽다보니 또 웃기네. 모델 바꿔끼기로 품질저하되는 얘기하고 있는데 그건 좆병신같은 소리라고 얘기하면서, 검열강화로 지능 떨어져서 품질저하 일어나는건 또 문제 없다는 식으로 얘기하는거냐? 일단 검열 강화와 지능 저하 얘기는 챈에도 올라온 적 있으니 링크는 달아둠. https://arca.live/b/characterai/105828934

펼쳐보기▼

ㅇㅇ

2024-05-14 15:20:48

뭔가 하는 얘기 하나하나가 문외한이라는 느낌밖에 안 들어

펼쳐보기▼

ㅇㅇ

2024-05-14 15:44:12

내 얘기는 이거임. 저성능 고속 모델을 고려한 로드 밸런싱은 가능하며 실제로 적용하는 기업이 이미 있고, openAI가 소송을 걱정할만한 새끼들이라기에는 데이터 이슈 때문에라도 이미 소송 존나 당하는 상황이고, GPT의 일관적이지 못한 성능에 대한 얘기는 챗챈에서만 나오는 얘기가 아니라 해외에서도 예전부터 종종 이슈가 되고 있음. 참고로 눅눅함이라는 현상이 본격적으로 언급되기 시작한건 23년 12월 ~ 24년 1월부터고, 그 전에는 모델을 출시하기 전에 잠깐 정도 성능이 저하된다는 식으로 언급됐었음

저 unofficial 사이트 가지고 보는건 나도 처음 봤을때 좀 웃기긴 했고 30분 단위로 속도 체크하는거로 뭘 얘기하는게 말이 되나 싶긴 한데, 모델 소스도 파라미터도 공개 안 하고 유저가 접근 가능한건 API랑 chatGPT 서비스 뿐인데 만약 openAI가 대놓고 사기를 치는 상황이라고 했을때 인정될수 있는 오피셜한 증거라는게 어떤 형태일지를 좀 설명해봤으면 좋겠음

펼쳐보기▼

ㅇㅇ

2024-05-14 16:04:08

씨발 gpt 결과물이 존나 일관되게 나왔으면 아무도 눅눅함 그딴 소리 안해 좆같은 새끼야

펼쳐보기▼

ㅇㅇ

2024-05-14 16:06:47

일관성 표현 씨발 곱씹어볼수록 개좆같네. 답변 리롤을 왜 하는지는 아냐?

펼쳐보기▼

ㅇㅇ

2024-05-14 16:08:43

아니 씨발 양자화나 그런 얘기 다 좆까고 동일한 LLM을 써도 항상 일관된 퀄리티를 보장할수 없는데 뭔 씨발 좆소형 AI 모델에서나 쳐써먹을 일관성 얘기를 하고 있어??

펼쳐보기▼

ㅇㅇ

2024-05-14 16:11:07

이슈 변수 난장판 씨발 표현 쓰는거만 봐도 얼마나 가볍게 생각하는지를 알겠다

펼쳐보기▼

ㅇㅇ

2024-05-14 16:19:33

내가 왜 계속 양자화 얘기 하고 있는지는 아냐? LLM 써본 새끼들 입장에서 퀄리티랑 속도 얘기하면 가장 먼저 튀어나올만한 기본적인 얘기인데 니 글에는 그 표현이 단 한번도 안 튀어나오고 있어. 그리고 이제 와서 로드 밸런싱이 힘들다는 개좆같은 댓글이나 달고 있고. 니 생각엔 존나 초거대규모로 해먹는 상황에서 로드 밸런싱 문제 대응하는게 그냥 성능저하 없는 모델 그대로 서빙하는거보다 힘들거 같냐?

펼쳐보기▼

ㅇㅇ

2024-05-14 18:26:40

씨발 생각할수록 화가 뻗쳐서 잠도 안 오네. 딱 봐도 LLM 본격적으로 건드려본적 없고 찍먹만 해본 새끼가 4o 나왔다는 소식 듣고 기웃거리다가 개소리나 찍 싸고 있는게. gpt 클로드 api에 수십만원 수백만원 태워본 새끼들이 체감하는게 눅눅함인데 그걸 못 믿겠다고 하면 니가 눅눅함이 없다는 증거를 가져와야 하는거 아니냐? 24시간동안 터보로 쭉 벤치마크 돌리면서 시간당 토큰수와 벤치마크 점수 관련성이 없다는거 근거 뽑아서 가져와라 좆같은 새끼야

펼쳐보기▼

ㅇㅇ

2024-05-15 00:13:08

서빙 영역에서 뭔 짓거리를 해야 되든 GPT 자체 돌리는거에 비해 좆도 아닌 노력과 연산량으로 커버 가능한데 그게 뭐가 대수라고 지랄인지 모르겠네. 난장판 해결하고 변수 확인하고 이슈 다 처리하는게 존나 아무 문제 없이 충분히 가능함

펼쳐보기▼

ㅇㅇ

2024-05-15 04:34:31

뭔가 얘기를 정리하다보니 대강 감이 잡히네. 너는 아마도 생성보다는 인식 도메인의 AI모델을 다루는 대학원 석사 학생이거나 AI 관련 분야의 회사의 신입 사원, 또는 그냥 취미로 AI를 공부한 사람이라고 판단된다. 니가 한 말을 인식 모델을 기준으로 생각한 것이라면 말이 되는게 서로 다른 버전의 인식 모델을 아무렇게나 갈아끼우고 모델을 라이브로 변경하면서 서비스를 하면 존나 말도 안 되는 일이 벌어질 것이 확실하기 때문이다. 인식 모델은 일관성이 존나게 존나 중요하며 차라리 잘못 인식하는건 일관되게 잘못 인식하는게 모델 활용 관점에서 나을수도 있다.

그럼에도 불구하고 그 인식 모델의 논리는 생성 모델에는 적용되지 않는게, 트랜스포머 기반 토큰 예측 모델, diffusion 등을 고려한 노이즈 예측 모델은 기본적으로 랜덤성을 고려해서 사용하는 것이 일반적이기 때문이다. 물론 LLM은 온도나 페널티를 조절하는 방식으로 랜덤성을 줄일 수 있고, diffusion도 noise 자체를 inversion하는 등으로 랜덤성을 컨트롤할 수 있지만 보편적인 사용 방식이라고 하기는 힘들다. 생성 모델을 서비스에 도입하는 경우 그 랜덤성을 고려해야 하는 것이 필수적이다. 반대로, 랜덤성이 고려되고 있기 때문에 모델을 제공하는 기업이 모델을 라이브로 변경하는 경우가 있다고 하더라도 그 모델을 사용하는 입장에서 성능 변경에 대응할 수 있다. 일반적인 자동화 관점에서 활용한다면 시간에 따라 오류율이 요동치는 정도로만 보이겠지. 

생성 모델에 랜덤성이 있으면 그로 인한 샘플링 착시로 집단 환각이 일어나서 눅눅함 현상이 존재하는거라 착각하는거 아니냐는 의견이 나올수 있지만, 눅눅함은 노이즈보다는 바이어스에 가까운 현상이다. 상당수의 유저가 일관되게 낮은 성능을 언급하고, 리롤을 아무리 굴려도 낮은 퀄리티의 답변이 나오며, 심지어 눅눅하다고 부르는 상황에서 고정적으로 나타나는 대표적인 현상들 또한 존재한다. 참고로 저 30분 단위로 속도 체크하는 사이트 기준으로 들쑥날쑥한 신호 노이즈에 가까운 속도 변화가 있는걸 기준으로 판단하기보단 몇시간 이상 단위로 낮은 속도 또는 높은 속도가 반복되는 경우가 확실하게 바삭한 경우와 눅눅한 경우를 가리킨다. 이전 문단에서 말한것과 유사하게 이 현상은 자동화 관점에서는 오류율 변화로만 보여서 알아차리기 어렵고, 그냥 하루종일 주구장창 채팅을 붙잡고 있는 사람들이나 알아차릴수 있다. 그건 모든 데이터를 전부 직접 눈으로 보고 라벨링하는거나 다름없기 때문이다.

그리고 최근 로컬 모델의 발달과 함께 오픈라우터 사용이 유행하면서 심증만 있던 모델 라이브 변경과 유사한 현상을 직접적으로 체험할 수 있게 됐다. 오픈라우터는 모델 프로바이더를 자동으로 변경하는걸 기본 설정으로 두는데, 프로바이더별로 모델 설정에 여러가지 차이가 있기 때문에 성능이 다르고 속도가 다르고 심지어 가격도 다른 모델을 오픈라우터의 편의대로 바꾸는 현상이 나타난다. 본인들이 직접 운영하지 않는 남의 모델을 마음대로 갈아끼우면서 api로 서비스하는게 가능하고 그런 기업이 이미 있다는 의미이다. 물론 openAI가 이 행위를 하고 있는지 확인하기 위해서는 위에 말한대로 장시간 동안 동일한 task를 수행하면서 답변을 기록하고 그 퀄리티 변화가 나타나는지 확인하는 방법이 있다. 모델 변경 패턴을 파악할 수 없기 때문에 24시간 지속 추적이 맞을지 수개월 규모로 일정 샘플링 시간대별로 확인하는 식으로 장기 추적하는게 나을지 등은 실험을 해봐야 확인이 가능할테고. 의혹을 검증하기 위해 그 과정에서 소모되는 비용을 감당할 집단이 있을지도 모르겠지만.

또한 너가 소속된 집단은 현재 트렌드에 약간 뒤쳐져 있을 가능성이 있는데, 인식쪽 최근 트렌드는 구형 인식 모델을 계속 재활용하기보다는 멀티모달 모델을 활용하는 쪽으로 선회하고 있기 때문이다. 이는 분야 특성으로 연산량이 제한돼서 그럴수도 있고, 아니면 그냥 진짜로 유행에 뒤쳐진 정도일수도 있다. 일반적으로 이런 모델은 LLM의 변형 또는 결합형 모델인 경우가 많기 때문에 LLM이 아닌 구형 인식 모델을 다루는 관점에서 GPT의 이상이라고 추정되는 현상을 평가할리가 없다.

요약하면, 인식 모델 관점에서 생성 모델의 서빙을 평가하다보니 말도 안 되고 이상하다고 생각하는거고, 생성 모델을 제대로 다뤄봤으면 확신하지는 않을지언정 그럴 가능성이 있다고 판단할 여지가 충분하다.

펼쳐보기▼

ㅇㅇ

2024-05-15 04:49:10

추가적으로 이 경우 openAI가 별도의 저사양 모델을 갖고 있다면 그냥 일관되게 저사양 모델만을 사용하면 되는거 아니냐는 의견이 나올수 있다고 생각한다. 이에 대한 추정으로는, 다양한 버전의 모델을 고려하여 고사양/저사양 모델에 대한 사용자 반응을 대규모로 확인하기 위한 것이라고 생각한다. OpenAI 약관에 따르면 chatGPT의 경우 직접적으로 대화 로그를 수집하고 있고, API는 로그를 수집하지 않더라도 사용량, 현재 토큰수 등의 메타 정보 관점에서 간접적인 weak label 정보를 수집하는게 가능하다. 라벨 데이터 수집 외의 관점에서 서빙에 도움이 된다는 점도 있고. 일반적인 규모의 회사라면 모델 성능 검증은 당연히 내외적으로 연구자와 현장요원이 소규모 테스트를 하는것으로 끝낼테지만, openAI는 개발도상국 주민들에게 라벨링 업무를 전담시켜서 일어나는 모델 답변 퀄리티 이상현상을 이미 알고 있기 때문에 별도의 수단을 취하고 있다고 생각해도 이상하지 않다.

펼쳐보기▼

ㅇㅇ

2024-05-15 06:25:36

아 그리고 생성 모델에 대한 AI 모델 개발 프로세스는 인식 모델과 완전히 다르니 니가 잘못 아는게 맞음

펼쳐보기▼

테아닌

2024-05-19 11:01:55

*수정됨

ㅋㅋ오지게 댓글달아놨네 보나마나 뻘소리일거같아서 귀찮아서 안읽음 수고ㅋㅋ 
조언 하나 하자면 제대로 공부 좀 하는거 추천함 대충 겉핥기로 아는 애들이 말은 많더라

펼쳐보기▼

ㅇㅇ

2024-05-19 12:49:16

*수정됨

사실 쓰면서 일부러 허점이나 반박할거리도 남겨두면서 AI 주제로 키배 좀 뜰까 했는데 마지막까지 실속이 없네... 박사 따기 전엔 그나마 애들이 뭐라도 주장 펼쳐서 싸우는 맛이 있었는데 연구소 오고 나서는 AI 주제로 싸우는 재미가 없어져서 이거로라도 싸워볼까 한건데. 뭐 그래 됐다. 키배 뜨고 싶어서 욕도 좀 하고 다른 주제를 메인으로 언급하긴 했지만 사실대로 말하면, 눅눅함의 레퍼런스가 없는건 이 현상이 주목받기 시작한게 반년도 안 됐고 제대로 검증하려면 수백만원은 우습게 태우고 잘못하면 수천만원을 부어야 할지도 모르는데 현상이 있는지 없는지도 불확실한 마당에 해봤자 그럴듯한 논문거리도 안 되고 그냥 x나 레딧 같은곳에서 글 찍 싸고 끝날만한거라 그럼. 누가 굳이 그런걸 검증해보겠냐? 그게 사실이고 소송 들어가도 시간 존나 걸릴테고, 어차피 계속 gpt 돈주고 쓸테고 좀 시간 지나면 저점조차 존나 높아질텐데

아 그리고 나도 조언이나 해보자면, 연구를 할때는 항상 자신이 알고있는게 맞는지 의심하고 그거 가지고 다른 사람이랑 논의 또는 논쟁을 하는게 중요하다. 그냥 공부하는걸로 끝나는게 아니라 실제로 굴려도 보고 논문 쓴 새끼들이 제대로 된 소리하는건지 의심도 해야 하고. 내가 그 과정에서 주로 쓰는 방식은 나 자신조차 내가 하는 주장이 실제로 맞는지 의심스러울지라도 그 주장을 존나 맞는것처럼 확실하게 주장하는거임. 그러면 좀 머리가 굴러간다 싶은 새끼들은 그거에 반박을 해주면서 점점 지식이 보완되거든. 눅눅함 주제에 대해서 그런건 없다고 존나 확신을 갖고 말하길래 키배 뜨면서 서로 지식을 확인하는 과정을 좀 기대했는데 실속 있는 내용이 없어서 좀 아쉬웠다

그리고 현시대의 주류가 된 생성 AI는 기존 내용 공부는 논할거리도 아니고 최신 논문 연구하는 수준을 넘어서 여기 말고도 다른 곳도 포함해서 실제 사용자 커뮤니티에서 언급되는 내용에 집중하는게 상당히 중요하다. 학술지는 커녕 학회 논문조차 좀 유행에 뒤쳐지고 그렇다고 아카이브에 논문 올라오는걸 전부 쳐먹는것도 불가능하다보니 그걸 걸러내는 측면에서. 심지어 논문 쓰는 새끼들 중에서도 사람들 전혀 안 쓰는 모델을 메인으로 연구한다든지 하는 식으로 시대에 뒤쳐진 애들이 좀 많더라

펼쳐보기▼

ㅇㅇ

2024-05-14 11:04:43

양자화 모델을 교체하는걸 기준으로 한다면 API 사용자에게 제공하는 모델을 라이브로 변경하는 방식이야 그냥 대충 생각해봐도 나올만한 방법으로는 서로 다른 노드에 서로 다른 모델 넣어두고 부하 수준에 따라 가벼운 모델로 좀 더 많이 보내버리는 방식으로 충분히 구현 가능하겠지. 물론 OpenAI 규모의 서비스라면 이것보다 훨씬 그럴듯한 방식을 쓰겠지만. OpenAI가 그런 짓을 하고 있느냐 아니냐에 관해서는 예를 들어 그런 짓을 하고 있다고 했을때 그걸 어떻게 입증할거냐가 문제일듯

펼쳐보기▼

ㅇㅇ

2024-05-14 11:07:53

상식적인 생각 얘기는 최소한 초중반 단계에서 데이터를 합법적으로 수집하지 않았을 새끼들에게 그런 상식이 있을지에 대해서는 좀 의문이 드네. openAI는 최소한 데이터 이슈로 이미 소송 존나 당하고 있는 상황이고

펼쳐보기▼

위대하신코코미동지

2024-05-14 19:00:02

*수정됨

근데 뭐 그냥 음모론이라고 하기엔 특정 기간이나 시간대마다 체감 성능 떨어지고 불안정하다는 얘기는 실제로 api 쓰는 사람들이나, 구독자들 사이에서도 계속 나온 얘기임. 해외 포럼에서도 계속 얘기 나왔고, 돈내고 쓰는 서비스인데 뭐 이러냐는 말 한동안 되게많이나왔었읆...

애초에 LLM 응답이란게 중국어방 문제같은거라서 아웃풋 퀄리티에 대해서는 명확히 증명할 길은 없긴한데, 내 돈내고 동일한 인풋 박았는데 응답수준이 갑자기 확 떨어지는거에 다들 민감하긴하지

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인