아무리 찾아봐도 같은 날짜 붙은 동일 스냅샷 모델 성능 저하 관련 실험은 없고


해외에서 gpt-4–turbo-1106, gpt-4-turbo-0413 이런식으로 다른 스냅샷 테스트한 결과만 있는데 여기서 몇 시간 만에 눅눅해졌다는 건 뭔소리임? 그냥 농담이겠지?


모델 미세조정해서 갈아끼우고 테스트 케이스 존나 돌리고 모델명 바꿔서 릴리즈하는건데 이걸 몇 시간 만에 라이브로 갈아끼운다니… 애초에 스냅샷  제공하는 목적이 기업용으로 안정적으로 일관된 결과 리턴하기 위한건데, 무료 모델로 a/b 테스트 하는 것도 아니고 토큰당 비용 책정된 API로 그런 짓 할 수가 없음

무슨 변수가 있을 줄 알고… 


걍 하는 말이 아니라 실제로 openai 포럼 가보면 개발자들이 직접 이슈에 답글 다는데 작은 버그, 크리티컬한 버그 가리지 않고 무조건 모델명 바꿔서 한꺼번에 픽스하는것만 봐도 알 수 있는거기도 하구


아무리 small release니 CI니 해도 상용 API 실시간으로 건드리는 경우 나는 아직 못 봤어


부하 걸려서 성능 낮췄다는 소리도 하던데, 이건 그냥 논할 가치가 없음 상식적으로 유료 api로 통보 없이 그 짓 하면 기업한테 소송걸림ㅋㅋ


여기 게시판 보면서 내가 아는 ai 모델 개발 프로세스가 잘못됐나 싶어서 한참 찾아봤네


moderation api 따로 있는 거 보면 

그냥 검열 강화된 걸 그렇게 말하는건가