이것만으로도 일하면서 쓰기 말도 안되게 좋은 수준인데?


애초에 4o 속도가 빠르다 보니깐 그냥 나중에 0초 기다릴 거 지금 1~2초 기다리는 수준임.


어떻게 보면 말 중간에 끊기, 목소리 톤 바꾸기, 목소리 톤 인식하기 같은 기능들은 편의성 측면의 개선 사항이라고 볼 수 있고, 지금만으로도 음성 인식 개잘됨 + 찐빠 나도 알잘딱함 + 답변 개빨리 옴 콤보로 사용하기에 전혀 부족함이 없음.


4o 멀티모달 음성 인식은 API로 안 푼다 쳐도 지금 있는 음성 대화는 API로 어떻게 쓸 방법 없나