제가 최신 트렌드를 잘 몰라서 그런데 4bit 로 양자화된 llama-70B 모델 집에서 서버 구축하고 API 개발해서 개인용으로 사용할려고 합니다. 4090 한장으로는 불가능하겠죠?