https://api.together.xyz/playground/chat/meta-llama/Llama-3-70b-chat-hf

together.ai 라는 곳인데, 투자를 많이 받아서 그런가 GPU도 빵빵하고, 자체 inference 알고리즘이 있어서 추론 속도가 엄청 빠릅니다.

8B, 70B instrcut 둘다 가능하구요, 질문 뒤에 '한국어로 답해줘' 추가하면 한국어로 답해줍니다.

llama-3외에도 모델이 많으니까 찍먹이 쉬워요.