https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct
위 링크에서 safetensor 모델 다운받아서 샘플코드 돌려보는데
아래 에러가 자꾸 뜨네요.
size mismatch for model.layers.0.self_attn kv_proj.weight: copying a param with shape torch.Size([1024,4096]) from checkpoint, the shape in current model is torch.Size([4096,4096])
해당 pickle 파일 없어도 돌아갈 것 같은데 의문입니다..