https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct


위 링크에서 safetensor 모델 다운받아서 샘플코드 돌려보는데

아래 에러가 자꾸 뜨네요.


size mismatch for model.layers.0.self_attn kv_proj.weight: copying a param with shape torch.Size([1024,4096]) from checkpoint, the shape in current model is torch.Size([4096,4096]) 


해당 pickle 파일 없어도 돌아갈 것 같은데 의문입니다..