cuda 구현 말고도


glsl로 된 셰이더 구현도 있는것 같은디


저런건 어따가 씀 성능도 잘 안나올것 같은데


https://github.com/pytorch/pytorch/tree/main/aten/src/ATen/native/vulkan/glsl


그래도 amd에서 생색내니까 만들어둔건가