https://github.com/PlayVoice/Grad-SVC
이상한 놈들이 계속 나와
Diffusion 기반 SVC
제작진도 동일하고 전처리방식이 so vits svc 5.0에서 따온 탓에 일부 코드도 so vits svc 5.0랑 비슷한 편
깃헙에 올라와있는 데모 노래
제작진피셜 Grad-SVC의 장점
- Grad-TTS의 아름다운 코드
읽기 쉬운 코드
- 스피커 인코더 기반 다중 화자
- GRL 기반 스피커 누수 없음
- 전자 사운드 없음
- 학습에 필요한 낮은 GPU 메모리
배치 크기: 8, 빠른 에포크의 경우 3.1GB GPU 메모리 사용, 마지막 에포크의 경우 5.8G 사용
기술 모티브가 된 Grad-TTS의 원리 설명
Grad-SVC의 원리 설명
https://github.com/PlayVoice/so-vits-svc-5.0
동일 제작진 So-vits-svc 5.0과의 비교
https://github.com/PlayVoice/X-SING
Grad-SVC는 해당 짤의 S2 부분을 적용한 리포지토리라고 함. 근데 저 부분이 무슨 역할 하는지는 모르겠음 ㅈㅅㅋㅋ!
암튼 누가 해보고 설명좀감사합이다
+제작진피셜 so-vits-svc와의 차이점은 기계음이 적은 대신 소음에 민감하다고 함