https://github.com/PlayVoice/Grad-SVC


이상한 놈들이 계속 나와


Diffusion 기반 SVC

제작진도 동일하고 전처리방식이 so vits svc 5.0에서 따온 탓에 일부 코드도 so vits svc 5.0랑 비슷한 편



깃헙에 올라와있는 데모 노래


제작진피셜 Grad-SVC의 장점


  • Grad-TTS의 아름다운 코드

읽기 쉬운 코드

  • 스피커 인코더 기반 다중 화자
  • GRL 기반 스피커 누수 없음
  • 전자 사운드 없음
  • 학습에 필요한 낮은 GPU 메모리

배치 크기: 8, 빠른 에포크의 경우 3.1GB GPU 메모리 사용, 마지막 에포크의 경우 5.8G 사용



기술 모티브가 된 Grad-TTS의 원리 설명


Grad-SVC의 원리 설명


https://github.com/PlayVoice/so-vits-svc-5.0

동일 제작진 So-vits-svc 5.0과의 비교




https://github.com/PlayVoice/X-SING

Grad-SVC는 해당 짤의 S2 부분을 적용한 리포지토리라고 함. 근데 저 부분이 무슨 역할 하는지는 모르겠음 ㅈㅅㅋㅋ!


암튼 누가 해보고 설명좀감사합이다


+제작진피셜 so-vits-svc와의 차이점은 기계음이 적은 대신 소음에 민감하다고 함