Grad-SVC 맥 애플 실리콘 버전 (M1 MAX에서 테스트함) 사용법 - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5577명 알림수신 129명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

📄정보 Grad-SVC 맥 애플 실리콘 버전 (M1 MAX에서 테스트함) 사용법

북한산할머니

추천 3 비추천 0 댓글 2 조회수 566 작성일 2023-10-14 00:55:55 수정일 2023-10-14 01:05:00

https://arca.live/b/aispeech/88722112

파이썬 3.8.10 universal 버전 설치

https://www.python.org/ftp/python/3.8.10/python-3.8.10-macos11.pkg

우선 사전에 데이터셋을 5초 단위로 잘라야함.

1. 터미널 실행

2. cd Music

3. git clone https://github.com/flutydeer/audio-slicer

4. cd audio-slicer

5. python3 -m venv ./audio-slicer

6. source ./audio-slicer/bin/activate

7. python slicer-gui.py

8. GUI 창이 뜨면 Threshold는 -35, Maximum Length는 5000, Maximum Interval은 10, Hop Size는 10, Maximum Sillence Length는 10으로 설정, 출력 폴더 지정 후 Start.

9. 출력 후 5초 단위로 잘려진 파일들은 data_gvc 폴더를 만들고 그 속에 가수의 이름으로 된 파일을 또 만들어 그 안에 넣는다.

10. 데이터셋 준비 끝

지금부터가 Grad-SVC 설정이다.

1. Grad-SVC 설치 https://drive.google.com/file/d/1OjHm1j-IyEa2hihUaiLbWRtNlcP-2VwD/view?usp=sharing

2. Music 폴더에 압축 해제

3. 터미널 실행 후 cd Music/Grad-SVC 입력

4. python3 -m venv ./Grad-SVC

5. source ./Grad-SVC/bin/activate

6. Pytorch 설치 pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu 입력

7. export PYTORCH_ENABLE_MPS_FALLBACK=1

8. pip install -r requirements.txt

9. python gvc_preprocessing.py -t 0

지금부터가 학습과정이다.

1. ./configs 폴더의 base.yaml을 Visual Studio Code로 열기

2. Full Epochs와 Fast Epochs를 원하는 수로 설정(본인은 1000으로 설정)

3. batch_size를 gpu의 vram 크기에 맞게 설정

4. save_steps는 설정된 수의 Epoch마다 저장함 (본인은 50으로 설정)

5. 저장

6. 터미널에 python gvc_trainer.py 입력

7. 학습

8. 학습 완료 후 python gvc_export.py --checkpoint_path logs/grad_svc/grad_svc_***.pth 입력 (***은 저장된 .pth 파일 중 가장 높은 수로 입력)

9. gvc.pth 생성 (원하는 가수 이름으로 바꾸기 예: 김동률.pth)

10. Grad-SVC에 원하는 목소리 음원 넣고 python gvc_inference.py --model (자신의 가수 이름).pth --spk ./data_gvc/singer/your_singer.spk.npy --wave (음원 이름).wav --rature 1.015 --shift 0 (피치 조정) 명령어 입력

11. gvc_out.wav가 생성되는데 그게 AI음성 음원이다.

댓글 [2]

2023-10-16 08:51:38

맥 있는 사람들은 이 글 보면 될듯

펼쳐보기▼

북한산할머니

2023-10-17 11:05:49

현재 업데이트해서 hubert 모델도 한국어로 패치 중입니다. 근데 Grad-SVC 단점이 데이터셋 파일이 10000개 이상 필요하다는 거..

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30176363

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25523

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 15833

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 44847

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

ㅇㅇ 2023.03.06 9280

공지 음성 채널 신문고

ㅇㅇ 2023.03.06 2517

공지 채널 홍보용 광고 패널

패챤 2023.04.01 1837

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4373

숨겨진 공지 펼치기(3개)

242 📄정보 RVC 로컬 입문 강좌 -> 영상과 함께 설치 및 사용법(영어) [3]

선무공신 2023.11.06 1268 3

241 📄정보 추론) 유튜브에서 추출 과 음원 구매 차이 [2]

차차아여댙 2023.11.06 911 3

240 📄정보 코랩 텐서보드 보는법 [1]

aat 2023.11.03 478 0

239 📄정보 보이스체인저 투컴으로 하는법 (모바일이라 간단하게) [10]

톤배 2023.11.01 1062 1

238 📄정보 개인적인 적정 에포크 계산식 [24]

이왜진 2023.10.31 830 0

237 📄정보 voice changer demo 실시간 변조 간단 FAQ [26]

톤배 2023.10.30 2543 5

236 📄정보 교양 - H100 글카가 하나에 6천만원이나 하는 이유가 뭘까? [1]

jwheo 2023.10.25 571 1

235 📄정보 RVMPE 추론 에서는 고음 깨질 일 아예 없다고 생각하시면 될듯? [2]

lostbox 2023.10.22 630 4

234 📄정보 Vits cjke클리너 온점 차이점 비교

lostbox 2023.10.21 199 0

233 📄정보 모델 지속적으로 업데이트 되는 사이트 [6]

싸악ㄷ딱딱어 2023.10.16 988 1

232 📄정보 Grad-SVC 맥 애플 실리콘 버전 (M1 MAX에서 테스트함) 사용법 [2]

북한산할머니 2023.10.14 567 3

231 📄정보 RVC 코랩 추론만 되는거 만들어봄 [85]

ㅇㅇ 2023.10.11 4253 7

230 📄정보 40k 48k mangio-crepe rvmpe 뭘쓰는지 말해보자 [3]

aat 2023.10.10 906 0

229 📄정보 audiosr 별로다

aat 2023.10.10 233 0

228 📄정보 님들 토치 2.1.0+cu121 업그레이드 하삼(속도 빨라짐)

jwheo 2023.10.09 515 4

227 📄정보 RVC 모델 병합 기능이 진짜 효자입니다.. [3]

lostbox 2023.10.08 1659 6

226 📄정보 ai hub 서버 요약 [1]

aat 2023.10.07 1151 0

225 📄정보 추론은 지난 7년동안의 cpu로도 할수있다고한다 [2]

aat 2023.10.07 519 0

224 📄정보 속보) RVC 아직도 V3 업뎃 안 함 [9]

PPAP 2023.10.06 1677 3

223 📄정보 ai hub 새 디스코드 주소 [7]

Still_Kids 2023.10.06 3324 13

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.