Bert-VITS2 한국어 학습 - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5573명 알림수신 129명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

📄정보 Bert-VITS2 한국어 학습

추천 1 비추천 0 댓글 2 조회수 813 작성일 2024-01-12 02:53:27

https://arca.live/b/aispeech/96426744

fishaudio github repo clone해서 한국어에 맞게 코드 수정후 학습 진행중.

Duration predictor를 adversarial training하는 과정에서 Discriminator와 Duration Predictor의 성능차이가 너무 심한 상태.

D(real) 은 1로 수렴하고 D(G()) 는 0으로 수렴함. (여기서 G는 Duration Predictor)

생각을 해보니 학습 시작부터 성능이 좋지 않은 Duration predictor의 출력과 mas의 출력을 discriminator에 입력으로 사용하니 당연한 결과라고 생각됨.

하지만 학습을 하기 위해서는 두 loss가 0.5로 수렴이 되어야 할 것 같은데 방법을 알려줄 사람이 있으면 좋겠음.

댓글 [2]

2024-01-12 05:09:53

bert-vits2 를 드뎌 한국어 하시는분 계시는 군요 ㅠㅠ
관련 질문에 저는 우주 영역이라 답변을 못하는게 슬프네요 잘 되시면 챈에 공유 부탁 드려 봅니다 ㅎ

펼쳐보기▼

2024-01-12 05:35:07

저도 코드만 맞춰놓으면 잘 돌아갈줄 알았는데 쉽지 않네요. 여러 시도 해보고 공유드리겠습니다.

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30100737

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25499

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 15808

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 44819

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

ㅇㅇ 2023.03.06 9270

공지 음성 채널 신문고

ㅇㅇ 2023.03.06 2511

공지 채널 홍보용 광고 패널

패챤 2023.04.01 1835

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4365

숨겨진 공지 펼치기(3개)

302 📄정보 속보)보컬 분리 모델 혁명일어남 [34]

벱나난비 2024.04.07 3140 18

301 📄정보 제일 만족스러운 음원분리 [4]

_Technology_ 2024.03.25 1138 0

300 📄정보 vits 온갖 삽질 끝에 드디어 훈련 돌입함 ㅋㅋ + 몇 가지 팁 [5]

카요맴 2024.03.19 664 5

299 📄정보 입문이 어려운 초보자를 위한 TTS 학습 시작 부터 원리 설명– Bert-VITS2(1.5편) [5]

선무공신 2024.03.17 1262 6

298 📄정보 입문이 어려운 초보자를 위한 TTS 학습 시작 부터 원리 설명– Bert-VITS2(1편) [26]

선무공신 2024.03.08 3503 7

297 📄정보 (나빼고 다아는)UVR 화음분리 팁 [8]

벱나난비 2024.03.08 2172 12

296 📄정보 데이터셋 만들고 확인할때 제대로된 오디오 플레이어를 사용할 것

코이코이 2024.03.03 329 2

295 📄정보 가끔 추론할때 너무 오래걸리는 버그 해결법 알아냄 [4]

야바주주비 2024.03.01 418 0

294 📄정보 겹쳐있는 더블링은 열화시키지 않고는 못지우는게 맞는듯 [4]

야바주주비 2024.03.01 645 1

293 📄정보 내가 곧죽어도 easy gui 이외의 코랩에서 weights.gg 모델을 다운받아서 써야겠다 하는 뉴비들 봐라 [1]

PPAP 2024.02.28 884 3

292 📄정보 Melo TTS

도라파덕 2024.02.27 766 1

291 📄정보 한국어를 포함한 다국어 TTS: melotts [5]

ㅇㅇ 2024.02.26 1170 4

290 📄정보 RVC V2 1000에포크 이상 학습하는방법 [2]

파인코코 2024.02.25 929 6

289 📄정보 [테스트] gpt-sovits [2]

도라파덕 2024.02.22 395 3

288 📄정보 applio v3.0.7 업데이트

GEE 2024.02.17 675 3

287 📄정보 화음 믹싱에 대해서 알아보도록 하자. [9]

햄버거살인마 2024.02.15 786 5

286 📄정보 화음 믹싱할 때 이펙트 넣는거 2개만 팁 주고감 [1]

햄버거살인마 2024.02.13 477 4

285 📄정보 커버곡 제작 무료로 가능하네요 [3]

도라파덕 2024.02.13 942 0

284 📄정보 applio v3 나옴 [7]

Hyun 2024.01.20 1557 4

283 📄정보 applio v3 출시예정 [5]

aat 2024.01.17 1317 6

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.