이 캐릭터/목소리로 이거 하려면 뭘 찾아봐야 해요? - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5575명 알림수신 129명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

📄정보 이 캐릭터/목소리로 이거 하려면 뭘 찾아봐야 해요?

추천 28 비추천 0 댓글 10 조회수 7561 작성일 2023-03-06 16:16:46 수정일 2023-04-30 01:57:30

https://arca.live/b/aispeech/71274062

원하는 말을 하게 만들고 싶은데, 깔끔한 목소리와 정확한 대본을 얻을 수 있어요!

--> tts 모델을 학습시키면 됩니다. vits를 찾아보세요.

다국어를 지원하는 vits 포크: https://github.com/CjangCjengh/vits

원하는 노래를 부르게 하고 싶어요.

--> svc 모델을 학습시키고 유튜브에서 기준으로 삼을 음원을 다운받아 음원분리를 수행한 후, svc 모델을 사용해 얻어온 음원의 보컬을 변환하면 됩니다. 기준으로 삼을 음원을 잘 고르면 좋은 결과를 얻을 수 있어요. diff-svc를 찾아보세요.

diff-svc: https://github.com/prophesier/diff-svc

ddsp-svc: https://github.com/yxlllc/DDSP-SVC

RVC: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI

[공통 사항]

tts 모델을 학습시키든 svc 모델을 학습시키든 데이터셋을 만들 수 있어야 해요. 데이터셋을 만들려면 음원 분리 후 음원을 적절한 길이로 잘라주어야 해요. 데이터셋을 만들려면 hdemucs와 pydub 라이브러리를 찾아보세요.

음원 분리 HDEMUCS_HIGH_MUSDB_PLUS: https://pytorch.org/audio/main/generated/torchaudio.pipelines.HDEMUCS_HIGH_MUSDB_PLUS.html

pydub: https://pypi.org/project/pydub/

[각 모델의 특성]

모델	대본	학습 시간 (RTX3090 기준)	학습 난이도	비고
vits	필요함 (정확해야 함)	12시간 이상	보통
diff-svc	필요 없음	6시간 이상	쉬움
ddsp-svc	필요 없음	2시간 이상	쉬움
RVC	필요 없음	20분 이내	쉬움

댓글 [10]

2023-03-06 16:31:24

2023-03-06 16:31:36

2023-03-06 17:09:14

일단 데이터셋 마련하면서 학습법 정리해주는 사람 나오길 기다려봐야겠다

펼쳐보기▼

2023-03-06 18:32:28

무명의개념

2023-03-08 12:18:10

이건 공지로 보내자

펼쳐보기▼

2023-03-09 15:08:07

떡붕어망코

2023-03-10 02:45:34

2023-03-10 12:54:57

그림과 달리 초반 접근이 너무 어렵네요. 프로그램 이해가 되야 접근 가능할듯.

펼쳐보기▼

2023-03-19 14:34:32

22222222

펼쳐보기▼

2023-05-25 04:34:55

이걸 지금 봤네... 이건 공지가 맞다

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30129599

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25515

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 15825

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 44839

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

ㅇㅇ 2023.03.06 9277

공지 음성 채널 신문고

ㅇㅇ 2023.03.06 2517

공지 채널 홍보용 광고 패널

패챤 2023.04.01 1837

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4371

숨겨진 공지 펼치기(3개)

📄정보 diff-svc 코랩 런타임 에러 [2]

PPAP 2023.04.04 1809 6

📄정보 만든 VITS 모델로 AI 채팅하기.rpy [8]

Tacotron2 2023.04.04 2033 6

📄정보 시도해볼까 하면서 찾아보는 와중에 괜찮은 내용 적힌 블로그 찾음 [1]

티볼리36개월할부납입오너 2023.04.01 502 0

📄정보 한국어 vits tts 학습/파인튜닝 및 추론 가이드.md [57]

Tacotron2 2023.03.30 17666 11

📄정보 diff-svc 만들다가 에러 생기면 diff-svc 디코 가보셈

아샥 2023.03.24 550 1

📄정보 로컬 diff-svc 인퍼런스 코드 [1]

Tacotron2 2023.03.24 588 4

📄정보 diff-svc 음성학습 잘됐다... 올리면 안된데서 느낌만 표현해줄게 [2]

dokdo114 2023.03.23 723 1

📄정보 tts 데이터셋 대본을 만들고 싶은데 귀찮아요 [4]

Tacotron2 2023.03.17 1523 4

📄정보 3명정도 이거찾던데 코랩 지금 고쳤는지 어떤지 모르겠는데 일단 해결법 찾음. [13]

고닉1235789 2023.03.16 1949 3

📄정보 지금 diff-svc에는 numba 오류가 발생했습니다. [4]

dokdo114 2023.03.16 375 2

📄정보 학습시간 15분만에 VITS 파인튜닝으로 모델 학습시키기 [7]

Tacotron2 2023.03.11 2507 2

📄정보 tortoise-tts 튜토리얼 ( AI 음성 복제 따라하기 TTS ) [2]

ㅇㅇ 2023.03.10 3262 7

📄정보 elevenlabs을 이용한 음성 학습 가이드 ( 원문:Voice AI Synthesis Guide) [1]

ㅇㅇ 2023.03.10 1618 1

📄정보 diff-svc 데이터셋 보컬의 음역대가 모델의 퀄리티에 큰 영향을 주지 않는 것 같음 [5]

Tacotron2 2023.03.09 1177 4

📄정보 diff svc 출력용gui 프로그램 [9]

poilkei 2023.03.09 1556 3

📄정보 이걸로 체험해보시는건 어떤가요? [1]

무명의개념 2023.03.08 966 0

📄정보 이 캐릭터/목소리로 이거 하려면 뭘 찾아봐야 해요? [10]

Tacotron2 2023.03.06 7562 28

📄정보 Diff-SVC 창작품의 대단히 좋은 예시 [3]

ㅇㅇ 2023.03.06 3031 15

📄정보 리빙포인트) vits나 diff-svc, so-vits등 requirements.txt를 설치할 때 뭔가 오류가 발생한다면 [1]

Tacotron2 2023.03.06 2552 8

📄정보 음성에서 배경음악을 제거하는 방법 [22]

이하비스 2023.03.06 3205 13

전체글 개념글