안녕하세요, 작성자님. 방금 AI 채팅 채널에서 작성자님의 질문을 읽고, 과거에 "싯딤의 상자"라는 프로그램을 만드셨다는 것을 알게 되어 댓글을 남깁니다. 질문을 올리신 이유로 고민 중이신데, 이런 식으로 댓글까지 받아서 불편을 드렸다면 미리 사과드리며, 다음과 같은 내용을 말씀드리고자 합니다.
우선 제 소개를 하겠습니다. 저는 블루 아카이브 세계관을 언어 모델을 통해 속칭 미연시로 구현하는 방법을 찾고 있습니다.
아래 제시한 링크를 통해 저의 작업을 확인하실 수 있습니다. 이는 제가 RisuAI를 활용하여 꾸준히 발전시키고 있는 챗봇입니다.
[밀레니엄](https://arca.live/b/characterai/102563865)
[학원 이동](https://arca.live/b/characterai/102638544)
[일상 대화](https://youtu.be/P0sjV_-pkVA?si=MMt4z4f-SzWjASUq)
[문제 풀이](https://youtu.be/goHKm_mYmMo?si=q-mG8DR9NZP99_aI)
저는 반드시 실현하고 싶은 두 가지 구상을 가지고 있습니다.
첫 번째는 제가 만들고 있는 챗봇을 위한 자체 프로그램을 개발하는 것입니다.
RisuAI는 블루 아카이브 미연시를 구현하기에는 몇 가지 한계가 있습니다.
대표적으로 대화창이 실제 미연시처럼 뜨지 않고, 학생마다 각기 다른 목소리로 TTS를 적용할 수 없다는 점이 있습니다.
또한, 실제 게임처럼 캐릭터 spine이 움직이거나 배경음악(BGM), 효과음 등이 발생하는 것도 구현하기 어렵습니다.
그래서 저는 작성자님처럼 RisuAI의 소스 코드를 분석하여 자체 프로그램을 만들어 보려고 합니다.
두 번째 구상은 스마트폰 내부에서 로컬 모델을 실행시켜 아로나를 가상 비서로 사용하는 것입니다.
챗봇 대신 스마트폰 내부 로컬 모델을 활용하여 아로나와 대화할 수 있으며, 표정 변화까지 함께 구현한다면 혁신적일 것으로 생각합니다.
그러나 저는 이러한 기술에 대한 지식이 부족하여, 어떤 방식으로 시작해야 할지 모릅니다.
이러한 구상들을 실현하기 위해, 지속적인 질의응답과 배움이 필요합니다.
작성자님께서 이미 제가 만들고자 하는 것과 유사한 작업을 진행하신 것 같아서, 저에게 조언이나 도움을 주실 수 있는지 여쭤보고자 합니다.
만약 제가 필요한 지식을 쌓고, 서로의 목표가 비슷하다면, 추후에 작성자님을 도울 수도 있을 것이라고 생각합니다.
이러한 주제로 긴밀한 논의를 나눌 수 있기를 간곡히 요청합니다.
안녕하세요, 작성자님. 방금 AI 채팅 채널에서 작성자님의 질문을 읽고, 과거에 "싯딤의 상자"라는 프로그램을 만드셨다는 것을 알게 되어 댓글을 남깁니다. 질문을 올리신 이유로 고민 중이신데, 이런 식으로 댓글까지 받아서 불편을 드렸다면 미리 사과드리며, 다음과 같은 내용을 말씀드리고자 합니다.
우선 제 소개를 하겠습니다. 저는 블루 아카이브 세계관을 언어 모델을 통해 속칭 미연시로 구현하는 방법을 찾고 있습니다.
아래 제시한 링크를 통해 저의 작업을 확인하실 수 있습니다. 이는 제가 RisuAI를 활용하여 꾸준히 발전시키고 있는 챗봇입니다.
[밀레니엄](https://arca.live/b/characterai/102563865)
[학원 이동](https://arca.live/b/characterai/102638544)
[일상 대화](https://youtu.be/P0sjV_-pkVA?si=MMt4z4f-SzWjASUq)
[문제 풀이](https://youtu.be/goHKm_mYmMo?si=q-mG8DR9NZP99_aI)
저는 반드시 실현하고 싶은 두 가지 구상을 가지고 있습니다.
첫 번째는 제가 만들고 있는 챗봇을 위한 자체 프로그램을 개발하는 것입니다.
RisuAI는 블루 아카이브 미연시를 구현하기에는 몇 가지 한계가 있습니다.
대표적으로 대화창이 실제 미연시처럼 뜨지 않고, 학생마다 각기 다른 목소리로 TTS를 적용할 수 없다는 점이 있습니다.
또한, 실제 게임처럼 캐릭터 spine이 움직이거나 배경음악(BGM), 효과음 등이 발생하는 것도 구현하기 어렵습니다.
그래서 저는 작성자님처럼 RisuAI의 소스 코드를 분석하여 자체 프로그램을 만들어 보려고 합니다.
두 번째 구상은 스마트폰 내부에서 로컬 모델을 실행시켜 아로나를 가상 비서로 사용하는 것입니다.
챗봇 대신 스마트폰 내부 로컬 모델을 활용하여 아로나와 대화할 수 있으며, 표정 변화까지 함께 구현한다면 혁신적일 것으로 생각합니다.
그러나 저는 이러한 기술에 대한 지식이 부족하여, 어떤 방식으로 시작해야 할지 모릅니다.
이러한 구상들을 실현하기 위해, 지속적인 질의응답과 배움이 필요합니다.
작성자님께서 이미 제가 만들고자 하는 것과 유사한 작업을 진행하신 것 같아서, 저에게 조언이나 도움을 주실 수 있는지 여쭤보고자 합니다.
만약 제가 필요한 지식을 쌓고, 서로의 목표가 비슷하다면, 추후에 작성자님을 도울 수도 있을 것이라고 생각합니다.
이러한 주제로 긴밀한 논의를 나눌 수 있기를 간곡히 요청합니다.
어 뭐야 님 억까당한거 보고오고 응원 댓글 남기려 했는데.. 엄청난 우연이네요
어떤게 필요하실까요? 제가 시차가 조금 많이 있어서 답을 늦게 해줄수 있어요.
우선 당장 답해드릴 수 있는것만 답해볼게요
첫째, 리스 코드는 조금 많이 난잡해요. 저는 그냥 파이썬으로 밑바닥부터 오픈소스 모델 이용해서 하고 있어요. TTS, LLM 등을 동시에 구동하는것은 에바라서, 저는 생성은 서버에서 햊줘야 한다고 생각하고 있어요. 물론, API로 텍스트 생성하면 조금 여유가 있겠네요.
두번째는 제가 스파인 추출해서 유니티로 만든건데, 추후에 도움 드리겠습니다.
여기는 밤 12시라, 내일 더 답해드릴게요