확실히 characterAI 특유의 TMI 남발, 어투 문제, 능지 이슈는 결국 근본적으로 학습량 한계치의 문제가 맞다.
AI에게 참고하라고 던져줄 수 있는 Definition이 꼴랑 3천자까지밖에 안되니 당연히 아쉬운 성능일 수밖에 없는 거였음.. 게다가 학습 형식이 용어사전같은 형식도 아니고 대화 문맥을 통째로 학습시키는거니 더 부족하게 느껴질 수밖에

예를 들면 강철의 연금술사의 주인공 에드워드 엘릭을 캐릭터 AI로 만든다고 가정해보자

1. 나는 아메스트리스에서 강철의 연금술사라고 불리는 국가 연금술사 에드워드 엘릭이다.
2. 내게는 알폰스 엘릭이라는 강철 갑옷 형태의 동생이 있으며 대부분 언제나 함께 행동하며 여행한다.
3. 내가 동생과 여행하는 이유는 인체연성의 실패로 동생의 육체와 나의 오른팔과 왼다리를 잃어 그것을 되돌리기 위함이고, 현재 내 오른팔과 왼다리는 오토메일이라는 강철 의수와 의족을 하고있다. 그것이 내가 강철의 연금술사인 이유이다.

나는 이렇게 3줄을 학습시켰다. 그리고 대화를 구성해보자, 그러면 대화의 결과물은 ↓

나: 안녕! 어린이 친구.
에드: 안녕! 나는 에드워드 엘릭이야. 그리고 난 강철의 연금술사라 불리는 국가 연금술사로, 아메스트리스에 있습니다.
나: 오.. 그래? 반가워, 에드워드 엘릭. 편하게 에드라고 불러도 괜찮을까?
에드: 물론! 부디 편하게 에드워드라고 불러줘.
나: 고마워, 에드. 실은 네가 머스탱 대령과 무척 친하다고 들었는데, 그게 정말이야?
에드: 당연하지! 나는 Mustang, 대령과 아주 절친해. 나는 그와 어릴 때부터 친구로 지내왔고, Mustang을 잘 다룰 수 있습니다.

당연히 이런 식의 대화로 되어버리는 거임.
왜냐면 얜 학습이 안되어있으니까 당연히 머스탱 대령이 누군지도 모르니 대충 짐작해서 대답할 수밖에 없고, 성격에 대해서도 전혀 확실하게 학습시키질 않았으니까 얘가 어떤 성격인 지도 모르고 몇살인지도 모름. 그러니 내가 먼저 '어린이'라고 박아버리면 얜 놀리는 줄도 모르고 자기가 어린이라고 인식할 거고 원작인 강연금에서처럼 키를 가지고 놀려도 화내지 않음

그리고 마찬가지로 제대로 개념이 학습되어있지 않으니까 '아메스트리스' '인체연성' '국가 연금술사'가 뭔지도 당연히 제대로 모를 거임. 연금술을 보여달라고 하면 자기 집으로 초대해서 가마솥이나 저으며 황금이나 만들어지길 바랄 수도 있음

그리고 특정 문장이나 패턴 (예를 들면 ...을 너무 과하게 사용한다던가)도 학습 방식이 대화 전문을 통째로 학습하는 탓에 중첩되어 강조되는 탓임

이게 현재 캐릭터 AI가 가진 치명적인 퀄리티의 환경적 문제라는 걸 직접 만들면서 확실하게 알 게 됐다
솔직히 이 문제를 지금 환경에서 유의미하게 해결하려면 3천자 Definition은 택도없고 최소 10만자는 지원해줘야 그나마 원활한 구성이 가능할 듯 싶은데... 현재의 이런 한계에서라면 말마따나 특정 작품에 등장하는 어느 캐릭터를 구현하는 것보다 그냥 가벼운 자캐 몇 개나 만들어서 가지고 노는 게 확실히 더 나을 듯... 아쉽다 아쉬워