exllamav2로 모델을 양자화 하고

해당 github에 있는 readme를 보고 chat.py를 실행했습니다.


그런데 답변이 이런식으로 나옵니다. 혹시 이건 Token쪽을 건드려야 하나요? 아님 프롬프트를 건드려야 할까요 아님 코드상에 filter를 걸어야 할까요?

제가 이제 입문자다 보니 뭘 건드려야 할 지를 잘 모르겠습니다.