FROM gemma-2b-q8.gguf

TEMPLATE """
<start_of_turn>user
{{ if .System }}{{ .System }} {{ end }}{{ .Prompt }}<end_of_turn>
<start_of_turn>model
{{ .Response }}<end_of_turn>
"""

SYSTEM """당신은 AI 어시스턴트입니다. 질문에 맞는 답변을 작성해 주세요."""


TEMPERATURE 0.2
PARAMETER repeat_penalty 2
PARAMETER stop <start_of_turn>
PARAMETER stop <end_of_turn>


위와 같은 Modelfile을 작성하여 테스트를 진행해보니, 쓸때 없는 토큰들을 반복적으로 출력합니다. 다만, 만들어진 gemma-2b-q8.gguf를 hugginfgface코드로 실행하면, 이상없이 동작합니다.


아마도 TEMPLATE쪽이 문제가 있어 보이는데요.. 어떻게 수정하는 것이 맞을까요?