https://huggingface.co/openlynn/Llama-3-Soliloquy-8B-v2

https://huggingface.co/openlynn/Llama-3-Soliloquy-Max-70B-v1

GPTQ 양자화도 존재


오픈라우터 공지

프롬프트 캐싱으로 인풋처리 속도가 훨씬 빨라졌습니다.
가격이 0.15 / 0.15로 줄었습니다.


기존 v1에 비해

지시 이행력이 많이 올랐습니다.

고봉밥, 사칭의 빈도가 크게 줄었습니다.(물론 프롬에 따라서 크게 다릅니다.)

기억력이 크게 증가했습니다. 캐릭터 카드를 무시하는 현상이 훨씬 덜 합니다.


오픈라우터 및 모노리스에서 이용가능

https://openrouter.ai/models/lynn/soliloquy-l3
https://monolyth.ai/models/soliloquy-l3


후처리에 대해서

오픈라우터 측에서 스트리밍을 매우 필요로 하셔서, 후처리(pro)가 적용된 모델이 런칭 된다면 아마 모노리스에 올라가지 않을까 싶습니다. 올라간다면 추후 공지해드리겠습니다.

모델 좋은가요?

위자드나 70b에 비해서는 아닙니다.

다만, 현재 올라와 있는 8b 모델중에서는 가장 좋다고 말씀드릴 수 있습니다.


현재 진행 중

- 한국어 모델 제작