https://huggingface.co/datasets/qwopqwop/ALMA-R-ko-en

데이터셋은 CPO를 위한 데이터셋이고 모든 데이터셋 포맷은 ALMA-R이랑 동일하게 맞췄슴

GPT-4는 gpt4 0613이고 대략 20달러 들었고.

ALMA는 이거 beam search 5주고 하니까 돈 많이듬 대략 15달러 들었고. ALMA 데이터셋중 몇개 무한 반복걸려서 no repeat n gram 9주고 temperature=0.6, top_p=0.9 줘서 따로 추론함

xcomet, kiwi 둘다 score만드는데 총 2 달러 정도들드라.

이제 ALMA-R학습시키러감