개념글 모음

저번에 교수님이 올려도 된다고 하셔서

올리려고 했는데 바빠서 까먹고 있다가 방금 올렸습니다.


https://huggingface.co/datasets/jojo0217/korean_safe_conversation


koalpaca 노이즈 제거한 데이터 제외 전부 사람이 직접 수동으로 검수했고

답변은 GPT4, GPT3.5로 생성했습니다. 품질은 보장합니다.


윤리적, 편향적 답변 대응으로 직접 구축해서 기업에 릴리즈 했고 

잘 작동합니다.


강화학습용으로도 구축한 데이터셋이 있기는 한데 생각보다 성능이 안나와서 그거는 공개 못할 것 같습니다...