최근에 외국에서 많이 논란이 되었던 문제중 하나가 요즘에 나오는 논문들의 말투가 이상하고 인공적이다. 이거 AI (특히 GPT)의 영향이 큰거 같다라는 얘기가 꽤 있었음.


영어 표현중에 delve 란 단어가 있는데 '파고들다' 같은 뜻이 있음. 근데 자주 쓰는 단어가 아니고 특히 논문에서는 자주 쓰던 단어가 아니었음. 그런데 2022년 이후로 논문에서 delve 란 단어가 많이 보이기 시작함. 



실제로 gpt 를 통해서 얘기를 하다보면 저런식의 좀 일상표현과 다른 표현을 쓰는 경우가 종종 발견됨. 왜 저런 식으로 GPT 가 말하나 이유를 파고들어보니 정답은 '나이지리아'였음.


나이지리아는 아프리카 나라중에 영어를 쓰면서 나름 인터넷도 발달한 국가이며, 세계적으로 보이스피싱, 랜섬웨어등의 스캠활동도 많이 하는 나라로 알려져있음. 어쨌든 그만큼 영어를 사용하는 저임금 노동자가 많이 있는 곳인데, chatgpt 를 학습하면서 후반단계의 RLHF 단계에서 저임금 나이지리아 인력의 노가다가 많이 들어갔음.


그런데 나이지리아에서는 delve 가 미국이나 영국에 비해 훨씬 일상화된 용어라고 함.


...


그래서 그렇게 된 것이었음.