주장: chatgpt3.5 와 70b Agent 기능에 대하여 비슷한 성능.

https://huggingface.co/THUDM/agentlm-70b


- LLM Agent 성능 올리기

https://github.com/THUDM/AgentTuning

https://huggingface.co/datasets/THUDM/AgentInstruct


LLM을 에이전트로 평가하기

https://github.com/THUDM/AgentBench


- 인터넷검색(기반 언어 에이전트를 통한 확장 가능한 실제 웹 상호작용)

https://github.com/princeton-nlp/webshop


AgentTuning은 여러 에이전트 작업에 걸쳐 상호 작용 궤적을 사용하여 LLM을 명령 조정하려는 최초의 시도를 나타냅니다. 평가 결과에 따르면 AgentTuning은 일반적인 언어 능력을 유지하면서 보이지 않는 에이전트 작업에 대한 강력한 일반화를 통해 LLM의 에이전트 기능을 활성화하는 것으로 나타났습니다. AgentInstruct 데이터 세트와 AgentLM을 오픈 소스로 제공했습니다.





Agent 에 대하여 어떻게 돌아가고.. 어떤 기능으로 쓰며 관련 소스는 무엇인지 파악하려고 할 때 참고용으로 좋을듯