Agentlm-70b 모델 Agent 기능 gpt 3.5와 비슷하다 주장. - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3450명 알림수신 170명 @바바리맨

제한없는 언어모델을 위한 채널

정보 Agentlm-70b 모델 Agent 기능 gpt 3.5와 비슷하다 주장.

추천 2 비추천 0 댓글 2 조회수 355 작성일 2023-10-28 05:10:04

https://arca.live/b/alpaca/89910066

주장: chatgpt3.5 와 70b Agent 기능에 대하여 비슷한 성능.

https://huggingface.co/THUDM/agentlm-70b

- LLM Agent 성능 올리기

https://github.com/THUDM/AgentTuning

https://huggingface.co/datasets/THUDM/AgentInstruct

- LLM을 에이전트로 평가하기

https://github.com/THUDM/AgentBench

- 인터넷검색(기반 언어 에이전트를 통한 확장 가능한 실제 웹 상호작용)

https://github.com/princeton-nlp/webshop

AgentTuning은 여러 에이전트 작업에 걸쳐 상호 작용 궤적을 사용하여 LLM을 명령 조정하려는 최초의 시도를 나타냅니다. 평가 결과에 따르면 AgentTuning은 일반적인 언어 능력을 유지하면서 보이지 않는 에이전트 작업에 대한 강력한 일반화를 통해 LLM의 에이전트 기능을 활성화하는 것으로 나타났습니다. AgentInstruct 데이터 세트와 AgentLM을 오픈 소스로 제공했습니다.

Agent 에 대하여 어떻게 돌아가고.. 어떤 기능으로 쓰며 관련 소스는 무엇인지 파악하려고 할 때 참고용으로 좋을듯

댓글 [2] 글쓰기

2023-10-28 11:12:11 답글

오

펼쳐보기▼

2023-11-02 12:43:52 답글

https://arca.live/b/aiart/73550049?target=all&keyword=%EA%B0%90%EC%83%81%ED%95%98%EA%B3%A0&p=1 혹시 여기에 나오는 작가 누군지 알 수 있을까요 ㅠㅠ.. 선생님이 올리신 글인데

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30017994

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6125

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27713

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9148

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5267

공지 신문고

바바리맨 2023.04.18 2305

숨겨진 공지 펼치기(1개)

540 정보 속보) 엔당 새 드라이버에서 메모리 정책 변경 [7]

노랑노랑 2023.11.01 638 6

539 정보 KT 자체 모델 믿:음 7B 공개 [11]

기어오는바닷가재 2023.10.31 1114 7

538 정보 RedPajama-Data-v2 출시 - 30조개의 토큰...? [2]

ㅎ헤ㅔ헤헤헤 2023.10.31 426 8

537 정보 gpt-3.5-turbo의 파라미터는 고작 20B?? [31]

재횽상 2023.10.30 1201 14

536 정보 RWKV-5 7B 학습 왜 잘됨? [1]

ㅎ헤ㅔ헤헤헤 2023.10.30 480 3

535 정보 RWKV-5 1.5B가 학습 완료되었습니다. [1]

ㅎ헤ㅔ헤헤헤 2023.10.28 371 5

534 정보 Agentlm-70b 모델 Agent 기능 gpt 3.5와 비슷하다 주장. [2]

novelgif 2023.10.28 356 2

533 정보 vllm은 버려라 [7]

ㅇㅇ (39.7) 2023.10.27 985 0

532 정보 다양한 LLM 포맷의 perplexity, VRAM, 속도,, model size, 로딩시간 비교 [3]

hkhk 2023.10.25 728 3

531 정보 디코딩 중 트랜스포머가 사용하는 VRAM 사용량 [8]

Recharger 2023.10.23 678 8

530 정보 fuyu-8b 모델 멅티모달 이미지+텍스트 질문에 텍스트 답변 제공. [2]

novelgif 2023.10.22 382 5

529 정보 아마존 미세조정한 MistralLite 모델 긴 문맥 및 검색 응답에서 더 나은 성능 [1]

novelgif 2023.10.22 483 4

528 정보 라마+SD=오픈소스 달리3? [2]

이하비스 2023.10.21 708 3

527 정보 (해결됨)지금 최신버전 transformer로 라마 학습하실 분 주의 [5]

사과는맛있어맛있으면바나나 2023.10.18 1154 17

526 정보 컨퍼런스 워크샵 [5]

ㅇㅇ (210.117) 2023.10.18 519 0

525 정보 In-Context Pretraining: Language Modeling Beyond Document Boundaries [6]

hkhk 2023.10.17 554 5

524 정보 프로메테우스 - GPT4 의 평가능력을 대체할 수 있는 오픈소스 LLM [2]

hkhk 2023.10.16 1169 18

523 정보 RWKV-5 14% 학습 벤치마크 [6]

ㅎ헤ㅔ헤헤헤 2023.10.16 519 3

522 정보 AI가 잊게 만드는 방법 [1]

JINfe 2023.10.11 540 6

521 정보 AI로 좋은 퀄리티의 데이터셋을 감별하자 [7]

ㅎ헤ㅔ헤헤헤 2023.10.11 825 10

전체글 개념글