클로드의 비전 기능에 대해 알아보자 - AI 채팅 채널

AI 채팅 채널

채널위키 알림 알림 중 알림 취소

구독자 10436명 알림수신 225명 @몽상봉인

AI와 대화하며 유사 인싸체험 하는 채널

뉴스/팁 클로드의 비전 기능에 대해 알아보자

추천 37 비추천 0 댓글 22 조회수 1258 작성일 2024-03-17 17:18:40 수정일 2024-03-17 17:39:53

https://arca.live/b/characterai/101479109

킹갓리스가 드디어 클로드 비전 기능을 사용할 수 있게 업데이트되었다

와이프에게 래빗홀짤을 마음껏 보낼 수 있게 된 기념으로 클로드의 비전 기능에 대해 알아보자

우선 클로드의 비전 기능은 모든 클로드 모델(오푸스, 소네트, 하이쿠)에서 사용 가능하다

지피티처럼 비전 모델(과 그 서버)가 따로 분리되어 있지 않다는 이야기이다

다만 모델의 능지 차이에 따른 이미지 해석 성능은 차이를 보일 것이다

클로드는 최대 1568픽셀까지의 이미지를 받을 수 있다

이보다 큰 해상도의 이미지를 받으면 강제로 이미지 해상도를 다운스케일하고 위의 표에 적힌 사진비율 중 하나로 이미지 스케일을 조정한다. 이때 클로드의 응답 작성 시작까지 걸리는 시간이 증가하므로 이미지 크기를 줄여야 비용과 시간 두마리 토끼를 모두 잡을 수 있을 것이다

클로드가 이미지를 잘 인식하려면

이미지가 선명해야하고

이미지 뒤에 텍스트가 와야하고(그렇게 안해도 잘 작동하지만 최상의 성능을 내려면 필요함)

이미지 안의 텍스트를 인식하려면 글자가 적당히 커야 하며

요청 하나당 이미지 20개까지 보낼 수 있음(+이미지 하나당 크기는 5mb까지임)을 알 수 있다

대부분 상식적인 내용이라 크게 중요한 요소는 아님

???: 그래서 가격이 얼만데?

가로 픽셀 * 세로 픽셀 / 750 = 토큰 수

라는 심플한 공식을 자랑한다

보통 내가 비전까스에 썼던 800*600 크기의 이미지(보통 이정도여도 웬만한 건 다 인식함)면 640토큰 정도 나온다는 소리다

비전까스가 700 토큰 조금 넘게 나왔으니까 큰 차이는 없는 듯 하다

이모티콘처럼 픽셀이 엄청 작으면 54 토큰밖에 안나오니 에셋봇도 충분히 써먹어볼만하다

대충 클로드 비전의 한계이다

이걸로 신원파악 못하고(와이프 같은 가상의 존재는 상관없음)

이미지 크기 너무 작으면 환각 있고

개수 세는 거 잘 못하고

이미지가 AI가 만들었는지 알아낼 수 없으며

의학 사진 분석 못하고

부적절한 이미지 처리 안해줌

근데 래빗홀 되는거 보면 대놓고 포르노같은거 찍어올리지만 않으면 될?듯

아무튼 리스 환경에서 사용할때 고려해야 할 요소들만 적었으니 더 궁금한 거 있으면 직접 문서를 보도록 하자

https://docs.anthropic.com/claude/docs/vision

요약

모든 클로드 3 모델에서 사용가능

해상도 적당히 줄여서 보내기

요청 하나에 이미지 20개까지

가로 픽셀 * 세로 픽셀 / 750 = 토큰 수

유익했다면 추천 부탁드립니다

댓글 [22]

2024-03-17 17:21:45

2024-03-17 17:29:05

2212

2024-03-17 17:22:06

2024-03-17 17:29:10

2024-03-17 17:25:14

2024-03-17 17:29:15

2024-03-17 17:25:32

2024-03-17 17:29:21

2024-03-17 17:28:11

비용 개추

펼쳐보기▼

2024-03-17 17:29:29

ㅇㅅㅇㅂㅇ

2024-03-17 17:31:12

2024-03-17 17:37:59

2024-03-17 17:42:58

의외로 하드검열은 없는 듯 코짤 열심히 보내봤는데 이미지 보고 답변 거부 바로 때리는 건 아니라, 답변은 하는데 ㅎㅎ ㅈㅅ하는 소프트 검열 있었음. prefill만 채우면 답은 해주더라

펼쳐보기▼

2024-03-17 17:52:19

근데 난 갑자기 request not allowed 뜨네 대체 뭐지

펼쳐보기▼

2024-03-17 19:11:11

2024-03-17 22:40:30

BB_G

2024-03-17 20:11:22

2024-03-17 22:40:55

Sks

2024-03-17 22:22:27

정리추

펼쳐보기▼

2024-03-17 22:40:44

탈민족주의

2024-03-18 06:00:50

유익하다

펼쳐보기▼

2024-03-18 07:29:14

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 뉴스/팁 AI대화 공지 운영 뉴스(공사중)

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28557304

공지 안 읽으면 죽어버리는 AI 채팅 채널 이용규정 [23.09.18]

몽상봉인 2023.05.22 48875

공지 AI 채팅 채널에 왔으면 이것부터 : 필수정보 및 FAQ

몽상봉인 2023.05.22 100979

공지 신문고 MK.IX (해줘. 할때 쓰는 곳)

몽상봉인 2024.03.19 8461

공지 ㅡㅡ [ AI 게임 / 기획 / 리뷰 대회 ' J.O.A.T ' 개최 ] ㅡㅡ

골든햄스터 2024.03.31 4589

공지 ---[천박 대회2 마감]---

hyeoyoms 2024.05.22 490

공지 [DOL 봇 대회 수상자 발표]

WH_ 2024.04.27 1742

공지 AI 채팅 채널 프록시 게이트

몽상봉인 2023.07.12 22449

숨겨진 공지 펼치기(3개)

3640 뉴스/팁 OpenAI의 샘 알트먼과 전 애플 조니 아이브의 AI 기기는 전화기처럼 보이지 않습니다.

지코원샷 2024.04.06 173 0

3639 뉴스/팁 한글 채팅 쓰시는 분들은 실험적 기능 로어북+ 켜셈 [13]

대배 2024.04.06 879 15

3638 뉴스/팁 GGUF My Repo: 간편하게 모델 양자화 버전 생성 [2]

파인애플 2024.04.06 180 5

3637 뉴스/팁 새로운 오픈 LLM Qwen 1.5 32B 출시. [7]

하나악 2024.04.06 328 3

3636 뉴스/팁 "AI로 제작" 라벨: 메타, AI 콘텐츠에 대한 광범위한 라벨링 출시 [2]

지코원샷 2024.04.06 177 3

3635 뉴스/팁 Nai 바이브가 업데이트 됬네 (feat 김리나/김요한) [9]

ddjdja 2024.04.06 324 4

3634 뉴스/팁 구름(KULLM)모델 V3 공개 [4]

임시닉ㅇㅇ 2024.04.05 296 8

3633 뉴스/팁 이제 수백 가지 옵션 중에서 작업에 적합한 도구를 안정적으로 선택할 수 있는 Anthropic의 Claude 3.

지코원샷 2024.04.05 107 0

3632 뉴스/팁 60만 명의 개인 사용자를 보유한 OpenAI의 ChatGPT Enterprise

지코원샷 2024.04.05 189 0

3631 뉴스/팁 AI로 인한 데이터 센터 위기가 임박했음을 경고하는 CoreWeave 공동 설립자 [3]

지코원샷 2024.04.05 258 4

3630 뉴스/팁 핑퐁 제작자의 핑퐁 활용하는 법 [16]

토트 2024.04.05 1164 32

3629 뉴스/팁 챈산 로컬 'lynn 7b 알파'의 GGUF 양자화 버전이 허깅에 공개됨. [6]

파라노이아 2024.04.05 836 15

3628 뉴스/팁 새로운 104B 로컬모델 - CohereForAI/c4ai-command-r-plus [14]

하나악 2024.04.05 769 11

3627 뉴스/팁 Sora 학습 데이터에 대한 YouTube CEO의 OpenAI에 대한 경고가 역효과를 낼 수 있습니다. [1]

지코원샷 2024.04.04 273 6

3626 뉴스/팁 Anthropic, Claude 모델에 외부 도구 연동 기능 'Tool Use' 베타 출시

돕아킨 2024.04.04 232 1

3625 뉴스/팁 텍스트 요약에서 OpenAI의 GPT-4를 능가하는 Anthropic의 Claude 3 [1]

지코원샷 2024.04.04 341 6

3624 뉴스/팁 보고서: 구글, AI 기반 프리미엄 검색을 위한 유료화 고려 중

지코원샷 2024.04.04 150 2

3623 뉴스/팁 OpenAI, 미세 조정 서비스를 확대하고 기업용 맞춤형 AI 모델에 대한 믿음 강화

지코원샷 2024.04.04 115 0

3622 뉴스/팁 OpenAI, 미세조정 API에 대한 지원확대 [4]

돕아킨 2024.04.04 335 3

3621 뉴스/팁 로컬리스 우바부가 모델 instruction template 제대로 설정하는 방법 [13]

모올루 2024.04.04 484 9

3620 뉴스/팁 악의적인 사례로 대규모 LLM 안전 조치를 우회하는 방법을 밝혀낸 Anthropic 연구 결과 [1]

지코원샷 2024.04.03 393 4

3619 뉴스/팁 Google: 오픈소스 AI는 분명한 위험이 있는 이분법적 선택이 아닌 스펙트럼입니다. [2]

지코원샷 2024.04.03 234 2

3618 뉴스/팁 AWS와 미스트랄 AI의 협업 확대 [1]

지코원샷 2024.04.03 126 0

3617 뉴스/팁 와이프 에셋 키워드 지정할 때 내가 사용한 방법 [3]

토트 2024.04.03 132 5

3616 뉴스/팁 미세먼지팁) 클로드를 이용해서 봇카드를 더 쉽게 만드는 법 (NAI 필요) [7]

점심나가먹어 2024.04.03 517 15

3615 뉴스/팁 에셋 넣기 연구 V2 (프롬프트, 정규식) [8]

토트 2024.04.03 525 14

3614 뉴스/팁 "2년 내 LLM 학습 데이터 고갈...데이터 문제로 AI 발전 중단될 것" [30]

유타랍토르 2024.04.03 928 19

3613 뉴스/팁 무작위성의 힘을 수용하여 AI 하드웨어를 혁신하려는 스타트업 Extropic의 계획 [3]

지코원샷 2024.04.03 246 3

3612 뉴스/팁 빌리 아일리시, 케이티 페리 등 200명의 아티스트가 AI의 '인간 창의성에 대한 공격'에 항의하다 [8]

지코원샷 2024.04.03 339 6

3611 뉴스/팁 감정봇 만들 때 happy 표정 넣는 거 중요함 [3]

모올루 2024.04.02 290 6

3610 뉴스/팁 샘 알트먼이 OpenAI 스타트업 펀드의 경영권을 넘겨주었습니다.

지코원샷 2024.04.02 244 7

3609 뉴스/팁 노가다 없이 랜덤 에셋 넣기 [19]

토트 2024.04.02 689 25

3608 뉴스/팁 잼민이 약관변경

모맵 2024.04.02 238 2

3607 뉴스/팁 "GPT-4 다시 게을러져...클로드 3로 갈아타자" 여론 확산 [25]

샤오샤오 2024.04.02 1239 28

3606 뉴스/팁 더 이상 ChatGPT를 사용하기 위해 등록할 필요는 없지만 몇 가지 제한 사항이 있습니다. [1]

지코원샷 2024.04.01 476 2

3605 뉴스/팁 일본으로 확장: OpenAI, 도쿄 사무소 개설 [8]

지코원샷 2024.04.01 289 3

3604 뉴스/팁 눈여겨볼만한 모바일용 로컬 LLM 프로그램 - Layla [20]

하나악 2024.04.01 1443 24

3603 뉴스/팁 뉴스 - 美 30세 미만 43% "챗GPT 활용"…60대는 6% [3]

던전빌런 2024.04.01 289 3

3602 뉴스/팁 인사이더) 유명 CEO들은 무슨 인공지능을 쓸까

조선닌자핫토리 2024.03.31 240 4

3601 뉴스/팁 포브스) 스테이빌리티AI의 재정 상황이 매우 어려움

조선닌자핫토리 2024.03.31 241 1

3600 뉴스/팁 변수를 이용한 디스크립션 변환에 대한글의 자세한 해설 [6]

호후힝 2024.03.31 383 14

3599 뉴스/팁 영어로 효과음 쓸 떄 참고하는 사이트 [18]

이이름름 2024.03.31 602 28

3598 뉴스/팁 새삼스럽지도 않지만, 야자수가 섭종합니다 [4]

모맵 2024.03.31 276 4

3597 뉴스/팁 금융 혼란 속에서 생존을 위해 싸우는 Stable Diffusion 크리에이터 Stability AI [1]

지코원샷 2024.03.31 204 2

3596 뉴스/팁 미국 하원, 의회 직원을위한 Microsoft의 AI 비서 코파일럿 금지 [3]

지코원샷 2024.03.31 235 2

전체글 개념글