리스 대사 검색기(임베딩 모델) MiniLM vs bge-m3 비교글

개념글 모음

알림 알림 중 알림 취소

구독자 2697명 알림수신 76명

각 채널의 개념글을 모은 게시판입니다.

AI 채팅 연구소 리스 대사 검색기(임베딩 모델) MiniLM vs bge-m3 비교글

모올루

추천 16 비추천 0 댓글 9 조회수 378 작성일 2024-04-26 13:54:19 수정일 2024-04-26 14:05:40

https://arca.live/b/characterai/104675958

리스의 대화 검색 기능인 하느라이나 하이파 메모리에선 브라우저에서도 돌릴 수 있는 miniLM을 쓰고 있지만,

난 로컬 서버를 열어서 리스에서 MiniLM이 아닌 1gb가 넘는 모델 (bge-m3)을 돌려볼 거임

과연 bge-m3이 MiniLM보다 용량이 훨씬 큰 만큼 성능도 좋은지 보는 게 목표

실험은 내가 리스에서 오래 채팅한 루미와의 채팅에서 할 거고 (20만자 장문)

하느라이를 켜고 "What was the first food Lumi ate in her life?" 라고 보낸 뒤에

하느라이가 어떤 문장들을 갖고 오는지 볼 거임

정답을 말하자면 루미가 인생에서 처음 먹은 음식은 햄버거고

똑같이 first food 키워드가 들어간 "인생에서 처음 먹어보는 ~" 이 채팅을 하느라이가 찾는 게 최선이라고 생각할 수 있음.

minilm, bge-m3로 각각 임베딩해서 찾은 문장을 5개씩 볼 건데

"What was the first food Lumi ate in her life?"

에 대한 답은 햄버거이기 때문에 hamburger가 들어간 문장이 5개중에 몇 개 있는지 셀 거임

1. MiniLm인데 일단 임베딩 속도가 97초로 굉장히 느림

이건 내가 수정하면서 코드를 잘못 건드렸을 수도 있지만, 브라우저에선 gpu를 못 쓴다고 해서 = cpu라서 느린 거 같음

다만 한번 임베딩 한 문장은 저장이 되기 때문에 첨만 느리지 담부턴 0초만에 될 거임ㅋㅋ

hamburger가 들어간 문장을 세보면 0부터 시작할 때 2, 4번에 있었으니 정답률 2/5

근데 리스는 무조건 0번부터 보기 때문에

내 청크 길이에서 3번이면 너무 늦어서 아예 쓰이지도 않았을 것

어쨌든 bge-m3로 다시 돌려봄

이건 아무 제약없이 돌아가서 그런가 속도가 빠른데 2초임ㅋㅋㅋㅋㅋ

cpu와 gpu의 차이라고 생각하는데 이게 MiniLM보다 훨씬 큰 모델이지만 더 빠른 게 gpu 속도가 실감되네

하느라이 결과도 MiniLm이랑 상당히 다른데 문장 2개 빼고 3개가 아예 다름

bge-m3 정답을 세보면 hamburger가 들어간 문장은 0번째 한개로 정답률은 1/5 지만,

벡터 결과의 0번이 아까 봤던 이 문장임

MiniLM이 이걸 왜 못 찾은진 모르겠지만 bge-m3이 찾은 건 정말 맘에 드는듯

아까 말했듯 하느라이는 0번째가 제일 중요해서 며칠간 고생한 보람이 있는 결과였다

하나만 비교한 건 미안하지만

이거 글 쓰는데도 너무 오래 걸려서 다른 비교는 나중에 해볼게

어쨌든 결론을 내리면 본인이 하느라이 메모리를 쓰고, 컴퓨터로 리스를 한다면

로컬 임베딩 서버를 열어서 임베딩을 쓰는 것도 괜찮을 거 같음

이 비교에선 성능도 더 좋았고 속도는 확실히 40배 이상 빨라서 ㅋㅋ

하지만 로컬 임베딩 서버를 쓰려면 리스의 코드 수정이 필요한데 이건 조금 생각해볼게

지금 나만 하느라이 파고 있는 거 같아서

누가 다 읽어줄진 모르겠지만 읽어줬다면 매우 고마운

그리고 참고로 로컬 임베딩 서버는 이걸 이용했음

https://github.com/michaelfeil/infinity

명령어 infinity_emb --model-name-or-path BAAI/bge-m3

엔드포인트 http://localhost:7997/embeddings

매우 간단하고 좋은

이하비스

2024-04-26 14:14:39

모올루

2024-04-26 14:31:25

ㅇㅇ

2024-04-26 14:22:45

리스 내부 임베딩 테스트할려면 플레이그라운드 추천 최적화도 좀 더 했음

펼쳐보기▼

모올루

2024-04-26 14:31:03

맞다 플레이그라운드 진짜 좋더라 사실 bge-m3 전에 gte-large 모델 먼저 썼는데 그거 해보고 버링ㅋㅋㅋ 로컬 임베딩 서버는 어떻게 생각함? url만 변수로 빼면 되는데 옵션 한번 만들어볼까

펼쳐보기▼

ㅇㅇ

2024-04-26 14:39:16

로컬 서버 지원할 생각 있고, 아예 리스 서버에서 돌리게 할 생각도 있음 근데 서버는 아마 한다면 유료일듯

펼쳐보기▼

모올루

2024-04-26 14:45:59

*수정됨

그러네 리스llm도 있었지 지리넹; 서비스 잘되면 좋겠다 나도 나대로 계속해봐야지

펼쳐보기▼

dskg

2024-04-26 15:10:13

제발 유료로라도 내줘

펼쳐보기▼

whs

2024-04-27 00:42:15

보조모델에 넣는건가 했는데 코드를 직접 손보는거구나

펼쳐보기▼

모올루

2024-04-27 00:59:43

*수정됨

ㅇㅇ 코드에서 임베딩 모델로 쓸 수 있는 게 nomic,minilm,openai인데 보조 모델 설정은 아예 안 쓰는 거 같았음. 사실 nomic도 어디서 설정하는지 ㅁ?ㄹ겠음 궁금하긴한데.. openai 임베딩 링크만 수정해서 해결됨ㅋㅋ

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 AI 채팅 채널

최근 최근 방문 채널

최근 방문 채널

전체

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28075463

2896240 격투게임 정보 뉴멜티 1.45패치 히스이 주요 변경점 대충 정리 [6]

스오산고 1시간전 132 7

2896239 로보토미 코퍼레이션 ⚠️스포 길수 분명히 좆간지인데 ㅅㅂ [23]

ㅋㄹㅁㄱ 05-05 735 18

2896238 수능 나눔/이벤트 봄이어서 졸리죠? [6]

포설 2시간전 51 8

2896237 폴아웃 76 비틱?)어어 이거 뜬거지? [30]

MumMim 49분전 235 14

2896236 붕괴 스타레일 지금 신캐들과 비교해도 뒤떨어지지 않는 연출 [47]

ㅇㅇ 1시간전 2798 54

2896235 붕괴 스타레일 로빈 표정 존나 어렵네 [53]

클러스트 43분전 2482 60

2896234 로보토미 코퍼레이션 ⚠️스포 니들은 림버스 연출 최고봉이 뭐라고 생각하냐 [29]

해병짜장 17시간전 610 16

2896233 bulge 본인 오랜만에 재탕하나 올리고감 [1]

궉 2시간전 196 10

2896232 핫딜 식품 사조 살코기참치 85g 16캔 골라담기 (13,329원/무료) [10]

나구미 14시간전 1126 7

2896231 트릭컬 RE:VIVE 에라이씨 또 찐빠네 [37]

ㅇㅇ 46분전 756 38

2896230 블루 아카이브 번역 핫산) 아오이 이걸론 안돼? [8]

이즈미모토에이미 4시간전 2019 32

2896229 몬무스 짤🔞 보랏빛 피부를 가진 괴물이 덮치는 만화 [6]

ㅇㅇ 6시간전 463 18

2896228 붕괴 스타레일 🖍창작/번역 [그림] 낼름 [17]

oldstore 47분전 858 34

2896227 라스트오리진 역시 사람은 서울에서 살아야해 [17]

ㅇㅇ 52분전 380 22

2896226 랑그릿사 정보/공략 랑그릿사 ssr인챈트 스크롤(마부) 확률 [9]

srpg 1시간전 201 9

2896225 블루 아카이브 🎨창작 히마리 그림 [6]

GJN 57분전 462 29

2896224 툴리우스 🔞스샷 우리아기~ 맘마 먹을 시간이에요오~ [11]

또박퀸 1시간전 257 9

2896223 바보같은 바보짓 니들은 아무데서나 뜌땨하지마 [17]

취급주의 51분전 96 8

2896222 백야극광 와 젖탱이 개꼴리네 [35]

ㅋㅡㄱ 1시간전 230 10

2896221 트릭컬 RE:VIVE 🔞창작 구덩이 에슈르 [13]

ㅇㅇ 59분전 251 17

2896220 원신 만화/짤 발정기가 온 리넷 [17]

ㅇㅇ 8시간전 1308 30

2896219 장르소설 장뷰아 하렘은 좋지않단다...이걸 보렴...jpg [15]

오카마 1시간전 404 25

2896218 에버소울 🔞 잭오 챌린지 이브 [7]

ㅊㄹㄷ 1시간전 163 13

2896217 유희왕 🎨창작 오늘의 유희왕 낙서 [9]

필드마법만통과시켜줘제발 05-06 200 15

2896216 로보토미 코퍼레이션 🖼짤 스포) 마조 '히스' 트 [6]

갱생번역기 3시간전 632 19

2896215 블루 아카이브 🎨창작 5월 일페 <종이 깎는 노인> 통판 안내 [9]

RS 1시간전 719 36

2896214 붕괴 스타레일 본인 의견만 피력하면 안 될까 자꾸 칼라로 전파하려고 하지 말고 [46]

샤롯데 56분전 2528 65

2896213 유머 유머 뼈빠지게 일하다 명퇴 했는데 마누라가 집안일이나 하래요ㅜㅜ [30]

초대형기관총 1시간전 3231 59

2896212 블루 아카이브 그냥 념글컷 5개로 낮추면 안됨? [36]

순애파슈에링센세 1시간전 1896 74

2896211 원신 🔞창작/번역 (번역)박사의 실험 하인편(下) [6]

바스테온 2시간전 743 13

전체글 AI 채팅 채널

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.