임베딩 모델 SBERT 학습관련 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3405명 알림수신 168명 @바바리맨

제한없는 언어모델을 위한 채널

질문 임베딩 모델 SBERT 학습관련

ㅇㅇ (121.166)

추천 0 비추천 0 댓글 6 조회수 463 작성일 2024-04-16 03:02:56

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/103758914

안녕하세여 임베딩 모델을 직접 학습시켜보려고 Sentence BERT 논문을 봤는데요.

해당 논문에서는 BERT로 10,000의 문장에서 가장 유사한 문장을 찾으려면 V100위에서 65시간이 걸리는데,

Sentence BERT를 사용하면 5분으로 줄일 수 있다고 나와있는데 이게 어떻게 계산해서 5분으로 줄어드는걸까요?

BERT를 사용할때 cls 토큰 벡터로 모든 조합 계산해서 가장 유사한 문장을 찾는 것 까지는 이해가되는데

Sentence BERT를 사용해도 같은 계산량이 들지 않나 싶습니다. 제가 멍청해서 이해를 못하는거 같은데

살짝 도움을 주시기 바랍니다 ㅠㅠ

댓글 [6] 글쓰기

cjdth

2024-04-16 03:44:51 답글

10,000개에서 가상 유사한 문장 쌍을 찾으려면 인퍼런스를 n(n-1)/2 번 해야 해서 그렇습니다. (문장 조합의 경우의수)
sbert는 10,000개의 임베딩을 구한후 cos sim을 구하면 되기 때문에 인퍼런스를 추가적으로 안해서 더 빠르죠

펼쳐보기▼

ㅇㅇ (121.166)

2024-04-16 04:37:28 삭제 수정 답글

BERT는 입력을 pair로 넣기 때문에 그렇고, SBERT는 단일 문장을 사용하기 때문이라고 이해해도 괜찮을까요?

펼쳐보기▼

cjdth

2024-04-16 05:33:24 답글

넵 그렇습니다

펼쳐보기▼

ㅇㅇ (121.166)

2024-04-16 06:02:26 삭제 수정 답글

감사합니돠!

펼쳐보기▼

ㅇㅇ (61.100)

2024-04-18 08:52:14 삭제 수정 답글

SentenceBERT 논문 정리:
https://velog.io/@jaehyeong/Paper-Review-Sentence-BERT-Sentence-Embedding-using-Siamese-BERT-Networks

SentenceBERT 파인튜닝:
https://velog.io/@jaehyeong/Basic-NLP-sentence-transformers-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-SBERT-%ED%95%99%EC%8A%B5-%EB%B0%A9%EB%B2%95

velog.io

[Paper Review] Sentence-BERT: Sentence Embedding using Siamese BERT-Networks

Intro 문장 간(혹은 문서 간) 유사도 분석에서 좋은 성능을 내고 있는 Sentence-BERT에 대해 알아보려고 한다. 논문 원제는 Sentence-BERT: Sentence Embedding using Siamese BERT-Networks이며, 최근 성능이

SentenceBERT 논문 정리:
https://velog.io/@jaehyeong/Paper-Review-Sentence-BERT-Sentence-Embedding-using-Siamese-BERT-Networks

SentenceBERT 파인튜닝:
https://velog.io/@jaehyeong/Basic-NLP-sentence-transformers-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-SBERT-%ED%95%99%EC%8A%B5-%EB%B0%A9%EB%B2%95

펼쳐보기▼

ㅇㅇ (121.166)

2024-04-19 06:27:47 삭제 수정 답글

감사합니다 글 참고해서 도전해보겠습니다!

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28576343

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6013

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27121

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8919

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4044 질문 문득 최근 llm 모델 나오면서 착오가 자꾸 생겨서 여쭤봅니다. [4]

ㅇㅇ (61.33) 2024.04.24 480 6

4043 질문 특정 도메인에 대한 지식 학습 [7]

뉴비챗 2024.04.23 596 0

4042 일반 뇌에서 순수하게 언어 처리 부분만 떼어내면 어느정도의 시냅스가 있을까 [1]

iau 2024.04.23 356 1

4041 일반 저러면 8B 다국어 모델은 어느 정도 나오려나 [1]

딸기맛봇치 2024.04.23 479 1

4040 일반 phi-3 mini 벤치마크 점수 [3]

처음입니다 2024.04.23 616 8

4039 일반 젠장 또 라마3야 [11]

사과는맛있어맛있으면바나나 2024.04.23 1548 16

4038 공지 llama3 시대를 기념하여 공지글 한번 리프레쉬했으면 합니다. [4]

hkhk 2024.04.23 263 1

4037 정보 phi 3 mini출시 [6]

jackofmaster 2024.04.23 552 3

4036 질문 컴퓨터 사양 조언을 구하고 싶습니다 [8]

지능순 2024.04.23 338 0

4035 질문 안녕하세요 뉴비입니다 [14]

kixerfx 2024.04.23 348 0

4034 정보 원하는 모델을 gguf로 변환 해줍니다. [2]

zzzzz5 2024.04.23 576 5

4033 질문 LLaMa-3-70B 4bit 돌려보는 중인데 이상동작을 합니다.. [3]

처음입니다 2024.04.23 624 0

4032 일반 지금 와서 드는 생각 - ChatGPT 는 20B 모델인가? [7]

hkhk 2024.04.23 814 7

4031 일반 우바부가 listen 적용시 발생하는 오류 [2]

가우즈먼 2024.04.23 238 -1

4030 질문 양자화도 모르는 그냥 싹다 노베이스인데 궁금해서 올립니다 [5]

백열전구 2024.04.23 511 1

4029 일반 라마3가 나오고 8b하고 70b로 이거저거 해보고 느낌 [2]

그래요 2024.04.23 798 3

4028 일반 llama3 70B 를 GPU 4GB 에서 작동가능? [8]

ㅇㅇ (118.235) 2024.04.23 740 7

4027 질문 AI그림쪽은 AI로 생성한 데이터셋으로 훈련할수록 퀄리티 떨어진다는 논문 있었는데 [4]

iau 2024.04.23 499 1

4026 정보 llama3 의 양자화 버전의 성능은 얼마나 나올까? [6]

hkhk 2024.04.23 838 8

4025 정보 phi 3 기술 보고서 발표 [3]

ㅇㅇ 2024.04.23 614 7

글쓰기

전체글 개념글