복잡도에 관한 글 - 개념글 모음

개념글 모음

알림 알림 중 알림 취소

구독자 2687명 알림수신 75명

각 채널의 개념글을 모은 게시판입니다.

코딩 복잡도에 관한 글

선형사상

추천 15 비추천 0 댓글 33 조회수 713 작성일 2024-04-18 14:46:54 수정일 2024-04-18 16:02:11

https://arca.live/b/programmer/103976830

본인 혼자서 공부한 내용이라 부정확한 부분이 있을 수 있음. 지적은 언제나 환영.

거두절미하고 바로 시작해보도록 하자. 복잡도란, 어떠한 알고리즘의 복잡한 정도를 나타내는 지표를 의미한다. 당연한 얘기라고?

물론 그렇다. 하지만 노련한 사람이라면, 알고리즘의 복잡성은 단순하게 표현되지 않는다는 것을 알것이다. 왜냐하면 어떠한 프로그램을 실행 하는데에 있어서 기준이 될 수 있는 것은 시간과 메모리, 즉 2가지 이기 때문이다.

그리고 시간에 대한 복잡도를 시간 복잡도, 메모리에 대한 복잡도를 공간 복잡도라고 한다. 이것들에 대해서 할 말이 많지만, 복잡도에 대한 이야기만 다룰려고 한다.

우선 복잡도를 이해하기 위해서는 "점근 표기법"을 먼저 이해해야 한다. 이는 어떠한 함수의 증감 추이를 지표로 나타내게 하는 도구이다. 눈썰미가 좋은 사람이라면, 아마 미분을 연상할 것이다. 실제로 미분에서 중요하게 쓰이는 극한은 복잡도와 중요한 관계성이 있다.

대표적으로 많이 쓰이는 표기법 3가지를 알아보도록 하자.

첫번째로, Big-O notation이다. 아마 수많은 코딩과 관련된 사이트에서 이것을 볼 수 있었을 것이다. 표기는 다음과 같다.

f(x) = O(g(x))

사실 다들 이 수식이 나오면 습관적으로 반복문이 몇 개가 중첩되어 있는지 확인한다. 그러나, 우리가 원하는 것은 이것의 정확한 의미를 아는 것이니 일단 프로그래밍과 관련된 지식은 잠시 잊도록 하자.

이것의 수학적 의미는 다음과 같다.

{f : R→R | ∃c, ∃k, ∀x>k , f(x) <= cg(x)} (이때 함수의 정의역은 실수 집합 외에 자연수 집합도 가능하다.)

그래서 이게 뭐냐고? 정의역과 치역이 실수인 함수 f에 대하여, 어떤 상수 c와 k가 존재하고 모든 k보다 큰 x에 대해 f <= cg 일때

f(x) = O(g(x))라는 의미다. 여전히 무슨 소린지 모르겠다고? 솔직히 나도 문장으로 풀어놓고 보니 뭔 소린지 납득이 안 된다.

더 직관적으로 이해해보자. 어떤 상수 c가 존재하여 f <= cg 임은, g를 상수개만큼 더한 값이 f보다 항상 크거나 같음을 의미한다.

이를 시각적으로 이해하면,

파란색 그래프와 초록색 그래프에 대하여, 파란색 그래프에 곱해지는 상수가 항상 양수임을 가정한다면, 어느 시점에 대해서 항상 초록색 그래프보다 위에 있음을 추정 할 수 있을 것이다.

지금까지 설명 한 것을 쉽게 설명하자면, 내가 복잡도를 구하고 싶은 함수보다 항상 상수배가 크거나 같은 함수, 즉 내가 구하고 싶은 함수의 최악의 케이스, 또는 최악보다 더 안좋은 케이스이다.(함수가 커지면 복잡도가 큰 것과 같다)

한번 수식으로 이해해보도록 하자!.

f = 1 + 2 + 3 . . . . + n이 있다고 하자. n이 양수인 자연수라는 가정하에, g = n + n + n . . . . + n = n^2 이다.

그런데, c가 1(이거나 더 큰 수) 이면 항상 f <= cg 가 된다. 즉, f(n) = O(g(n))로 표기할 수 있는 것이다.

그런데, 한가지 의문점이 들 수 있다. "f <= cg를 만족하는 g가 유일한가?"라는 것이다.

예를 들어, 위의 f에 대해 f <= cg 를 만족하는 g(n) 은 n*3, n^n, n!, 2^n 등 무수히 많다.

그러면 f = O(n*3), f = O(n*n), f = O(n!), f = O(2^n)이 다 가능하냐고?! 된다. 된다고.

하지만, 우리는 적합한 수준의 최악의 케이스를 찾아내는 것이 중요한 것이니, 위와 같이 생각하지는 말자.

이걸 간단하게 생각하는 방법은 다음과 같다. x → ∞ 일때 f의 증가 속도와 g의 증가 속도가 가장 비슷한 g를 선택하면 된다.

더욱 간단하게 생각하는 방법은, 그냥 직관적으로 f와 g가 비슷한 모양인걸 찾으면 된다.

이제 Big-Omega 와 Big-Theta에 대해서 알아보자.

Big-Omega의 표기법은 다음과 같다.

f(x) = Ω(g(x))

얘는 위의 Big-O를 이해했다면 쉽다. 수학적으로는 다음과 같다.

{f : R→R | ∃c, ∃k, ∀x>k , f(x) >= cg(x)} 이번엔 f가 cg보다 크거나 같은 경우를 바뀌었다.

Big-O가 최악의 케이스를 판별하는 것이었으니, 얘는 최선의 케이스를 찾아준다고 생각 할 수 있다.

그리고 그게 맞다!

예를 들어, f(n) = n^n = n*n*n*n . . . . *n , g(n) = 1*2*3* . . . . *n = n! 이라면 cg <= f를 만족한다.

즉, n^n = Ω(n!) 이다.

마지막으로 Big-Theta가 남았다.

이것의 표기는 다음과 같다.

f(x) = θ(g(x))

이것의 수학적 정의는 다음과 같다.

{f : R→R | ∃c1, ∃c2, ∃k, ∀x>k , c1g(x) <=f(x) <= c2g(x)}

이 친구에 대해서 앞에 친구들을 짬뽕한 느낌이 든다면, 그건 사실이다. 이것의 수학적 버전을 더 간략한 버전으로 만들어보자.

( f(x) = O(g(x) ) ∧ ( f(x) = Ω(g(x)) )

Big-O가 최악의 케이스, Big-Omega가 최선의 케이스라면 얘는 뭘까? 얘는 최선과 최악이 같은 경우, 즉 가장 일반화된, 가장 유용한 복잡도이다.

~~근데 왜 Big-O를 제일 많이 쓰는지는 모른다.~~

앞에서 Big-O를 설명할때 g(x)가 유일하지 않다고 했던 것 기억하는가? 이 친구의 경우 g(x) 자체의 상수계수가 1이라고 가정한다면, g(x)는 거의 항상 유일하다. 여기까지가 복잡도에 대한 설명의 끝이다.

마지막으로 가장 널리 쓰이는 몇가지 복잡도들을 소개하고 마치도록 하겠다.

O(1) : 상수복잡도

O(n^b) : 가장 흔히 보이는 복잡도. 특히 b = 1인 경우는 선형탐색의 시간복잡도로 유명하다.

O(a^n) : 증가율이 상당히 큰 복잡도. 특히 재귀함수의 시간복잡도로 유명하다.

O(log n) : 로그로 이루어진 복잡도. 이진 탐색의 시간복잡도로 유명하다.

O(nlog n) : 로그와 일반항이 곱해진 복잡도. 병합정렬의 시간복잡도로 유명하다.

O(n!) : 증가율이 매우 매우 큰 복잡도. 볼일은 거의 없다.

O(n^n) : 일반화된 복잡도 중 증가율이 가장 큰 복잡도. 마찬가지로 볼일은 많이 없다.

번외) O(∞) : 시간이 무한대인 복잡도. 메모리에서 이런 복잡도가 정의된다면, 컴퓨터가 터질지도 모른다....

진짜 볼일 없겠지만, 굳이 예를 들자면 어떤 배열에서 아무 수나 랜덤으로 선택해서 원하는 수가 발견되기 전까지 탐색 하는 알고리즘의 시간 복잡도가 이와 같다.

써놓고 보니까 무슨 헛소리 늘어놓은 것 같아서 마음에 좀 걸림;

;

위에서 말했듯 지적은 언제나 환영이고 긴 글 읽어줘서 고마워

댓글 글쓰기

Random_Access

2024-04-18 15:20:37 답글

랜덤으로 선택: 구체적으로 worst time인 경우.

펼쳐보기▼

선형사상

2024-04-18 15:21:13 답글

아 맞네 Best는 O(1)이겠구나

펼쳐보기▼

Random_Access

2024-04-18 15:25:13 답글

빅오는 최악의 케이스를 설명한다 이 서술 잘못됨

펼쳐보기▼

선형사상

2024-04-18 15:25:23 답글

헉

펼쳐보기▼

선형사상

2024-04-18 15:26:21 답글

*수정됨

그...무엇이 잘못된건지 알려줄수 있을까?

펼쳐보기▼

Random_Access

2024-04-18 15:30:25 답글

음..미안 최악 케이스의 복잡도랑 헷갈린듯

펼쳐보기▼

선형사상

2024-04-18 15:30:55 답글

휴 다행이군!

펼쳐보기▼

MiA

2024-04-18 20:48:06 답글

밑에 나랑 다른애가 말한게 니가 말하고싶었던거지?

펼쳐보기▼

unkit

2024-04-18 15:30:44 답글

사실 이런게 커뮤니티의 순기능이자 장점 아닐까?
사람들끼리 이런 지식얘기를 한다는게 정말 좋은 것 같음

펼쳐보기▼

선형사상

2024-04-18 15:34:11 답글

판도라_

2024-04-18 16:48:32 답글

ㄹㅇ 서로 제대로 이해했는지 서로 봐줄 수 있어 좋은듯

펼쳐보기▼

판도라_

2024-04-18 16:48:00 답글

선형사상

2024-04-18 16:48:17 답글

Psi_Che

2024-04-18 17:20:57 답글

따따봉입니다

펼쳐보기▼

선형사상

2024-04-18 23:10:46 답글

세즈오리스

2024-04-18 17:54:02 답글

*수정됨

입문자들을 위해 헷갈릴만한 부분 첨언하자면,
빅오가 최악, 빅오메가가 최선, 빅세타가 평균의 경우라고 설명을 주로 하는데, 맞는 말이긴 하지만 오해의 소지가 있다고 봄
(어떤 알고리즘의 시간복잡도를 최악은 O, 최선은 Omega, 평균은 Theta로 표기하는게 옳다고 받아들이기 쉬움, 아마도)

좀 더 직관적으로 표현하자면 알고리즘의 수행시간(스텝수)을 나타내는 함수에서 점근적으로 O는 상한(upper bound)을 표기하는 방법이고, Omega는 하한(lower bound), Theta는 그 사이 평균을 표기하는 방법임. 최선, 최악, 평균의 경우는 직접 알고리즘을 분석해서 알아내야 하는거고. 간단한 예로 선형탐색은 찾고자 하는 원소가 가장 앞에 있는 경우가 최선, 가장 마지막에 있는 경우가 최악. 따라서, 어떤 알고리즘이 최선의 경우에 O(n), Omega(n)이라는 뜻은 최선의 경우에 아무리 시간이 많이 걸려도 n이하이고 적게 걸려도 n이상이라는 뜻

그러므로, 알고리즘의 최악, 최선, 평균의 경우 모두 O, Omega, Theta 표기법이 존재할 수 있음. (예를들어, 선형탐색의 경우 [최선: O(1), 평균: O(n), 최악: O(n)], 퀵소트의 경우 [최선: O(nlogn), 평균: O(nlogn), 최악: O(n^2)] 로 표기됨)

여담으로, O가 상한이기에 O(n)인 알고리즘을 O(n^2)이라고 표기해도 말은 됨. 그냥 그럴 의미가 없을 뿐이라 안하는거

O를 많이 쓰는 이유는 구하기 상대적으로 편하고 알고리즘이 아무리 오래걸려도 표기된 시간안에 돌아간다고 표현되니까 쓰는듯. 좀 더 엄밀히 구할 수 있고, 그렇게 표기하고 싶을때 Theta를 많이 쓰는거 같음. 이건 그냥 내 생각

펼쳐보기▼

MiA

2024-04-18 20:30:28 답글

*수정됨

이건 빅오가 정확히 뭘 나타내는가가 좀 어려운 개념이라 헷갈리기 쉬운데, 'O(f(x))는 입력의 크기에 따른 증가율이 f(x)이하인 함수의 집합'이고, 오메가라면 이상인 집합을 나타내는거라 그래. 
직관적으로 생각하면 '최소 이정도는 걸린다.' '최대 이만큼른 걸린다.' 라는 뜻이지만 그건 어디까지나 입력의 크기에 따른 증가율일 뿐임.

가령 Bogo 정렬 알고리즘의 시간복잡도는 최선의 경우(모든 시도가 hit하는 경우) 입력이 아무리 커져도 O(n)의 증가율을 보이고, 최악의 경우 입력이 얼마든 (영원히 hit하지 않는다면) O(∞)이 될 가능성이 존재함. 

알고리즘이 입력에 대하여 최적인가나, 난수의 개입과 상관없이 입력에 따른 증가율만 알려준다는거야


오를 많이 쓰는 건 심플하게 오메가보다 오가 더 현실적으로 의미있는 값이라서 그래. 항상 오메가에 가까운 케이스로 고정된 거 아니면 오메가만 단독으로 알아도 쓸데가 별로 없음..

세타는 시행 자체가 대수의 법칙의 영향을 받는 빅데이터 이런거에서 오보다 더 의미가 있고

펼쳐보기▼

선형사상

2024-04-19 01:07:58 답글

어케 보면 f(x) = O(g(x))를
f(x)의 상계인 x의 집합 g(x)로 볼수도 있는건가?

펼쳐보기▼

MiA

2024-04-19 05:18:17 답글

*수정됨

어케보면이 아니라 그게 정의임.
그러니까 모든 입력에 대하여 동일한 적합도를 가진다고 가정할 때 빅 오가 최악이라고 할 수 있는거고, 그걸 간단히 말해서 최대로 오래걸리는 경우가 빅오라고 많이 말하지.
실제로는 위에서 말한 것처럼, 실제 해당 알고리즘이 가장 오래걸리는 케이스와는 상관없이 ' 입력의 크기 변화에 따르는 증가율' 만을 나타낸다는거고

펼쳐보기▼

선형사상

2024-04-19 05:20:36 답글

Zeya

2024-04-19 05:28:11 답글

그럼 일반적으로 표기하는 빅O는 가능한 빅O 집합에서의 최솟값인건가? 그게 의미있는 값이라서?

펼쳐보기▼

MiA

2024-04-19 05:37:09 답글

*수정됨

n(1)이든 n log n이든 최소값은 0이야..  입력의 크기가 0이라 연산을 하지 않는 경우...

그냥 빅오만 표기하면 됨...

펼쳐보기▼

Zeya

2024-04-19 05:39:54 답글

내가 모호하게 물어본듯 위에 글 다시 읽으니까 알겠음

펼쳐보기▼

MiA

2024-04-19 05:57:26 답글

*수정됨

아. 무슨의민지 알았는데
보고정렬이라면 n(1)을 표기할지 n(무한)을 표기할지 묻는거지?

의미있는 값을 묻는다면 최대 최소 평균 다 의미있는 값임.

보통은 정렬 알고리즘 이런 건 최악의 케이스로 계산해서 시간복잡도 O(n)이 보장되는 알고리즘 같은 표현을 주로 하는 듯.


보고정렬로 빅데이터 처리를 한다거나 하는(...) 많은 시행횟수로 규칙 없는 완전랜덤 입력이면 평균이 중요하니까 O(n * n!)이 제일 중요한 값이겠지.

펼쳐보기▼

Zeya

2024-04-19 06:01:11 답글

ㅋㅋㅋㅋ 예시가 무섭네 ㄱㅅㄱㅅ

펼쳐보기▼

세즈오리스

2024-04-19 06:46:33 답글

보충설명감사
졸릴때 적은거라 이제보니 하고싶은말에 빠진 부분도 있고 이상하게 말한것도 있는데 잘 짚어줬네
내가 공부할 때 이게 좀 헷갈렸음 수업에선 교수님도 대충 알려주고 ㅋㅋ 알고리즘이랑 같이 보니까 감 좀 잡겠더라

펼쳐보기▼

MiA

2024-04-19 06:58:55 답글

*수정됨

알고리즘 제대로 보기도 전에 저거 설명만 듣고 이해가 가면 솔직히 수학과를 가셔야

펼쳐보기▼

세즈오리스

2024-04-19 07:03:24 답글

ㄹㅇㅋㅋ

펼쳐보기▼

neon_nyx

2024-04-19 00:46:50 답글

선형사상

2024-04-19 00:47:14 답글

해방된썬브고정

2024-04-19 19:15:34 답글

일단개추 근데 어렵다역시 아 ㅋㅋㅋ

펼쳐보기▼

선형사상

2024-04-20 00:04:07 답글

붕탁마Ang

2024-04-24 01:19:38 답글

맙소사! 난 하나도 이해가 안돼!

펼쳐보기▼

글쓰기

전체글 코딩 채널

최근 최근 방문 채널

최근 방문 채널

전체

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27900268

2882860 던전앤파이터 🎨창작 4월달에 그린것들 [6]

기린그림그린 11분전 47 5

2882859 소프트펨돔 짤 (약고어?주의)강제로 삽입섹스 당하는 [6]

아모르겠다 6시간전 1136 10

2882858 Fate/Grand Order 🔞짤/만화 2일 뒤에 오실분 [2]

masterK 13시간전 302 5

2882857 순애 취향 신혼의 서큐버스 manhwa [4]

우편물레이블마법사 4시간전 941 18

2882856 트릭컬 RE:VIVE 🖼️ 짤 미리보는 크레페 크기 비교 [10]

니네공병뭐하시노 2시간전 230 11

2882855 트릭컬 RE:VIVE 🖼️ 짤 교쥰니한테 사탕ㅅㅅ를 빼앗긴 캬롯 [5]

순수맘 2시간전 215 13

2882854 암캐자위 🔞동인지&CG 개변태 거유JC가 바이브 자전거로 자위하는 만화

두루치기백반 04-28 571 10

2882853 툴리우스 폴4 2차대전 모드하다가 [18]

November62 6시간전 142 7

2882852 원신 정보 검귀 모으기 자세히 (영상) [10]

ㅇㅇ 10시간전 761 12

2882851 붕괴 스타레일 뜬뜨든뜨든~ 초반~에 죄송~하지만 [15]

vokadi 3시간전 424 17

2882850 AI 채팅 일반 난 gpt랑 위자드 대사스타일이 좋음 [12]