유니코드 관련 질문인데요....

컴퓨터공학 채널

알림 알림 중 알림 취소

구독자 3394명 알림수신 19명 @SeworL

컴퓨터를 좋아하는 사람들의 모임

유니코드 관련 질문인데요....

나는새

추천 0 비추천 0 댓글 31 조회수 327 작성일 2020-08-14 13:36:06

https://arca.live/b/programmers/6159384

여기 혹시 문자열을 입력하면 동일값 가지는(UTF-8기준으로) 문자를 1개 빼고 모두 지워주는 방법 알려주실 수 있으실까요??

마치 한글2018에서 Ctrl+F누르면 나오는 프로그램같은.........

댓글 [31] 글쓰기

윾싀발놈

2020-08-14 14:10:42 답글

입력한 문자에 해당하는 utf-8 바이트를 지운다는뜻? 정확히 먼솔

펼쳐보기▼

나는새

2020-08-14 14:18:24 답글

유니코드도 종류가 있는데, 그 중 가장 호환성이 높은게 UTF-8이라서 적은겁니다. 예시는 ex)'가갉가닭앍ㄱㅏ갉궯'같은 문자열이 있으면 '가갉닭앍ㄱㅏ궯'으로 변환되는 거요.

펼쳐보기▼

윾싀발놈

2020-08-14 14:20:53 답글

걍 for문 돌리면 끝인데

펼쳐보기▼

나는새

2020-08-14 14:34:29 답글

그 코드를 정확히 어떻게 써야할지를 잘 모르거든요.... 그래서 혹시나 도움을 받을 수 있을까 싶어서 글을 올려봤어요

펼쳐보기▼

나는새

2020-08-14 14:36:05 답글

제가 API를 제대로 몰라서 파일에 접근하는 방법도 잘 모르거든요;; 너무 무리한 부탁이면 글을 내릴게요......

펼쳐보기▼

컴공챈오세요

2020-08-14 14:42:33 답글

아주 적당한 주제이긴 한데. 질문에 작성자의 목표나 사용하는 환경에 대한 설명이 부족한 것이 아닐까?

펼쳐보기▼

나는새

2020-08-14 14:45:40 답글

목표는 일본어 유니코드문자를 모두 정리하는 거예요

펼쳐보기▼

나는새

2020-08-14 14:46:00 답글

사용환경이라면 무슨 의미일까요?

펼쳐보기▼

나는새

2020-08-14 14:52:10 답글

죄송해요. 제가 최소한 어느정도로는 알려야 될텐데 그걸 잘 모르겠네요...https://arca.live/b/programmers/6160700?p=1

펼쳐보기▼

컴공챈오세요

2020-08-14 14:58:14 답글

ㄴㄴ 덧글에 충분히 설명되어있는 듯.

펼쳐보기▼

네트워크

2020-08-14 14:18:09 답글

어디서 뭘 하고싶은거임

펼쳐보기▼

나는새

2020-08-14 14:19:19 답글

일본어 유니코드 문자를 정리하는 게 목적이에요

펼쳐보기▼

네트워크

2020-08-14 14:25:20 답글

걍 파이썬 같은걸로 간단하게 하면 될거같은데? 파이썬3부터는 utf-8 기본지원이라 문자열 처리도 문제없을거고

펼쳐보기▼

나는새

2020-08-14 14:33:12 답글

오! 그렇군요. 그런데 제가 자바만 겉햟기 수준으로 배워서 지금부터 파이썬을 배우기엔 부담이 너무 커서 혹시 도움을 받을 수 있을까 싶어 글을 올려봤어요

펼쳐보기▼

네트워크

2020-08-14 14:36:02 답글

저정도 작업은 자바로도 당연히 가능함. 그런데 원문이 utf-8인거 맞음? utf-16이나 shitf-jis가 아니라?

펼쳐보기▼

나는새

2020-08-14 14:36:38 답글

네 UTF-8로 저장했어요

펼쳐보기▼

네트워크

2020-08-14 14:37:28 답글

님이 저장한거 말고 원문 인코딩이 뭐냐가 중요한데 그 원문을 어디서 가져온거에요?

펼쳐보기▼

나는새

2020-08-14 14:40:05 답글

한글모음은 인터넷에서 다운받았고요. 그거 자체는 UTF-8(BOM)이에요. 그리고 그걸 다시제가 ASNI로 저장후에 시스템로캘을 일본어로 바꿔서 일본식뷁어 띄우고 그걸 다시 UTF-8로 저장했어요

펼쳐보기▼

네트워크

2020-08-14 14:43:41 답글

*수정됨

ㅇㅎ 일단 원하는걸 할 수 있냐면 따지자면, 일단 자바로도 가능한 작업이고, 이런거 해주는 자바 함수가 아마 있을거같은데 혹시 없으면 시간은 좀 느려도 아래처럼 하면 됨.
utf-8 형태로 파일을 열고 한글자 한글자씩 읽으면서
처음 보는 글자면 리스트에 넣고 다음으로 넘기고
이미 리스트에 있는 글자면 글 뒷부분 전체를 보고 해당 글자는 싹다 삭제하는 식으로 반복하면 될 듯?

펼쳐보기▼

나는새

2020-08-14 14:47:32 답글

어.... 그러면 혹시 코드가 어떻게 될까요.... API에 대해 정말 겉햟기로만 알거든요...

펼쳐보기▼

네트워크

2020-08-14 14:52:28 답글

코드를 짜줘야 한다면 저도 한가한 사람이 아니라서 이만... 근데 글쓰는거 보니까 뭔가 중요하고 꼭 하고싶어하는 작업같은데 이거 두세시간만 투자하면 직접 짤 수 잇을 것 같은데?

펼쳐보기▼

나는새

2020-08-14 14:52:57 답글

그럼 혹시 필요한 API만 적어주실 수 있으실까요??

펼쳐보기▼

나는새

2020-08-14 14:53:39 답글

아주 기본적인거는 아니깐 그런건 제가 따로 찾아볼께요

펼쳐보기▼

네트워크

2020-08-14 14:54:12 답글

String이나 File 쪽에 있을거임

펼쳐보기▼

나는새

2020-08-14 14:54:58 답글

file:///C:/Program%20Files/Java/jdk1.8.0_221/docs/index.html 여기서 찾으면 되나요??

펼쳐보기▼

네트워크

2020-08-14 14:56:36 답글

그거 보기 엄청 힘들건데... 구글링하면 한글자료로 쉽게 설명한거 많아요...

펼쳐보기▼

나는새

2020-08-14 14:59:02 답글

오! 그렇네요 감사합니다!!

펼쳐보기▼

익명_Engine

2020-08-15 20:24:04 답글

저건 리스트 말고 해쉬맵을 씁시다

펼쳐보기▼

나는새

2020-08-14 14:29:01 답글

UTF-8이 다른 언어에서도 대체로 본래 문자가 보존되어서 UTF-8을 기준으로 삼았는데요. UTF-8에서는 권역별로 바이트를 할당하는데, 문제는 동아시아권역에 일본어와 한국어 등이 있어서 코드 입력으로는 중복되는 경우가 많더라고요... 그래서 한국어에서 나오는 모든 문자-가,갸,......,ㄱ,ㄴ,ㄷ,ㄹ,....을 ANSI로 저장한 후에 설정-시간 및 언어--언어-관리 언어 설정-시스템 로캘 변경-일본어로 바꾼뒤 출력되는 일본식뷁어(일본 유니코드는 한글보다 바이트가 더세분돼서 배분되기때문에 한글에서 하나의 문자로 취급하는 것도 여러문자로 쪼개져서 반복되는게 나오는 거 같아요)를 UTF-8로 다시 저장후 시스템 로캘을 한국어로 변경했어요

펼쳐보기▼

나는새

2020-08-14 14:31:27 답글

그런데 반복되는 문자가 여러개 있길래 한글프로그램으로 조금씩 종류별로 분류했는데 몇시간동안 해도 8578자가 남아서요.......

펼쳐보기▼

익명_Engine

2020-08-15 20:26:27 답글

걍 깔끔하게 유니코드 이딴 거 다 해결하고 뭐 중복 없앤다던지 기타등등 알고리즘 퀴즈 식으로 코드만 짜달라고 하면 그냥 바로 짜 줄 수 있을 거. 그 외에는 귀찮고 하던 게 아니라 찾아볼 시간 아까우니 안 할 거고

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 공지사항 질문/조언 읽을거리

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30689463

공지 컴퓨터공학 채널 규칙 (2023-10-05 개정)

SeworL 2023.10.05 1186

공지 빠르게 원하는 답변을 받기 위해 피해야 할 질문 방식

유자차 2022.07.02 2480

공지 신문고

SeworL 2023.10.07 516

숨겨진 공지 펼치기(1개)

말레볼제 파본 사람 있냐 [1]

R6DYx (115.138) 2020.08.19 1631 0

튜닝은 오버헤드가 심한 것 같습니다. [28]

컴공챈오세요 2020.08.19 181 0

웨일/크롬/파폭 쓰고 있는데. [16]

컴공챈오세요 2020.08.18 218 0

LOL캐릭터 상상해본것 [6]

별이 2020.08.18 210 2

공식 api출시좀 [3]

윾싀발놈 2020.08.17 190 0

아으 코딩 귀찮아 [2]

LeKAKiD 2020.08.17 193 0

게임 만드는 사람있음? [12]

전기수갑 2020.08.17 265 1

외장하드 기록방식 관련해서 물어봐도 됨? [2]

ㅇㅇ (84.16) 2020.08.16 216 0

고수님들 파이썬 기초적인 질문좀 할게여 [6]

게으른농부 2020.08.16 426 0

나는새 2020.08.15 259 -2

고로 아카라이브 라이브러리를 만들었어요 [2]

자바 2020.08.15 527 2

끈질기군. [7]

컴공챈오세요 2020.08.15 1380 3

노트북 화면 [3]

국가보안법위반자 2020.08.15 387 0

노트북 부팅 오류 ㅠㅜ [3]

국가보안법위반자 2020.08.15 454 0

아카라이브 공앱 API [6]

자바 2020.08.15 2295 1

주석을 맞게 표기한 것은?.jpg [5]

컴공챈오세요 2020.08.14 383 0

빅뱅이론- 공돌이가 필요해

컴공챈오세요 2020.08.14 241 1

캡스톤디자인 해야하는데 [1]

네트워크 2020.08.14 512 0

유니코드 관련 질문인데요.... [31]

나는새 2020.08.14 328 0

이런 곳도 있넹 [2]

전기수갑 2020.08.14 148 1

이런 유용한 곳도 있었구나. [2]

몬붕이 2020.08.14 147 1

C언어/커널/리버싱에 관심있으신 분 [4]

컴공챈오세요 2020.08.13 561 2

기술/지식챈 먹으러다니려고 했는데 [12]

컴공챈오세요 2020.08.13 247 0

도지챈 협력채널 요청 들어옴 [2]

윾싀발놈 2020.08.13 140 0

기타도라,사볼(코나스테)을 위한 Web 컨트롤러(아이패드) 어떻게 만들면 좋을까요 [4]

ㅇㅇ (123.111) 2020.08.13 865 0

1일1 파이썬 찬양 [6]

윾싀발놈 2020.08.13 495 0

프로그래밍 언어 수강하시는 학식분들 계시나요? [7]

컴공챈오세요 2020.08.12 269 0

글쓰기

전체글 개념글