문제 1 – 아이디 추천
- 정답률 : 57.50%
- 문제 1 풀러 가기
카카오에 입사한 신입 개발자 네오는 “카카오계정개발팀”에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. “네오”에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해 주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.
- 아이디의 길이는 3자 이상 15자 이하여야 합니다.
- 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
- 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.
“네오”는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id라고 한다면,
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
예를 들어, new_id 값이 “…!@BaT#*..y.abcdefghijklm” 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.
1단계 대문자 ‘B’와 ‘T’가 소문자 ‘b’와 ‘t’로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"
2단계 ‘!’, ‘@’, ‘#’, ‘*’ 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"
3단계 ‘…’와 ‘..’ 가 ‘.’로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"
4단계 아이디의 처음에 위치한 ‘.’가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"
7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"
따라서 신규 유저가 입력한 new_id가 “…!@BaT#*..y.abcdefghijklm”일 때, 네오의 프로그램이 추천하는 새로운 아이디는 “bat.y.abcdefghi” 입니다.
문제
신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, “네오”가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.
제한사항
new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.
[입출력 예]
nonew_idresult
| 예1 | "...!@BaT#*..y.abcdefghijklm" | "bat.y.abcdefghi" |
| 예2 | "z-+.^." | "z--" |
| 예3 | "=.=" | "aaa" |
| 예4 | "123_.def" | "123_.def" |
| 예5 | "abcdefghijklmn.p" | "abcdefghijklmn" |
입출력 예에 대한 설명
– 입출력 예 #1
문제의 예시와 같습니다.
– 입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "z-+.^." → "z-.."
3단계 "z-.." → "z-."
4단계 "z-." → "z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-" → "z--"
– 입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "=.=" → "."
3단계 변화 없습니다.
4단계 "." → "" (new_id가 빈 문자열이 되었습니다.)
5단계 "" → "a"
6단계 변화 없습니다.
7단계 "a" → "aaa"
– 입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id(“123_.def”)는 변하지 않습니다. 즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.
– 입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p" → "abcdefghijklmn." → "abcdefghijklmn"
7단계 변화 없습니다.
문제 풀이
1번 문제는 가장 낮은 난이도에 해당하는 일명 몸풀기 문제입니다. 1단계~7단계에서 지시하는 그대로 구현하면 되기 때문에, 특별한 알고리즘보다는 정확한 구현이 필요한 문제입니다.
본 문제는 new_id의 길이가 1,000으로 매우 작습니다. 따라서, new_id의 길이를 n이라고 할 때, O(n^2) 성능의 알고리즘으로 구현해도 제한 시간 내 답을 구할 수 있습니다.
보다 효율적으로 구현한다면 O(n) 성능의 알고리즘으로 구현을 할 수도 있습니다. new_id에서 필요 없는 문자들을 직접 제거하지 말고, new_id를 앞에서부터 검사하면서 유효한 문자(제거되지 않아야 할 문자)만 추려서 새로운 문자열 변수(new_id_1)에 붙여나가는 방법을 사용하면 됩니다.
제출 코드
def solution(new_id):
#1단계
new_id=new_id.lower()
answer = ''
#2단계
for i in range(len(new_id)):
if new_id[i].isdecimal() or 97<=ord(new_id[i])<=122 or ord(new_id[i])==45 or ord(new_id[i])==95:
answer+=new_id[i]
continue
if ord(new_id[i])==46:
answer+=new_id[i]
#3단계
res=[]
for i in range(len(answer)):
if i>0:
if res[-1]=="." and answer[i]==".":
continue
res.append(answer[i])
answer = ''.join(res)
print(answer)
#4단계
if answer and (answer[0]=="." or answer[-1]=="."):
answer = answer.strip(".")
print(answer)
#5단계
if not answer:
answer='a'
#6단계
if len(answer)>=16:
answer=answer[:15]
while answer[-1]==".":
answer=answer[:-1]
#7단계
if len(answer)==1:
answer+=answer[0]
answer+=answer[0]
elif len(answer)==2:
answer+=answer[1]
return answer
새로 알게된 사실
- str.strip() 함수는 원본 수정이 안되기 때문에 리턴값을 활용해야한다.
- 4단계 코드 수정 전에는 strip()함수를 사용하지 않고 "."이 앞에 나올 때, 뒤에 나올 때 두가지 케이스로 구분하여 해당 요소를 직접 제거해주었는데, 이렇게 하게 되면 앞과 뒤 둘다 에서 "."이 나오는 경우에는 둘중 하나만 지우게 되므로 틀리게 된다. 그 모든 케이스를 분기하는 건 너무 노가다이니까 strip()함수를 사용하는 게 현명함
개선 코드(3단계)
def solution(new_id):
#1단계
new_id=new_id.lower()
answer = ''
#2단계
for i in range(len(new_id)):
if new_id[i].isdecimal() or 97<=ord(new_id[i])<=122 or ord(new_id[i])==45 or ord(new_id[i])==95:
answer+=new_id[i]
continue
if ord(new_id[i])==46:
answer+=new_id[i]
#3단계(개선)
while ".." in answer:
answer = answer.replace("..",".")
#4단계
if answer and (answer[0]=="." or answer[-1]=="."):
answer = answer.strip(".")
print(answer)
#5단계
if not answer:
answer='a'
#6단계
if len(answer)>=16:
answer=answer[:15]
while answer[-1]==".":
answer=answer[:-1]
#7단계
if len(answer)==1:
answer+=answer[0]
answer+=answer[0]
elif len(answer)==2:
answer+=answer[1]
return answer
3단계를 개선한 코드이다. 제출 코드를 작성하기 전에 이와 똑같이 했었으나 str.replace() 함수가 원본을 수정하는 줄 알아 리턴값을 활용하지 않았고 정답 처리 받지 못해 수정했었다.
익숙치 않은 함수를 사용할 때는 리턴값을 확실하게 파악해서 사용하자 삽질하지 말구 ㅠ