• [프로그래머스] 전화번호 목록 Java 풀이

    2021. 4. 24.

    by. SDev

    728x90

     

    문제 설명

    전화번호부에 적힌 전화번호 중, 한 번호가 다른 번호의 접두어인 경우가 있는지 확인하려 합니다.
    전화번호가 다음과 같을 경우, 구조대 전화번호는 영석이의 전화번호의 접두사입니다.

     

    • 구조대 : 119
    • 박준영 : 97 674 223
    • 지영석 : 11 9552 4421

     

    전화번호부에 적힌 전화번호를 담은 배열 phone_book 이 solution 함수의 매개변수로 주어질 때, 어떤 번호가 다른 번호의 접두어인 경우가 있으면 false를 그렇지 않으면 true를 return 하도록 solution 함수를 작성해주세요.

     

    제한 사항

    • phone_book의 길이는 1 이상 1,000,000 이하입니다.
      • 각 전화번호의 길이는 1 이상 20 이하입니다.
      • 같은 전화번호가 중복해서 들어있지 않습니다.

     

    입출력 예제

    phone_book return
    ["119", "97674223", "1195524421"] false
    ["123","456","789"] true
    ["12","123","1235","567","88"] false

     

    입출력 예 설명

    입출력 예 #1
    앞에서 설명한 예와 같습니다.

    입출력 예 #2
    한 번호가 다른 번호의 접두사인 경우가 없으므로, 답은 true입니다.

    입출력 예 #3
    첫 번째 전화번호, “12”가 두 번째 전화번호 “123”의 접두사입니다. 따라서 답은 false입니다.

     


     

    알림

    2021년 3월 4일, 테스트 케이스가 변경되었습니다. 이로 인해 이전에 통과하던 코드가 더 이상 통과하지 않을 수 있습니다.

     

     

    문제 설명에서는 전화번호 사이에 공백이 있어서 약간 긴장했지만, 다행히 입출력에서는 모든 번호가 붙여서 들어온다.
    이 문제는 이전에 풀어본 적이 있던 코드인데, 새로운 효율성 테스트 케이스가 들어오면서 이전에 풀었던 코드가 오답 처리됐다.

     

    다시 풀면서 어떻게 해시를 활용해야 할지 막막했는데, 결국 다른 분의 풀이를 참고해 문제를 해결했다. 그런데 딱히 해시를 쓸 이유가 없는 풀이다.(해시로 풀 수 있지만... 굳이 이용하지 않아도 된다. 이용해 푸는 방법도 새로운 풀이에 더해 추가!) 그래서 이전 풀이와 새로운 풀이를 비교해 보려고 한다.

     

     

    이전 풀이

    (효율성 테스트 케이스 3, 4 실패 - 시간초과)

    풀이 접근 방법은 아래와 같다.

    1. phone_book을 처음부터 마지막 전까지 돌아가며 i번째 번호를 고른다.

    2. i+1번째 번호부터 phone_book의 마지막까지 돌아가며 j번째 번호를 고른다.

    3. i번째 번호와 j번째 번호를 비교하며 길이가 더 짧은 번호의 해시값을 구하고, 길이가 더 긴 번호의 해시값과 비교해본다.

    4. 3번에서 동일한 해시값을 갖는 경우가 있으면 false를 반환하고, 끝까지 그런 경우가 없다면 true를 반환한다.

     

     

    제한사항에서 phone_book의 길이는 1 <= phone_book.length <= 1,000,000이다.
    1번 반복문과 2번 반복문을 중첩해서 돌려야 하기 때문에 시간 복잡도가 O(1,000,000 ^ 2)인데, 일반적으로 여겨지는 억(초)단위 연산량을 훨씬 넘어서기 때문에, 당연히 시간초과를 예상해야 맞다. 

    import java.util.*;
    public class Solution {
        public static boolean solution(String[] phone_book) {
        	//phone_book의 마지막 전 원소까지 반복
        	for(int i=0; i<phone_book.length -1; i++) {
        		//String.hashCode(): 문자열의 해쉬코드 반환
        		//i번째 전화번호에 해쉬코드 부여
        		int hashPhone = phone_book[i].hashCode();
        		int len = phone_book[i].length();
        		
        		//j는 i+1부터 phone_book의 마지막 원소까지 탐색, i가 증가할 때마다 초기화
        		for(int j=i+1; j< phone_book.length; j++) {
        			//i번째 전화번호보다 j번째 전화번호의 길이가 길고,
        			//i번째 전화번호의 길이만큼 j번째 전화번호의 substring의 해쉬값이 같음.(j가 i 문자열로 시작)
        			if(phone_book[j].length() >=len && 
        					hashPhone == (phone_book[j].substring(0, len).hashCode())){
        				return false;
        			}
        			//j번째 전화번호보다 i번째 전화번호의 길이가 길고,
        			//j번째 전화번호의 길이만큼 i번째 전화번호의 substring의 해쉬값이 같음.(i가 j 문자열로 시작)
        			else if(phone_book[j].length()<len && 
        					phone_book[i].substring(0, phone_book[j].length())
        					.hashCode() == phone_book[j].hashCode()) {
        				return false;
        			}
    			}
        	}
        	//위 상황에 해당하는 case가 없으면 true 반환
            return true;
        }
    }

     

     

     

    새로운 풀이

    (정답)

    새로운 풀이는 생각해내기가 약간 어려운데, 생각만 해낸다면 구현은 어렵지 않다.

    접근 방식은 아래와 같다.

    1. 주어진 phone_book을 정렬한다.(Default가 오름차순이므로 Arrays.sort() 메서드를 이용하면 된다.)

    2. 정렬된 상태이므로 첫 번째 원소부터 마지막-1번 원소까지 돌아가며 i번째 번호를 고른다.

    3. (i + 1)번째 번호가 i번째 번호로 시작하는지 살펴보고, 맞다면 false를 바로 return한다.(String 클래스의 startsWith()메서드)

    4. 2번 반복문이 끝날 때까지 return되지 않았다면 찾는 케이스가 존재하지 않는 것이므로, true를 return한다.

     

    import java.util.*;
    
    class Solution {
        public boolean solution(String[] phoneBook) {
            Arrays.sort(phoneBook);
            for (int i = 0; i < phoneBook.length - 1; i++){        
                if (phoneBook[i + 1].startsWith(phoneBook[i])){
                    return false;
                }
            }
            return true;
        }
    }

     

    String을 정렬하게 되면 동일한 알파벳을 갖되 그 뒤에 더 알파벳이 붙어 있는 경우(= 접두어 뒤에 알파벳이 더 붙어 있는 경우) 그 뒤로 위치하게 된다. 정렬을 이용하면 바로 다음 원소만 비교해 검사할 수 있으므로, 반복문을 중첩해 검사하는 것보다 훨씬 연산량을 줄일 수 있다.

    기존 풀이 O(n^2) ----> 새로운 풀이 O(n log n)

    물론 이 풀이에서는 해시를 이용하지 않는데, 굳이 해시를 이용하겠다면 startsWith()메서드를 이용하지 않고 i번째 원소의 길이만큼 i+1번째 원소를 슬라이싱해서 각각의 해시코드를 구한 뒤 비교하면 되겠다. 

     

     

    문제 풀이는 여기 까지인데, 사실 String의 정렬을 이용하기 앞서 정렬을 이용하면 바로 다음 것만 비교해도 괜찮은지가 의심스러워 공식 API 문서에서 String의 정렬 기준을 확인해봤다. 정렬할 때 길이가 같은 것을 혹시나 먼저 배치한다거나 그런 일이 있다면 안되니까.. (지금 생각하니 당연히 사전도 그렇게 안되어 있는데 왜 그랬나 모르겠다)

    그보다! 그래서 String 클래스의 정렬 기준을 확인하다 전혀 예상하지 못한 포인트에서 궁금한게 생겼는데,
    새로운 지식을 얻는 계기가 됐다.

     


    뭔지 궁금하면 아래 포스팅으로 보러오세요!

    sdesigner.tistory.com/97

     

    Java Character 클래스, toUpperCase()와 toLowerCase() 중 하나로는 완전한 비교가 불가능하다?!

    프로그래머스의 해시 카테고리에서 전화번호 목록 문제를 풀다가, 문득 String 클래스의 정렬 방식이 어떻게 구현돼있는지 궁금해져 코드를 까봤다. private static class CaseInsensitiveComparator implements C.

    sdesigner.tistory.com

     

    댓글