Algorithm/Problem solving

[프로그래머스/Python] 42579 베스트 앨범 (Level 3)

jjh0119 2025. 3. 25. 18:37

문제

문제 설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항

genres[i]는 고유번호가 i인 노래의 장르입니다.
plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
장르 종류는 100개 미만입니다.
장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
모든 장르는 재생된 횟수가 다릅니다.


풀이

문제 분류는 해시에 속해있는 문제다.
파이썬으로 문제를 풀고 있으니 딕셔너리를 최대한 활용하는 방향으로 문제를 풀어보려고 했다.

우선 요구사항부터 분석해 보면 genres와 plays가 주어졌을 때 베스트 앨범에 들어갈 노래의 고유 번호 즉 입력 받은 순서대로 붙여진 고유 번호 i를 수록하는 기준에 맞게 정렬해서 반환하라는 뜻이다.

그 기준은 아래와 같은데

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

이 기준대로 정렬을 하기 위해서는

  1. 각각의 장르에 속한 모든 곡의 총 재생 횟수를 기준으로 내림차순으로 장르를 정렬한다.
  2. 각각의 장르에 속한 모든 곡을 각각의 곡의 재생 횟수를 기준으로 내림차순 정렬하되 같은 재생 횟수를 가진다면 고유번호를 기준으로 한다.

이런 절차가 필요하다.

1. 각각의 장르에 속한 모든 곡의 총 재생 횟수를 기준으로 내림차순으로 장르를 정렬한다.

from collections

def solution(genres, plays):
    dict_play = defaultdict(int)
    dict_song = defaultdict(list)
    
    for i, (genre, play) in enumerate(zip(genres, plays)):
        dict_play[genre] += play
        dict_song[genre].append([i, play])

    sorted_genres = sorted(dict_play.keys(), key=lambda g: dict_play[g], reverse=True)

우선 장르 별 총 재생 횟수를 저장할 수 있는 dict_play와
장르 별로 각각의 곡에 대한 정보(고유 번호, 재생 횟수)를 리스트 형태로 저장하는 dict_song을 만들어 준다.

그리고 zip(genres, plays)을 통해 두개의 리스트를 묶고
enumerate()를 통해 인덱스를 매겨주면 이 인덱스가 노래의 고유번호와 같게 된다.

zip()
동일한 길이의 리스트를 요소별로 묶어서 튜플 형태로 반환
ex) zip(genres, plays) = [('pop', 300), ('pop', 400), ('rock', 500)]

enumerate()
원소에 인덱스를 매겨 튜플 형태로 반환
ex) enumerate(zip(genres, plays)) = [(0, ('pop', 300)), (1, ('pop', 400)), (2, ('rock', 500))]

그런 후에 장르 별 총 재생 횟수를 저장하는 dict_play에는 key 값 장르에 value 총 재생 횟수를 각각의 재생 횟수를 더해가며 저장하고
장르 별로 각각의 곡에 대한 정보를 저장하는 dict_song에는 ke y값 장르에 value로 [i, play]를 입력해 곡에 대한 정보를 저장해준다.

여기까지 진행한 상태의 각각의 딕셔너리는 아래와 같다.
dict_play = {"pop":700, "rock":500}
dict_song = {"pop":[(0,300), (1, 400)], "rock":[(2,500)]

그리고 sorted(dict_play.keys(), key=lambda g: dict_play[g], reverse=True)를 통해
dict_play.keys() 즉 장르를 장르별 총 재생횟수 dict_play[g]를 기준으로 reverse=True 내림차순 정렬하면 1번 조건이 완료된다.

sorted_genres=["pop", "rock"]

2. 각각의 장르에 속한 모든 곡을 각각의 곡의 재생 횟수를 기준으로 내림차순 정렬하되 같은 재생 횟수를 가진다면 고유번호를 기준으로 한다.

    for genre in sorted_genres:
        sorted_songs = sorted(dict_song[genre], key=lambda x: (-x[1], x[0]))
        result.extend([song[0] for song in sorted_songs[:2]])

앞서 정렬된 장르의 순서대로 반복문을 실행하고 sorted(dict_song[genre], key=lambda x: (-x[1], x[0]))를 통해 장르에 속한 곡들을 정렬한다.
dict_song[genre] 즉 장르를 key 값으로 하는
value [(i,play), (i,play) ...]에 속한 튜플들을
-x[1] play 값을 기준으로 내림차순
x[0] 같은 play 값을 가질 경우 고유 번호 i를 기준으로 오름차순으로 정렬해준다.

마지막으로 [song[0] for song in sorted_songs[:2]]
sorted_song에 속한 튜플 중 정렬 기준 상위 2개 곡의 고유 번호를 extend()함수로 result에 더해준다.

append()와 extend()의 차이

append(item)는 리스트의 끝에 item을 추가하고
extend(iterable)은 리스트의 끝에 iterable의 모든 항목을 추가한다.

이는 반복문에 의해 각각의 장르에 대해 진행되므로 장르에 속한 곡이 2개 이상이라면 상위 2개까지 하나뿐이라면 하나를 result에 추가하게 된다.

결과적으로 result는 [1,0,2]가 된다.

전체 코드

from collections import defaultdict

def solution(genres, plays):
    dict_play = defaultdict(int)
    dict_song = defaultdict(list)
    
    for i, (genre, play) in enumerate(zip(genres, plays)):
        dict_play[genre] += play
        dict_song[genre].append([i, play])

    sorted_genres = sorted(dict_play.keys(), key=lambda g: dict_play[g], reverse=True)
    
    result = []
    for genre in sorted_genres:
        sorted_songs = sorted(dict_song[genre], key=lambda x: (-x[1], x[0]))
        result.extend([song[0] for song in sorted_songs[:2]])
    
    return result

후기

뜯어놓고 보면 그렇게 어려운 문제는 아니라는 생각이 들지만 아직 파이썬에서 사용하는 함수 같은 것들을 활용하는 게 익숙하지가 않다는 느낌을 많이 받았다.
그래서 이렇게 문제를 하나부터 열까지 낱낱이 뜯어보고 정리하는 글을 한 번 작성해 보았는데 역시 이해가 잘 되고 머리 속에서 떠다니던 개념들이 정리되는 느낌이 들어 뿌듯하게 마무리 할 수 있었다.

'Algorithm > Problem solving' 카테고리의 다른 글

[백준/Java] 20920 영단어 암기는 괴로워  (0) 2025.03.25
[백준/Java] 2108 통계학  (0) 2025.03.25
[백준/Java] 1010 다리 놓기  (0) 2025.03.25
[백준/Java] 11050 이항 계수 1  (0) 2025.03.25
[백준/Java] 28279 덱2  (0) 2025.03.25