범주를 만들어주는 친절한 함수 cut & qcut
Updated:
pandas 에서 groupby()를 활용할 때
연속적인 값들에 대해서 cut , qcut을 활용하여 이산화를 실시한다.
pd.cut()
동일한 길이로 나누어서 범주를 만들어 줌
각 칼럼에 대해서 n개의 동일한 길이로 범주를 만들어 줌
즉 사용자가 이산화를 할 수치를 직접 입력한다.
예를들어 0~10까지 n을 4로 설정시
0~2.5 , 2.5~5, 5~7.5 , 7.5 ~ 10으로 나누어짐
pd.qcut()
동일한 개수로 나누어서 범주를 만들어 줌
즉 각 범주별로 n개의 개수를 가지도록 범주를 만들어 줌
다시말해 특정 분위수를 계산하여 이를 기반으로 이산화를 수행한다.
예를들어 1~10까지 n을 5로 설정 시 1~2 , 3~4 , 5~6 , 7~8 , 9~10 으로 이산화 됨
Leave a comment