1. Take the first faceted plot in this section
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_wrap(~ class, nrow = 2)
What are the advantages to using faceting instead of the colour aesthetic? What are the disadvantages? How might the balance change if you had a larger dataset?
color Aesthetic 대신에 facet 기능을 사용하면 범례별로 따로 데이터를 볼 수 있다는 장점이 있다. color Aesthetic을 이용하면 한눈에 모든 범례가 눈에 들어온다는 이점이 있지만, 겹쳐 보이기도 하고 색깔이 너무 다양할 경우 혼란스러울 수도 있다. 하지만 facet 은 모든 범례를 각각 보여주기 때문에 때때로 Aesthetic 보다 더 유용하다.
Read? facet_wrap(). What does nrow do? What does ncol do? What other options control the layout of the individual panels? Why doesn’t facet_grid() have nrow and ncol arguments?
facet_wrap()과 facet_grid()의 가장 큰 차이는 면분할하는 변수의 개수이다. 하나의 변수로 면분할 하면 facet_wrap()을 쓰는 게 좋고, 두 개의 변수로 면분할 하려면 facet_grid()를 쓰는 게 맞다.
그렇기 때문에 facet_grid()는 행과 열의 개수를 설정할 수 없다. 왜냐하면 두개의 변수에 의해 이미 행과 열의 개수가 정해져 있기 때문이다. 예를 들어 x는 3개의 값을 가지고 있고 y는 4개의 값을 가지고 있다고 하자. facet_grid(x~y)를 실행하면 3x4의 행렬이 나오게 된다.
facet_wrap()의 경우 하나의 변수로 면분할 하기 때문에 행과 열의 개수 설정이 가능하다. 다만, 면분할 개수에 따라 열과 행의 최댓값은 정해져 있기 때문에 터무니없는 숫자로 행과 열을 설정하면 반영되지 않는다.
3.When using facet_grid() you should usually put the variable with more unique levels in the columns. Why?
이 그림은 행이 열보다 많은 경우를 나타낸 그림이다. 개수가 워낙 적어서 차이를 느낄 수는 없지만, 개인적인 생각으로는 열의 개수는 많아지면 옆으로 길어져서 길쭉이가 될 것 같고 행이 더 많으면 넓적이가 될 것 같다. 둘 다 문제가 있을 것 같다. 이건 잘 모르겠다.
facet_wrap()과 facet_grid()의 차이점을 알았다는 것이 이번 학습의 가장 큰 성과인것 같다.
'R study' 카테고리의 다른 글
성동구 어느 동이 치킨&호프 집이 제일 많을까? (2) | 2023.03.10 |
---|---|
"몇 살 때 월급을 가장 많이 받을까?"(데이터 분석 연습) (2) | 2023.03.03 |
데이터 변형(Filter rows with filter()) (3) | 2023.02.24 |
데이터 시각화(Geometric objects) (4) | 2023.02.23 |
데이터 시각화(Aesthetic Mappings) (1) | 2023.02.22 |