R study

데이터 시각화(facet)

발킴이 2023. 2. 22. 21:13

1. Take the first faceted plot in this section

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy)) + 
  facet_wrap(~ class, nrow = 2)

What are the advantages to using faceting instead of the colour aesthetic? What are the disadvantages? How might the balance change if you had a larger dataset?

 color Aesthetic 대신에 facet 기능을 사용하면 범례별로 따로 데이터를 볼 수 있다는 장점이 있다. color Aesthetic을 이용하면 한눈에 모든 범례가 눈에 들어온다는 이점이 있지만, 겹쳐 보이기도 하고 색깔이 너무 다양할 경우 혼란스러울 수도 있다. 하지만 facet 은 모든 범례를 각각 보여주기 때문에 때때로 Aesthetic 보다 더 유용하다.

Read? facet_wrap(). What does nrow do? What does ncol do? What other options control the layout of the individual panels? Why doesn’t facet_grid() have nrow and ncol arguments?

 facet_wrap()과 facet_grid()의 가장 큰 차이는 면분할하는 변수의 개수이다. 하나의 변수로 면분할 하면 facet_wrap()을 쓰는 게 좋고, 두 개의 변수로 면분할 하려면  facet_grid()를 쓰는 게 맞다.

 그렇기 때문에 facet_grid()는 행과 열의 개수를 설정할 수 없다. 왜냐하면 두개의 변수에 의해 이미 행과 열의 개수가 정해져 있기 때문이다. 예를 들어 x는 3개의 값을 가지고 있고 y는 4개의 값을 가지고 있다고 하자. facet_grid(x~y)를 실행하면 3x4의 행렬이 나오게 된다. 

 facet_wrap()의 경우 하나의 변수로 면분할 하기 때문에 행과 열의 개수 설정이 가능하다. 다만, 면분할 개수에 따라 열과 행의 최댓값은 정해져 있기 때문에 터무니없는 숫자로 행과 열을 설정하면 반영되지 않는다. 

 

3.When using facet_grid() you should usually put the variable with more unique levels in the columns. Why?

 

이 그림은 행이 열보다 많은 경우를 나타낸 그림이다. 개수가 워낙 적어서 차이를 느낄 수는 없지만, 개인적인 생각으로는 열의 개수는 많아지면 옆으로 길어져서 길쭉이가 될 것 같고 행이 더 많으면 넓적이가 될 것 같다. 둘 다 문제가 있을 것 같다. 이건 잘 모르겠다.

 

 

 

 

 

 

 

 facet_wrap()과 facet_grid()의 차이점을 알았다는 것이 이번 학습의 가장 큰 성과인것 같다.