następny punkt »


1. WYKRES ROZPROSZENIA

Dla 31 drzew pewnego gatunku dokonano pomiarów ich średnicy Girth (na poziomie piersi mierzącego, cecha x) oraz objętości drzewa Volume (cecha y). Wykres na rys. 13.1 przedstawia zebrane wartości (xi, yi), i=1,...,31 jako punkty na płaszczyźnie. Jest to tak zwany wykres rozproszenia. Drugi wykres (rys. 13.2) jest wykresem rozproszenia dla pomiarów wysokości Height i objętości. Widzimy, że aczkolwiek w obu przypadkach zależność między zmiennymi jest dodatnia, rozproszenie na drugim wykresie jest większe. Gdybyśmy w obu przypadkach przez chmurę punktów przeprowadzili prostą dobrze reprezentującą jej charakter, to rozrzut punktów wykresu rozproszenia wokół prostej byłby znacznie większy w drugim przypadku. Oznacza to oczywiście, że jesteśmy w stanie znacznie lepiej przewidywać objętość drzewa na podstawie jego średnicy niż na podstawie jego wysokości. Obliczmy jeszcze wartości współczynnika korelacji próbkowej (zdefiniowanego w wykładzie 10): w pierwszym przypadku wynosi on r= 0,97, w drugim natomiast r = 0,60.

Kod programu w R realizującego wyświetlenie obu wykresów:

library(MASS)
data(trees)
par(mfrow=c(2,2))
plot(trees$Girth, trees$Volume,xlab="Srednica", ylab="Objetosc")
plot(trees$Height, trees$Volume,xlab="Wysokosc", ylab="Objetosc")

Rys. 13.1. Wykres rozproszenia zmiennych Volume i Girth.

Rys. 13.2. Wykres rozproszenia zmiennych Volume i Height.


 następny punkt »