Tuesday, September 23, 2014

Các hàm R phổ biến 6: Phân tích đa biến (multivariate analysis)

Phân tích đa biến trong R rất đơn giản! Trong bảng dưới đây, tôi trình bày một số hàm phổ biến cho phân tích thành phần và phân tích cụm (cluster). Các ví dụ của phân tích có thể tìm trong sách về R của tôi (xuất bản năm 2014).


Phân tích 
Hàm R
Phân tích thành phần (principal component analysis)

pca = princomp(~factor1 + factor2, data=temp);
summary(pca);
loadings(pca)

Phân tích cụm (cluster analysis): đo lường khoảng cách

dat = read.table(text="
x1 x2
4 8
6 6
10 11
11 8
17 5
19 3
20 11
21 2
", header=T)
distance = dist(dat)

Phân tích cụm (cluster analysis): phân tích 

library(cluster);
hc.average = hclust(dist, method = "average");
plot(hc.average, hang = -1, main = "average")

Phân tích cụm (cluster analysis): xác định số cluster 

library(NbClust);
teeth = read.table(teeth.txt", header=T)
teeth1 = as.numeric(as.matrix(teeth[,-1]))
NbClust(teeth1, method = "average", index = "all")




1 comment:

  1. Kính gửi thầy, em và nhiều bạn sinh viên rất quan tâm đến phương pháp phân tích đa biến trong R. Em hi vọng thầy có thể soạn một bài giảng về chủ đề này trong các chuỗi bài tiếp theo đã có trên youtube. Em cảm ơn thầy.

    ReplyDelete