Tuesday, September 23, 2014

Các bước trong WinBUGS

WinBUGS là một chương trình phân tích Bayes. Tôi đã viết một tài liệu hướng dẫn cách dùng WinBUGS, và đây có thể xem là một tóm lược tài liệu đó.

Các hàm R phổ biến 10: Ước tính cỡ mẫu

Một số hàm cho ước tính cỡ mẫu cho các mô hình nghiên cứu phổ biến như nghiên cứu cắt ngang, nghiên cứu bệnh chứng, và nghiên cứu đoàn hệ. Biến phân tích có thể là biến liên tục hay biến nhị phân.

Các hàm R phổ biến 9: Phân tích dãy số liệu theo thời gian (time series analysis)

Các hàm phổ biến cho sắp xếp dữ liệu theo thời gian. Các mô hình phân tích như AR, MA, và ARIMA cũng được mô tả qua. Các hàm này phần lớn đã có trong R, nhưng cũng có thể dùng package TTR cho các phân tích chuyên dụng. 

Các hàm R phổ biến 8: Phân tích bootstrap

Mã R dùng cho phân tích bootstrap. Tôi có thêm một ví dụ dùng phương pháp bootstrap cho việc phân tích sự khác biệt giữa 2 tỉ lệ bằng mô hình Bayes. 


Các hàm R phổ biến 7: Phân tích tổng hợp (meta-analysis)

Dưới đây là một số hàm trong package metafor có thể dùng cho phân tích tổng hợp. Biến phân tích là biến nhị phân và biến liên tục.


Các hàm R phổ biến 6: Phân tích đa biến (multivariate analysis)

Phân tích đa biến trong R rất đơn giản! Trong bảng dưới đây, tôi trình bày một số hàm phổ biến cho phân tích thành phần và phân tích cụm (cluster). Các ví dụ của phân tích có thể tìm trong sách về R của tôi (xuất bản năm 2014).

Các hàm R phổ biến 5: Mô hình hồi qui Cox

Dưới đây là một số hàm dùng cho mô hình hồi qui Cox và vẽ đường biểu diễn Kaplan-Meier. Tôi cũng thêm một số hàm chính trong package BMA để chọn mô hình tối ưu.


Các hàm R phổ biến 4: Mô hình hồi qui logistic, binomial, Poisson

Dưới đây là một số hàm có thể dùng cho mô hình hồi qui logistic. Hàm glm trong R được dùng chủ yếu. Hàm glm không cung cấp OR và khoảng tin cậy 95%, nên chúng ta cần dùng hàm logistic.display trong package epicalc.  Ngoài glm, còn có hàm lrm trong package chuyên dụng rms (Frank Harrell).

Các hàm R phổ biến 3: Mô hình hồi qui tuyến tính

Dưới đây là các hàm phổ biến hay dùng trong phân tích tương quan, mô hình hồi qui tuyến tính và phân tích phương sai.

Các hàm R phổ biến 2: Các hàm R dùng cho phân tích mô tả


Dưới đây là một số hàm chính dùng cho phân tích mô tả trong R. Phần lớn những hàm này là những hàm đã có sẵn trong R, nhưng một số nằm trong các package chuyên dụng như psych và tables.  


Các Hàm R phổ biến 1: đọc và biên tập dữ liệu

Các Hàm R phổ biến 1: đọc và biên tập dữ liệu
Đối với các bạn mới làm quen với R, có lẽ vấn đề nổi cộm là lúng túng, không nhớ hàm và lệnh. Tôi hiểu khó khăn đó. Dưới đây là một bảng tổng hợp các hàm cần thiết cho đọc dữ liệu, biên tập dữ liệu, phân tích mô tả, và mô hình thống kê. Tôi sắp xếp theo thứ tự của chương sách. Mô hình sắp xếp hàm là việc làm và tên hàm, một số nơi tôi cho ví dụ cụ thể. Gần như tất cả các hàm chính yếu trong sách đều được tóm lược trong bảng này. Bạn đọc có thể dùng bảng này như là một tài liệu tham khảo khi cần biết hàm R nào để phân tích dữ liệu. 

Cách viết mô hình trong lme4

Trong R có package lme4 được thiết kế dùng cho các phân tích dạng mixed effects model. Tuy nhiên, cách viết phải tuân thủ theo mô hình "thủ công". Nói cách khác, người dùng phải viết xuống mô hình, phân biệt tham số nào là fixed effect và tham số nào là random effects. Sau đó, triển khai bằng mã R.  

Monday, September 22, 2014

Vẽ biểu đồ theo thời gian cho từng đối tượng

Trong các nghiên cứu theo thời gian (longitudinal studies), mỗi đối tượng được theo dõi một thời gian, và do đó có nhiều giá trị đo lường. Chúng ta muốn vẽ biểu đồ cho mỗi đối tượng, với trục hoành là thời gian và trục tung là giá trị đo lường. Hàm xyplot trong package lattice có ích cho việc này.

Hàm file.choose()

Với máy tính ngày nay, đặc biệt là máy chạy hệ điều hành Windows, tìm dữ liệu trong máy tính để đọc có khi là vấn đề nan giải, vì đường dẫn quá dài và phức tạp. Rất khó gõ lại toàn bộ đường dẫn, hay có gõ thì cũng tốn khá nhiều thì giờ. Trong R, có hàm file.choose() rất tiện để chúng ta chọn file cho phân tích.

Dữ liệu dùng cho phân tích

Trong phân tích dữ liệu, ngoài việc học phương pháp, một điều rất quan trọng là dữ liệu. Tôi đã upload lên trang statistics.vn một số dữ liệu nghiên cứu cần thiết cho thực hành phân tích. Một số dữ liệu có thể ứng dụng ngay là như sau:

Giới thiệu blog "Phân tích dữ liệu"

Xin giới thiệu một blog tôi mới lập ra song song với và bổ sung cho trang web statistics.vn. Trang blog này (rphantich.blogspot.com) sẽ lưu trữ những phương pháp mà mã R dùng cho phân tích dữ liệu khoa học, mà tôi mô tả trong cuốn "Phân tích dữ liệu với R" (xuất bản năm 2014). Ngoài ra, tôi sẽ cố gắng dùng trang blog để cập nhật hoá cuốn sách Q&A tôi đang viết về phân tích dữ liệu.