Trang chủ


Đây là website chính thức của nhóm thực hiện dự án BAV (Bayesian Analysis for Vietnam).
Mục tiêu của chúng tôi nhằm góp phần phổ biến một phương pháp thống kê mới, đó là Suy diễn Bayes.

Hiện nay ngày càng có nhiều tiếng nói ủng hộ cho việc áp dụng trường phái Bayes thay thế cho những công cụ truyền thống (trường phái frequentist và Null hypothesis testing - NHST) trong việc diễn giải và phân tích số liệu. Trường phái Bayes thể hiện nhiều ưu thế vượt trội như :

1. Giản dị và đồng nhất : không còn bị phân tán thành từng mảnh nhỏ (các loại test)
2. Tận dụng và hòa hợp thông tin tiền định và bằng chứng từ dữ liệu thí nghiệm
3. Diễn giải kết quả linh hoạt hơn rất nhiều so với Null hypothesis test và p value
4. Không áp đặt nhưng cung cấp thông tin phong phú và chính xác hơn
5. Vượt qua dễ dàng các yếu tố gây nhiễu trong dữ liệu như cỡ mẫu thấp, outliers

Tuy nhiên việc ứng dụng rộng rãi Bayes vẫn còn gặp nhiều khó khăn, nhất là tại Việt Nam. Chủ yếu là khó khăn về kỹ thuật, thí dụ xây dựng thuật toán để đạt được phân phối hậu nghiệm. Với sự phát triển vũ bão của năng lực máy tính, các phần mềm như BUGs, JAGS hay STAN có thể giúp chúng ta mô phỏng phân phối hậu nghiệm một cách nhanh chóng. Tuy nhiên việc xây dựng mô hình trong BUGs, JAGS và STAN để đạt được phân phối hậu nghiệm đòi hỏi khả năng lập trình và tương đối phức tạp đối với những nhà nghiên cứu ứng dụng không chuyên về thống kê.

Trong khoảng 3 năm gần đây, với sự phát triển và phổ biến của ngôn ngữ lập trình thống kê R, việc phân tích theo trường phái Bayes ngày càng trở nên đơn giản và khả thi hơn. Đã có những giao thức cho phép tương tác dễ dàng giữa R và các sampler. Nhiều tài liệu và bộ codes viết sẵn cho phép ứng dụng thường quy phân tích Bayes trong nghiên cứu khoa học.

Chính vì vậy, chúng tôi muốn giới thiệu với bạn đọc cách phân tích số liệu sử dụng phần mềm R theo trường phái Bayes một cách đơn giản, dễ hiểu, dễ làm. Đây không phải là cuốn sách giáo khoa về trường phái Bayes, nên chúng tôi chỉ giới thiệu những khái niệm căn bản nhất về Bayes, và tập trung vào phần ứng dụng bằng cách cung cấp cho bạn đọc những bộ số liệu và codes trong R để bạn đọc thực hành. Sau đó bạn đọc có thể tái sử dụng những codes này để phân tích số liệu cho nghiên cứu của mình.