Thông Tin Các Lệnh Trong Ngôn Ngữ R


Xin chào các bạn độc giả, chúng tôi sẽ giới thiệu các lệnh trong ngôn ngữ r và các bài kiểm tra cơ bản của phần mềm này.

Xem thêm: Máng Cáp Đục Lỗ Là Gì ? Ưu Nhược Điểm Của Máng Cáp Đục Lỗ

1. Các lệnh trong ngôn ngữ trong R


Đầu tiên, chúng tôi yêu cầu R nhập tập dữ liệu ch2_health.wf1 dưới dạng tên data.frame mới và chỉ định rằng R chỉ sử dụng tệp dữ liệu này, như sau:

Xem thêm: 10 Bước Lắp Ráp, Đấu Nối Hoàn Thiện Tủ Điện Công Nghiệp Chuyên Nghiệp

1.1. Thống kê mô tả trong R


Thống kê mô tả sơ bộ của các biến trong tập dữ liệu:


Chúng tôi nhận được cùng một kết quả bằng cách sử dụng toán tử ống:


Nếu chúng ta quan tâm đến các chi tiết thống kê chi tiết hơn của tập dữ liệu, chúng ta có thể sử dụng gói pastecs:


Lệnh ngôn ngữ RẺ

Khoảng tin cậy 95% khỏe mạnh nằm trong khoảng từ 19929 - 6216 đến 19929 + 6216.

Và giá trị coef.var = 1.109 là thương số của std.dev chia cho giá trị trung bình.

Giá trị (CI.mean.0,95) là khoảng tin cậy 95% cho biến

Lưu ý: (CI là viết tắt của khoảng tin cậy).


1.2. Ma trận hệ số tương quan


Ma trận hệ số tương quan giữa các biến:


Hệ số tương quan POP và INCOME gần bằng 1 (lớn hơn 0,8), vì vậy nếu cả hai biến xuất hiện trong phương trình hồi quy dưới dạng các biến độc lập, điều quan trọng là mô hình có thể có sai số đa cộng tuyến ở cấp độ nghiên cứu.

Xem thêm: Tổng Hợp Các Lệnh Trong C Cơ Bản Bạn Cần Nắm Vững

Xem thêm: Tổng Hợp Danh Sách Các Lệnh Lập Trình Plc Omron

2. Một số kiểm định cơ bản trong R


Trong phần này, chúng ta xem xét việc thực hiện các phép hồi quy đơn giản và thực hiện các phép thử phổ biến với R.


2.1. Hồi quy đơn, khoảng tin cậy cho các hệ số và bảng ANOVA


Chúng ta xem xét mô hình hồi quy hai biến số sau:


Sức khỏe = β1 + β2 Thu nhập. + Giao diện người dùng (1)


Chúng ta xét mô hình hồi quy hai biến số sau:

HEALTH = β1 + β2INCOME. + ui (1)

Để ước lượng mô hình này trong R:

Các bạn có thể nâng độ chính xác của các kết quả bằng cách thêm lệnh như sau:


Trong trường hợp này, thống kê F có tới 3 chữ số sau dấu phẩy.


Rõ ràng, mô hình hồi quy của chúng tôi là tốt theo các tiêu chuẩn truyền thống, như thể hiện trong hình sau:


(1) Tất cả các hệ số hồi quy đều có ý nghĩa thống kê ở mức 5%,

(2) R2 rất cao

(3) Giá trị thống kê F lớn.

Sau khi thực hiện hồi quy, chúng ta có thể sử dụng một số hàm để trích xuất thêm thông tin liên quan đến mô hình.


Dưới đây là một số chức năng cơ bản:


Các lệnh trong ngôn ngữ R


Ngoài ra, để hỗ trợ chẩn đoán các lỗi mô hình (đa cộng tuyến, phương sai của các biến, ngoại lệ) - chúng ta sẽ xem xét kỹ hơn vấn đề này trong các chương sau của bài viết này.


Sau khi thực hiện hồi quy, chúng ta có thể sử dụng một số chức năng được cung cấp bởi gói ô tô sau:


Các lệnh trong ngôn ngữ R

Tham khảo: Công Tắc Tơ Và Ký Hiệu Công Tắc Tơ Là Gì?

2.1.1. Tính khoảng tin cậy trong R


Hàm Summary () mà chúng ta đã quen thuộc ở trên. Phần này sẽ trình bày về độ mặn và sự tự tin trong R.


Ví dụ, để tính khoảng tin cậy 95% cho các hệ số hồi quy:


Chẳng hạn để tính khoảng tin cậy 95% cho các hệ số hồi quy:

Tính khoảng tin cậy 90% cho các hệ số hồi quy:

2.1.2. Giá trị F trong kiểm định Anova trong phần mềm R


Một trong những thông tin quan trọng khi thực hiện hồi quy là phân tích bảng ANOVA:


Giá trị F trong ANOVA. Kiểm tra

Ở đây RSS (df2 = 51 - 2 = 49 bậc tự do) là 442826151 và ESS (df1 = 1 bậc tự do) là 23982446067. Lưu ý rằng TSS = RSS + ESS, chúng ta có thể kiểm tra kỹ xem nó có phải là R2 hay không. = ESS / TSS = 0,982.


Bảng ANOVA này cũng cho thấy giá trị thống kê F là 2653,727 = (ESS / df1) / (RSS / df2) = (23982446067/1) / (442826151/49).


Kết quả này là giá trị F được thể hiện trong kết quả phân tích hồi quy.


Trong trường hợp chúng tôi muốn ước tính mô hình:

Sức khỏe = β1 + β2 Thu nhập ^ 2 + u


Vì mọi phần mềm đều có đặc điểm kỹ thuật triển khai, trong R bạn phải nhập:

Một tình huống khác mà chúng ta có thể gặp phải là thực hiện một hồi quy thông qua điểm gốc.


Đây là các mô hình hồi quy có dạng:

sức khỏe = β⨉income + u


Hồi quy không có hệ số chặn trên mô hình trên trong R là:



Lưu ý rằng trong hồi quy không có hệ số chặn, tiêu chí R2 được tính theo công thức truyền thống không áp dụng và không có ý nghĩa trong việc đánh giá mức độ phù hợp của mô hình.


Chúng ta sẽ nghiên cứu chi tiết về hồi quy không có đánh chặn trong chương tiếp theo.


2.2. Kiểm định Jarque-Bera cho phân phối chuẩn của phần dư

Một số phép thử khác nhau có thể được sử dụng để kiểm tra phân phối chuẩn của phần dư (hoặc bất kỳ biến nào khác).

Ví dụ, chúng ta có thể thực hiện kiểm tra Jarque-Bera cho phân phối chuẩn của phần dư.


Thống kê JB này tuân theo phân phối bình phương (χ2) với hai bậc tự do.


Nếu JB được tính toán tương ứng với giá trị p lớn hơn 5%, thì chúng ta không thể bác bỏ giả định rằng phân phối là chuẩn.

Nếu không, chúng tôi chấp nhận giả định rằng phân phối là không bình thường.

Phân tích hình ảnh có thể cho chúng ta biết liệu phần dư có thể được phân phối bình thường hay không:


Hoặc có thể thể hiện bằng line graph như phần mềm Eviews thường thực hiện:


Hình ảnh trên không đưa ra dấu hiệu chính xác rằng phần dư được phân phối bình thường.

Chúng ta có thể sử dụng phép thử Jarque-Bera để cung cấp bằng chứng thống kê về phân phối chuẩn:

3. Kết luận


Dưới đây là các lệnh trong ngôn ngữ R và một số kiểm định cơ bản trong phần mềm này.

Chúng tôi xin chúc các độc giả học tập và làm việc hiệu quả.


Mọi thông xin vui lòng liên hệ với MAX ELECTRIC