Written by Siwasit Jitpanu 9/7/2021
บทความนี้เราจะแนะนำวิธี จัดการข้อมูลในโปรแกรม R แบบ Excel เบื้องต้น โดยจะแบ่งเป็น 2 ส่วนคือการจัดการ Column และการจัดการข้อมูล วิธีทำไม่ยุ่งยาก เพียงไม่กี่ขั้นตอน ถ้าพร้อมแล้ว ลองทำตาม กันเลย
data <- data.frame(A=c("d","e","a","a","b","c"),B=c(800,1000,200,200,800,500),C=c(1,1,2,2,1,2))
หากเพื่อนๆ มีข้อมูล Excel อยู่แล้วสามารถนำมาทดลองประยุกต์ใช้ได้เลย โดยการ Import ข้อมูลเพื่อนๆสามารถดูได้ที่นี่ คลิก
เพื่อนๆ สามารถเข้าไปดูวิธีติดตั้ง และเรียกใช้งาน Package ได้ที่นี่ คลิก
คำสั่งติดตั้ง และเรียกใช้งาน Package dplyr
install.packages("dplyr")
library(dplyr)
คำสั่ง colnames(data) <- name
data คือ ข้อมูลในโปรแกรม R
name คือ ชื่อ Column ใหม่ที่เราต้องการให้เป็น
เมื่อเรามีข้อมูลแล้วต้องการเปลี่ยนชื่อ Column จะใช้คำสั่ง
colnames(data)[c(1,2,3)] <- c("name","cost","group")
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ชื่อ Column ที่ 1,2 และ 3 เป็นชื่อ name,cost และ group ตามลำดับ
คำสั่ง data$name <- NULL
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
name คือ ชื่อ Column ที่เราต้องการลบ
เมื่อเรามีข้อมูลแล้วต้องการลบ Column จะใช้คำสั่ง
data$group <- NULL
และกด ctrl+enter หรือ คลิกที่ run
เราจะลบ Column group ออกจากข้อมูลทั้ง Column
คำสั่ง data$[C] <- NULL
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
C คือ ตำแหน่ง Column ที่เราต้องการลบ
เมื่อเรามีข้อมูลแล้วต้องการลบ Column จะใช้คำสั่ง
data[3] <- NULL
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ลบ Column ที่ 3 ออกจากข้อมูลทั้ง Column
คำสั่ง data <- data[c(C1,C2,C3)]
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
C1,C2,C3 คือ ตำแหน่ง Column ที่เราต้องการสลับ
เมื่อเรามีข้อมูลแล้วต้องการสลับ Column จะใช้คำสั่ง
data <- data[c(3,1,2)]
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ข้อมูลที่สลับตำแหน่งโดยนำ Column ที่ 3 มาอยู่ซ้ายสุด และต่อด้วย Column ที่ 1 และ 2 ตามลำดับ
(Tip1 : ในกรณีไม่ต้องการให้ข้อมูลเก่าหายสามารถเก็บค่าในตัวแปลใหม่ได้ เช่น newdata <- data[c(2,1,3)])
(Tip2 : เราสามารถใช้คำสั่งในรูปแบบนี้แทนการลบ Column ได้โดยเลือกเฉพาะ Column ที่นำไปใช้ เช่น data <- data[c(2,1)])
คำสั่ง data[order(data$A,data$B),]
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
A,B คือ ชื่อ Column ที่เราต้องเรียงข้อมูลใน Column
เมื่อเรามีข้อมูลแล้วต้องการเรียงข้อมูลใน Column จะใช้คำสั่ง
data <- data[order(data$group,data$cost),]
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ข้อมูลที่เรียงลำดับด้วย Column group และตามด้วยการเรียงลำดับข้อมูลใน Column cost
คำสั่ง data[order(data[C1],data[C2]),]
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
C1,C2 คือ ตำแหน่ง Column ที่เราต้องเรียงข้อมูลใน Column
เมื่อเรามีข้อมูลแล้วต้องการเรียงข้อมูลใน Column จะใช้คำสั่ง
data <- data[order(data[3],data[2]),]
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ข้อมูลที่เรียงลำดับด้วย Column ที่ 3 และตามด้วยการเรียงลำดับข้อมูลใน Column ที่ 2
คำสั่ง data %>% filter(condition)
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
condition คือ เงื่อนไขในการกรองข้อมูล
เมื่อเรามีข้อมูลแล้วต้องการกรองข้อมูลใน Column จะใช้คำสั่ง
data <- data %>% filter(group==1)
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ข้อมูลที่กรองตามเงื่อนไข คือ เฉพาะ group 1
(Tip : condition ที่ใช้บ่อยคือกรองไม่เอาค่า NA จะใช้คำสั่ง data %>% filter(!is.na(column)) )
คำสั่ง unique(data)
data คือ ข้อมูลในโปรแกรม R ที่เรา Import มาจากไฟล์ Excel
เมื่อเรามีข้อมูลแล้วต้องการลบข้อมูลที่ซ้ำ จะใช้คำสั่ง
data <- unique(data)
และกด ctrl+enter หรือ คลิกที่ run
เราจะได้ข้อมูลที่ไม่ซ้ำกัน