R-基礎練習篇 (dplyr-select)

  1. 使用到的工具:
  • (1) install.packages
  • (2) library
  • (3) data.frame
  • (4) %>%
  • (5) filter()
  • (6) select()
  • (7) print()
  1. 程式碼範例:
# 安裝dplyr
install.packages("dplyr")
 
# 確認是不是可以讀取 dplyr
library(dplyr)
 
# 建立資料
score_exp <- data.frame(  
name = c("A", "B", "C", "D", "E", "F"),  
city = c("Taipei", "New Taipei City", "Taoyuan", "Linkou", "Hsinchu", "Taichung"),  
score = c(30, 40, 50, 60, 70, 80))
 
#輸出結果
#篩選 score 大於 60
#選擇欄位:欄位名稱 name, score, city 
result <- score_exp %>%  
filter(score > 60) %>% 
select(name, score, city)
 
# 印出結果(會輸出 score 大於 60 且選擇三個欄位 name/score/city)
print(result)
  1. 步驟拆解:
  • (1) 安裝需要的素材

  • a. install.packages(“dplyr”) — 安裝

  • b. library(dplyr) — 確認安裝成功

  • (2) 建立資料

  • a. data.frame(…): 這是 R 內建建立資料表的方法。

  • b. score = c(…): 建立3個欄位名為 name/city/score 的欄位,裡面分別在name 放了 A-E 的值; city 放了6個地區 Taipei/New Taipei City/Taoyuan/Linkou/Hsinchu/Taichung; score 放入 6 個數字。

  • c. 使用三次c(…): 建立3個欄位。

  • d. 這行執行完,你會得到一個 6 列 3 欄的表格。

  • (3) 篩選資料

  • a. score_exp: 這是初始資料。

  • b. %>% (管道符號): 把左邊的 score_exp 傳遞給右邊的函數當作第一個參數。

  • c. filter(…): 這是 dplyr 的動詞,用來篩選符合條件的「列」。

  • d. select(…): 這是 dplyr 的動詞,用來選擇所需要的「欄位」。

  • e. score > 60: 這是篩選條件,告訴 R:「請幫我找出 score 這一欄大於 60 的資料」。

  • (4) 輸出結果

  • (5) print(…): 最後篩選出來的結果顯示在螢幕上。

  1. 資料來源:
  • (1) R 軟體
  • (2) Gemini