- 使用到的工具:
- (1) install.packages
- (2) library
- (3) data.frame
- (4) %>%
- (5) filter()
- (6) select()
- (7) print()
- 程式碼範例:
# 安裝dplyr
install.packages("dplyr")
# 確認是不是可以讀取 dplyr
library(dplyr)
# 建立資料
score_exp <- data.frame(
name = c("A", "B", "C", "D", "E", "F"),
city = c("Taipei", "New Taipei City", "Taoyuan", "Linkou", "Hsinchu", "Taichung"),
score = c(30, 40, 50, 60, 70, 80))
#輸出結果
#篩選 score 大於 60
#選擇欄位:欄位名稱 name, score, city
result <- score_exp %>%
filter(score > 60) %>%
select(name, score, city)
# 印出結果(會輸出 score 大於 60 且選擇三個欄位 name/score/city)
print(result)- 步驟拆解:
-
(1) 安裝需要的素材
-
a. install.packages(“dplyr”) — 安裝
-
b. library(dplyr) — 確認安裝成功
-
(2) 建立資料
-
a. data.frame(…): 這是 R 內建建立資料表的方法。
-
b. score = c(…): 建立3個欄位名為 name/city/score 的欄位,裡面分別在name 放了 A-E 的值; city 放了6個地區 Taipei/New Taipei City/Taoyuan/Linkou/Hsinchu/Taichung; score 放入 6 個數字。
-
c. 使用三次c(…): 建立3個欄位。
-
d. 這行執行完,你會得到一個 6 列 3 欄的表格。
-
(3) 篩選資料
-
a. score_exp: 這是初始資料。
-
b. %>% (管道符號): 把左邊的 score_exp 傳遞給右邊的函數當作第一個參數。
-
c. filter(…): 這是 dplyr 的動詞,用來篩選符合條件的「列」。
-
d. select(…): 這是 dplyr 的動詞,用來選擇所需要的「欄位」。
-
e. score > 60: 這是篩選條件,告訴 R:「請幫我找出 score 這一欄大於 60 的資料」。
-
(4) 輸出結果
-
(5) print(…): 最後篩選出來的結果顯示在螢幕上。
- 資料來源:
- (1) R 軟體
- (2) Gemini