資料處理就如同雕塑身材前的基礎訓練,今天來分享基礎訓練工具 dyplr,幫助我們更容易與直觀的提升基礎訓練。
- 使用到的工具:
- (1) install.packages
- (2) library
- (3) data.frame
- (4) %>%
- (5) filter()
- (6) print()
- 程式碼範例:
# 安裝dplyr
install.packages("dplyr")
# 確認是不是可以讀取 dplyr
library(dplyr)
# 建立資料
score_exp <- data.frame(score = c(30, 40, 50, 60, 70, 80))
# 篩選:score_exp 經由 %>% (連結的概念) 加上過濾資料
result <- score_exp %>%
filter(score > 60)
# 印出結果(應該只會看到 70 和 80)
print(result)- 步驟拆解:
-
(1) 安裝需要的素材
-
a. install.packages(“dplyr”) — 安裝
-
b.library(dplyr) — 確認安裝成功
-
(2) 建立資料
-
a. data.frame(…): 這是 R 內建建立資料表的方法。
-
b. score = c(…): 建立一個名為 score 的欄位,裡面放了 6 個數字。
-
c. 這行執行完,你會得到一個 6 列 1 欄的表格。
-
(3) 篩選資料
-
a. score_exp: 這是初始資料。
-
b. %>% (管道符號): 把左邊的 score_exp 傳遞給右邊的函數當作第一個參數。
-
c. filter(…): 這是 dplyr 的動詞,用來篩選符合條件的「列」。
-
d. score > 60: 這是篩選條件,告訴 R:「請幫我找出 score 這一欄大於 60 的資料」。
-
(4) 輸出結果
-
a. print(…): 最後篩選出來的結果顯示在螢幕上。
- 資料來源:
- (1) R 軟體
- (2) Gemini