תוכן עניינים:

מהי חבילת Dplyr ב-R?
מהי חבילת Dplyr ב-R?

וִידֵאוֹ: מהי חבילת Dplyr ב-R?

וִידֵאוֹ: מהי חבילת Dplyr ב-R?
וִידֵאוֹ: Multiple Regression in R, Step by Step!!! 2024, נוֹבֶמבֶּר
Anonim

dplyr הוא חדש חֲבִילָה אשר מספק קבוצה של כלים למניפולציה יעילה של מערכי נתונים ב ר . dplyr הוא האיטרציה הבאה של plyr, המתמקדת במסגרות נתונים בלבד. dplyr הוא מהיר יותר, בעל API עקבי יותר ואמור להיות קל יותר לשימוש.

מלבד זה, מה השימוש בחבילת Dplyr ב-R?

dplyr הוא חבילת R לעבודה עם נתונים מובנים בתוך ומחוץ ר . dplyr עושה מניפולציה של נתונים עבור ר משתמשים קלים, עקביים וביצועיים. עם dplyr כממשק למניפולציה של Spark DataFrames, אתה יכול: לבחור, לסנן ולצבור נתונים.

לאחר מכן, השאלה היא מה עושה %>% ב-R? שם הוא מדריכים רבים עבור מפעיל הצינור ב ר , רק בגוגל בשביל זה. האופרטור %>% הוא אופרטור 'צינור', המעביר נתונים מהפלט של הפונקציה שמאלה ומכניס אותם, כברירת מחדל, לפרמטר הראשון של הפונקציה בצד ימין.

איך אני משיג Dplyr ב-R?

אתה יכול להתקין:

  1. הגרסה האחרונה שפורסמה מ-CRAN עם install.packages("dplyr")
  2. גרסת הפיתוח האחרונה מ-github עם if (packageVersion("devtools") < 1.6) { install.packages("devtools") } devtools::install_github("hadley/lazyeval") devtools::install_github("hadley/dplyr")

מה עושה Group_by ב-R?

Groupby פונקציה ב ר – group_by רגיל ל קְבוּצָה מסגרת הנתונים פנימה ר . חבילת Dplyr ב ר מסופק עם group_by פונקציה () המקבצת את מסגרת הנתונים לפי מספר עמודות עם ממוצע, סכום או כל פונקציה אחרת. ממוצע של Sepal. האורך מקובץ לפי משתנה מינים.

מוּמלָץ: