תוכן עניינים:

איך מתמודדים עם ערכי NA ב-R?
איך מתמודדים עם ערכי NA ב-R?

וִידֵאוֹ: איך מתמודדים עם ערכי NA ב-R?

וִידֵאוֹ: איך מתמודדים עם ערכי NA ב-R?
וִידֵאוֹ: אלטרנטור לרכב 12v 90 אמפר לגנרטור מתרגש באמצעות DIODE 2024, מאי
Anonim

כאשר אתה מייבא מערך נתונים מיישומים סטטיסטיים אחרים, ערכים חסרים עשוי להיות מקודד במספר, למשל 99. על מנת לתת ר יודע שזה א ערך חסר אתה צריך לקודד אותו מחדש. פונקציה שימושית נוספת ב ר ל להתמודד עם ערכים חסרים הוא לא . omit() אשר מוחקים תצפיות לא שלמות.

רק אז, איך אתה מתמודד עם NA ב-R?

אפשרויות NA ב-R

  1. להשמיט ולא. exclude: מחזירה את האובייקט עם תצפיות שהוסרו אם הן מכילות ערכים חסרים; ניתן לראות הבדלים בין השמטה ואי הכללה של NA בכמה פונקציות ניבוי ושאריות.
  2. pass: מחזיר את האובייקט ללא שינוי.
  3. fail: מחזיר את האובייקט רק אם הוא לא מכיל ערכים חסרים.

באופן דומה, איך מטפלים בנתונים קטגוריים חסרים ב-R? ישנן דרכים שונות להתמודד עם ערכים חסרים של דרכים קטגוריות.

  1. התעלם מתצפיות של ערכים חסרים אם אנו עוסקים במערכות נתונים גדולות ובמספר קטן יותר של רשומות יש ערכים חסרים.
  2. התעלם ממשתנה, אם הוא לא משמעותי.
  3. פתח מודל לניבוי ערכים חסרים.
  4. התייחס לנתונים חסרים כאל עוד קטגוריה.

באופן דומה אפשר לשאול, איך מגדירים ערכים חסרים ב-R?

ב ר , ערכים חסרים מיוצגים על ידי הסמל NA (לא זמין). בלתי אפשרי ערכים (למשל, חלוקה באפס) מיוצגים על ידי הסמל NaN (לא מספר). בניגוד ל-SAS, ר משתמש באותו סמל עבור תו ומספרי נתונים . לתרגול נוסף על עבודה עם מידע חסר , נסה את הקורס הזה בנושא ניקיון נתונים ב-R.

מה המשמעות של Na Rm ב-R?

בעת שימוש בפונקציית Dataframe לא . rm ב ר מתייחס לפרמטר הלוגי שאומר לפונקציה אם להסיר או לא NA ערכים מהחישוב. זה פשוטו כמשמעו פירושו NA לְהַסִיר. זו לא פונקציה ולא פעולה. זהו פשוט פרמטר המשמש מספר פונקציות Dataframe.

מוּמלָץ: