תוכן עניינים:

מה הם חריגים בניתוח נתונים?
מה הם חריגים בניתוח נתונים?

וִידֵאוֹ: מה הם חריגים בניתוח נתונים?

וִידֵאוֹ: מה הם חריגים בניתוח נתונים?
וִידֵאוֹ: תואר ראשון בהנדסת נתונים ומידע בטכניון - פרופ' אביגדור גל 2024, מאי
Anonim

בסטטיסטיקה, א חריג הוא נתונים נקודה השונה באופן משמעותי מתצפיות אחרות. א חריג עשויה לנבוע משונות במדידה או שהיא עשויה להצביע על טעות ניסיונית; האחרונים מודרים לפעמים מה- נתונים מַעֲרֶכֶת. א חריג יכול לגרום לבעיות חמורות ב ניתוח סטטיסטי.

בהתחשב בכך, כיצד מוצאים חריגים בנתונים?

נקודה שנופלת מחוץ ל נתונים פגעי הסט מסווגים כקטינים חריג , בעוד שנופל מחוץ לגדרות החיצוניות מסווג כרב-סרן חריג . כדי למצוא את הגדרות הפנימיות עבורך נתונים קבע, ראשית, הכפל את הטווח הבין-רבעוני ב-1.5. לאחר מכן, הוסף את התוצאה ל-Q3 והוריד אותו מ-Q1.

מלבד לעיל, האם עלי להסיר חריגים מהנתונים שלי? ל ה לרוב, אם הנתונים שלך מושפע מהמקרים הקיצוניים האלה, אתה פחית כָּרוּך ה קלט לנציג היסטורי של הנתונים שלך שלא כולל חריגים . קבע על בסיס כל מקרה לגופו מה ה השפעה של החריגים היה. ומשם תחליט אם אתה רוצה לְהַסִיר , לשנות או לשמור חריג ערכים.

ביחס לכך, כיצד מתמודד ניתוח נתונים עם חריגים?

להלן ארבע גישות:

  1. זרוק את הרשומות החריגות. במקרה של ביל גייטס, או חריג אמיתי אחר, לפעמים עדיף להסיר לחלוטין את הרשומה הזו ממערך הנתונים שלך כדי למנוע מהאדם או האירוע הזה להטות את הניתוח שלך.
  2. תגדיר את נתוני החריגות שלך.
  3. הקצה ערך חדש.
  4. נסה שינוי.

מהי דוגמה לחריגה?

חריג . יותר ערך ש"שוכב בחוץ" (קטן או גדול בהרבה מ) רוב הערכים האחרים בקבוצת נתונים. ל דוגמא בציונים 25, 29, 3, 32, 85, 33, 27, 28 שניהם3 ו-85 הם " חריגים ".

מוּמלָץ: