מה זה שידור ניצוץ?
מה זה שידור ניצוץ?

וִידֵאוֹ: מה זה שידור ניצוץ?

וִידֵאוֹ: מה זה שידור ניצוץ?
וִידֵאוֹ: משה קליין - ניצוץ יהודי (Prod. By S Berger) Moshe Klein - Nitzotz Yehudi 2024, נוֹבֶמבֶּר
Anonim

מִשׁדָר משתנים ב- Apache לְעוֹרֵר הוא מנגנון לשיתוף משתנים בין מבצעים שנועדו להיות קריאה בלבד. לְלֹא מִשׁדָר משתנים המשתנים האלה יישלחו לכל מבצע עבור כל טרנספורמציה ופעולה, וזה יכול לגרום לתקורת רשת.

כמו כן, אנשים שואלים, מתי עליי לשדר ניצוץ?

מִשׁדָר משתנים משמשים בעיקר כאשר המשימות על פני שלבים מרובים דורשות את אותם נתונים או כאשר נדרשת אחסון הנתונים במטמון בצורה מסודרת. מִשׁדָר משתנים נוצרים באמצעות משתנה v על ידי קריאה ל-SparkContext.

כמו כן, מה זה מצברים ומשתני שידור בניצוץ? לְעוֹרֵר תומך בשני סוגים של שיתוף משתנים : משתני שידור , שבו ניתן להשתמש כדי לשמור ערך במטמון בזיכרון בכל הצמתים, ו מצברים , שהם משתנים שרק "מוסיפים" אליהם, כמו מונים וסכומים.

בהתחשב בכך, מהו מצבר ניצוצות?

מצברים הם משתנים ש"מתווספים" אליהם רק באמצעות פעולה אסוציאטיבית ולכן ניתן לתמוך בהם ביעילות במקביל. ניתן להשתמש בהם כדי ליישם מונים (כמו ב-MapReduce) או סכומים. לְעוֹרֵר תומך באופן טבעי מצברים של סוגים מספריים, ומתכנתים יכולים להוסיף תמיכה בסוגים חדשים.

איך אני מעדכן את משתנה השידור שלי ב-spark?

  1. העבר את חיפוש נתוני ההפניה ל-forEachPartition או forEachRdd כך שהוא יישאר כולו על העובדים.
  2. הפעל מחדש את ה-Spark Context בכל פעם שה-refdata משתנה, עם משתנה שידור חדש.

מוּמלָץ: