האם הצגה היא פעולה בניצוץ?
האם הצגה היא פעולה בניצוץ?

וִידֵאוֹ: האם הצגה היא פעולה בניצוץ?

וִידֵאוֹ: האם הצגה היא פעולה בניצוץ?
וִידֵאוֹ: מפגש ניצוצת בנושא גנטיקה ואינפורמציה. הצגת מחקרים 2024, נוֹבֶמבֶּר
Anonim

2 תשובות. הופעה הוא אכן א פעולה , אבל זה מספיק חכם כדי לדעת מתי זה לא חייב להפעיל הכל. אם היה לך orderBy זה היה לוקח הרבה זמן גם כן, אבל במקרה הזה כל הפעולות שלך הן פעולות מפה ולכן אין צורך לחשב את כל הטבלה הסופית.

רק כך, האם הספירה היא פעולה בניצוץ?

לספור () ל לספור מספר השורות. מכיוון שהוא יוזם את ביצוע ה-DAG ומחזיר את הנתונים לנהג, ה-an פעולה עבור RDD. מקרה 2: אם אתה מתקשר לספור ב-Dataframe, הוא יוזם את ביצוע ה-DAG ומחזיר את הנתונים למנהל ההתקן, שלו פעולה עבור Dataframe.

באופן דומה, מהי פעולה והתמרה בניצוץ? לְעוֹרֵר פעולות RDD. שני סוגים של אפאצ'י לְעוֹרֵר פעולות RDD הן- טרנספורמציות ו פעולות . א טרנספורמציה היא פונקציה שמייצרת RDD חדש מה-RDD הקיימים אך כאשר אנו רוצים לעבוד עם מערך הנתונים בפועל, בשלב זה פעולה מבוצע.

בהתאם, מהי פעולה בניצוץ?

פעולות הם הפעולה של RDD, הערך הזה חוזר בחזרה לתוכניות ה-Spar Driver, שמתחילות עבודה לביצוע באשכול. הפלט של טרנספורמציה הוא קלט של פעולות . להפחית, לאסוף, לקחת דוגמה, לקחת, תחילה, saveAsTextfile, saveAsSequenceFile, countByKey, foreach הם נפוצים פעולות באפאצ'י לְעוֹרֵר.

מה עושה אוסף () בניצוץ?

לאסוף (פונקציה) לאסוף מחזיר את הרכיבים של מערך הנתונים כמערך בחזרה לתוכנית מנהל ההתקן. לאסוף משמש לעתים קרובות בדוגמאות שסופקו בעבר כגון לְעוֹרֵר דוגמאות טרנספורמציה על מנת להראות את ערכי ההחזר. ה-REPL, למשל, ידפיס את ערכי המערך בחזרה לקונסולה.

מוּמלָץ: