תוכן עניינים:

האם אני יכול להפעיל את Python על Hadoop?
האם אני יכול להפעיל את Python על Hadoop?

וִידֵאוֹ: האם אני יכול להפעיל את Python על Hadoop?

וִידֵאוֹ: האם אני יכול להפעיל את Python על Hadoop?
וִידֵאוֹ: Data Science with Python! Analyzing File Types from Avro to Stata 2024, מאי
Anonim

עם בחירה בין שפות תכנות כמו Java, Scala ו פִּיתוֹן ל Hadoop מערכת אקולוגית, רוב המפתחים משתמשים פִּיתוֹן בגלל הספריות התומכות שלה למשימות ניתוח נתונים. Hadoop סטרימינג מאפשר למשתמש ליצור ו לבצע מפה/הפחת עבודות עם כל סקריפט או קובץ הפעלה כמאפר או/ו כמפחית.

באופן דומה, נשאל, איך Python מתחבר ל-Hadoop?

חיבור Hadoop HDFS עם Python

  1. שלב 1: ודא ש-Hadoop HDFS פועל כהלכה. פתח את המסוף/שורת הפקודה, בדוק אם HDFS פועל באמצעות הפקודות הבאות: start-dfs.sh.
  2. שלב 2: התקן את ספריית libhdfs3.
  3. שלב 3: התקן את ספריית hdfs3.
  4. שלב 4: בדוק אם החיבור עם HDFS הצליח.

באופן דומה, מה זה Hadoop ב- Python? פִּיתוֹן היא שפת תכנות מלאה לשימוש כללי שניתן להשתמש בה כדי לעשות כמעט הכל בעולם התכנות. Hadoop היא מסגרת נתונים גדולה שנכתבה ב-Java כדי להתמודד עם כמויות עצומות של נתונים. ישנם מכונים מקוונים רבים אשר Hadoop עם פִּיתוֹן קורסים כגון: Analytixlabs. אדורקה.

לאחר מכן, השאלה היא איך אני מפעיל תוכנית Python MapReduce ב-Hadoop?

כתיבת תוכנית Hadoop MapReduce ב-Python

  1. מוֹטִיבָצִיָה.
  2. מה אנחנו רוצים לעשות.
  3. דרישות מוקדמות.
  4. Python MapReduce Code. שלב מפה: mapper.py. צמצום שלב: reducer.py.
  5. הפעלת קוד Python על Hadoop. הורד נתוני קלט לדוגמה. העתק נתונים מקומיים לדוגמה ל- HDFS.
  6. קוד Mapper ו-Reducer משופרים: שימוש באיטרטורים ומחוללים של Python. mapper.py. reducer.py.

מה זה Hadoop Streaming jar?

Hadoop הפצה מספקת תוכנית שירות Java בשם הזרמת Hadoop . הוא ארוז בתוך א קַנקַן קוֹבֶץ. עם הזרמת Hadoop , נוכל ליצור ולהריץ משרות של Map Reduce עם סקריפט בר הפעלה. הזרמת Hadoop הוא כלי עזר שמגיע עם Hadoop הפצה. זה יכול לשמש לביצוע תוכניות לניתוח נתונים גדולים.

מוּמלָץ: