מה זה AWS MapReduce?
מה זה AWS MapReduce?

וִידֵאוֹ: מה זה AWS MapReduce?

וִידֵאוֹ: מה זה AWS MapReduce?
וִידֵאוֹ: פרוייקט גמר- חלק ג' (MapReduce) 2024, נוֹבֶמבֶּר
Anonim

אמזון אלסטי MapReduce (EMR) הוא שירותי אינטרנט של אמזון ( AWS ) כלי לעיבוד וניתוח ביג דאטה. Amazon EMR מעבד נתונים גדולים על פני אשכול Hadoop של שרתים וירטואליים על Amazon Elastic Compute Cloud (EC2) ושירות אמזון פשוט אחסון (S3).

באופן זה, איך עובד AWS EMR?

השירות מתחיל מספר שצוין על ידי הלקוח של מופעי Amazon EC2, המורכב ממאסטר אחד וממספר צמתים אחרים. אֲמָזוֹנָה EMR מריץ תוכנת Hadoop במופעים אלה. הצומת הראשי מחלק את נתוני הקלט לבלוקים, ומפיץ את העיבוד של הבלוקים לשאר הצמתים.

מלבד לעיל, מה ההבדל בין ec2 ל- EMR? בניגוד EMR , EC2 אינו מקטלג את צמתי העבדים לצמתי ליבה ומטלות. זה מגדיל את הסיכון לאובדן נתוני HDFS במקרה שצומת יוסר/אובד. EC2 משתמש בספריות Apache (s3a) כדי לגשת לנתונים ב-s3. מצד שני, EMR משתמש בקוד קנייני של AWS כדי לקבל גישה מהירה יותר ל-s3.

חוץ מזה, האם AWS EMR מנוהל במלואו?

אֲמָזוֹנָה מפה אלסטית הקטנת ( EMR ) הוא מנוהל באופן מלא פלטפורמת Hadoop ו-Spark מ אֲמָזוֹנָה שירות רשת ( AWS ). עם EMR , AWS לקוחות יכולים ליצור במהירות אשכולות Hadoop מרובי צמתים כדי לעבד עומסי עבודה ב-Big Data.

האם AWS משתמשת ב-Hadoop?

אֲמָזוֹנָה שירותי אינטרנט שימושים אפאצ'י בקוד פתוח Hadoop טכנולוגיית מחשוב מבוזרת כדי להקל על גישה לכמויות גדולות של כוח מחשוב להפעלת משימות עתירות נתונים. Hadoop , גרסת הקוד הפתוח של MapReduce של גוגל, כבר נמצאת בשימוש חברות כמו יאהו ופייסבוק.

מוּמלָץ: