מהו מנוע עיבוד הנתונים מאחורי Amazon Elastic MapReduce?
מהו מנוע עיבוד הנתונים מאחורי Amazon Elastic MapReduce?

וִידֵאוֹ: מהו מנוע עיבוד הנתונים מאחורי Amazon Elastic MapReduce?

וִידֵאוֹ: מהו מנוע עיבוד הנתונים מאחורי Amazon Elastic MapReduce?
וִידֵאוֹ: Matt Rocklin: Data Science, Dask, Scale | Turn the Lens #12 2024, דֵצֶמבֶּר
Anonim

אמזון EMR משתמש ב- Apache Hadoop כפי שהוא מופץ מנוע עיבוד נתונים . Hadoop היא קוד פתוח, מסגרת תוכנת Java התומכת נתונים יישומים מבוזרים אינטנסיביים הפועלים על אשכולות גדולים שֶׁל חומרה.

יתר על כן, מהו Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) הוא שירותי האינטרנט של אמזון ( AWS ) כלי לעיבוד וניתוח ביג דאטה. אמזון EMR מעבד נתונים גדולים על פני אשכול Hadoop של שרתים וירטואליים על אמזון אלסטי מחשוב ענן ( EC2 ) ו אֲמָזוֹנָה שירות אחסון פשוט ( S3 ).

יתר על כן, האם אמזון EMR מנוהל במלואו? זה מנוהל באופן מלא שירות data lake שיכול לנתק אחסון נתונים ממשאבי מחשוב ובמקום זאת הופך את אשכולות המחשוב לניתנים להרחבה, זמינים לשימוש לפי דרישה, וכולל את היכולת למספר אשכולות לגשת לאותם מערכי נתונים בו-זמנית.

אפשר גם לשאול, איך עובד AWS EMR?

בדרך כלל, כאשר אתה מעבד נתונים ב אמזון EMR , הקלט הוא נתונים המאוחסנים כקבצים במערכת הקבצים הבסיסית שבחרת, כגון אֲמָזוֹנָה S3 או HDFS. נתונים אלה עוברים משלב אחד לאחר ברצף העיבוד. השלב האחרון כותב את נתוני הפלט למיקום מוגדר, כגון אֲמָזוֹנָה דלי S3.

מה ההבדל בין ec2 ל-EMR?

בניגוד EMR , EC2 אינו מקטלג את צמתי העבדים לצמתי ליבה ומטלות. זה מגדיל את הסיכון לאובדן נתוני HDFS במקרה שצומת יוסר/אובד. EC2 משתמש בספריות Apache (s3a) כדי לגשת לנתונים ב-s3. מצד שני, EMR משתמש בקוד קנייני של AWS כדי לקבל גישה מהירה יותר ל-s3.

מוּמלָץ: