מה זה DataNode ו-NameNode ב-Hadoop?
מה זה DataNode ו-NameNode ב-Hadoop?

וִידֵאוֹ: מה זה DataNode ו-NameNode ב-Hadoop?

וִידֵאוֹ: מה זה DataNode ו-NameNode ב-Hadoop?
וִידֵאוֹ: Hadoop Rack Awareness 2024, נוֹבֶמבֶּר
Anonim

DataNodes נמצאים הצמתים של העבדים HDFS . בניגוד NameNode , DataNode היא חומרת סחורה, כלומר מערכת לא יקרה שאינה באיכות גבוהה או זמינות גבוהה. ה DataNode הוא שרת בלוק המאחסן את הנתונים בקובץ המקומי ext3 או ext4.

חוץ מזה, איך NameNode עובד ב-Hadoop?

NameNode מאחסן רק את המטא נתונים של HDFS - עץ הספריות של כל הקבצים במערכת הקבצים, ועוקב אחר הקבצים ברחבי האשכול. NameNode אינו מאחסן את הנתונים בפועל או את מערך הנתונים. הנתונים עצמם מאוחסנים למעשה ב-DataNodes. NameNode מהווה נקודת כשל יחידה ב Hadoop אֶשׁכּוֹל.

אפשר גם לשאול, מה זה NameNode RPC? ב-Hadoop, ה NameNode הוא מכונה יחידה שמתאמת פעולות HDFS במרחב השמות שלה. פעולות אלו כוללות קבלת מיקומי חסימה, רישום ספריות ויצירת קבצים. ה NameNode מקבל פעולות HDFS כ RPC קורא ומכניס אותם לתור שיחות FIFO לביצוע על ידי שרשורי קוראים.

לגבי זה, מה זה צמתים ב-Hadoop?

א צומת ב-hadoop פירושו פשוט מחשב שניתן להשתמש בו לעיבוד ואחסון. ישנם שני סוגים של צמתים ב-hadoop שֵׁם צוֹמֶת ונתונים צוֹמֶת . זה נקרא בתור א צוֹמֶת מכיוון שכל המחשבים הללו מחוברים זה לזה. NameNode ידוע גם בתור המאסטר צוֹמֶת.

מהו NameNode משני ב-Hadoop?

NameNode משני ב-hadoop הוא צומת ייעודי במיוחד ב HDFS אשכול שתפקידו העיקרי הוא לקחת נקודות ביקורת של המטא-נתונים של מערכת הקבצים הקיימים בהם צומת שם . זה לא גיבוי צומת שם . זה רק מחסומים ה-namenode מרחב השמות של מערכת הקבצים.