תוכן עניינים:

איך משתמשים בהקצאת Dirichlet סמויה?
איך משתמשים בהקצאת Dirichlet סמויה?

וִידֵאוֹ: איך משתמשים בהקצאת Dirichlet סמויה?

וִידֵאוֹ: איך משתמשים בהקצאת Dirichlet סמויה?
וִידֵאוֹ: Intuition behind Latent Dirichlet Allocation (LDA) for Topic Modeling 2024, נוֹבֶמבֶּר
Anonim

מה זה LDA?

  1. בחר את סט החלקים הייחודי שלך.
  2. בחר כמה חומרים מרוכבים אתה רוצה.
  3. בחר כמה חלקים אתה רוצה לכל מורכב (דוגמה מ-Poisson הפצה ).
  4. בחר כמה נושאים (קטגוריות) אתה רוצה.
  5. בחר מספר בין לא-אפס לאינסוף חיובי וקרא לו אלפא.

באופן דומה, אתם עשויים לשאול, האם הקצאת Dirichlet סמויה היא למידת מכונה?

הקצאת דיריכלה סמויה ( LDA ) הוא מודל הסתברותי גנרטיבי של קורפוס. הרעיון הבסיסי הוא שמסמכים מיוצגים כתערובת אקראית חָבוּי נושאים, כאשר כל נושא מאופיין בחלוקה על פני מילים.

באופן דומה, כיצד פועל מודלים של נושאים ב-LDA? LDA מניח שמסמכים מופקים מתערובת של נושאים. הנושאים האלה יוצרים מילים על סמך התפלגות ההסתברות שלהם. בהינתן מערך נתונים של מסמכים, LDA חוזר אחורה ומנסה להבין אילו נושאים היה ליצור את המסמכים האלה מלכתחילה. LDA היא טכניקת פירוק מטריצה.

לגבי זה, איך מבטאים הקצאת Dirichlet סמויה?

ניתן לבטא את "ch" כמו צליל "sh" או צליל "k" קשה. ואת הסיום "et" ניתן לבטא באופנה הצרפתית כ"שכב" או כ"לתת" עם צליל "t" קשה. הקצאת דיריכלה סמויה הוסבר לראשונה במאמר מחקר משנת 2003, אך כמו רוב הטכניקות, הרעיונות המרכזיים פורסמו קודם לכן.

האם הקצאת דיריכלת סמויה מפוקחת או ללא פיקוח?

זה נכון LDA הוא לא מפוקח שיטה. עם זאת, ניתן להרחיב אותו עד א בפיקוח אחד.

מוּמלָץ: