בעיבוד שפה טבעית, תיוג תפקידים סמנטי (נקרא גם ניתוח סמנטי רדוד) הוא תהליך שמתייג מילים או ביטויים במשפט לפי תפקידם הסמנטי במשפט, כגון מבצע, מטרה, או תוצאה.
תיוג תפקידים סמנטי משמש למציאת "משמעות" המשפט. לשם כך הוא מוצא את הארגומנטים הקשורים לפרדיקטים או לפעלים המופיעים במשפט ומה תפקידו של כל ארגומנט.
היסטוריה
בשנת 1968, הוצע הרעיון לתיוג תפקידים סמנטי לראשונה על ידי צ'ארלס פילמור. הצעתו הובילה לפיתוחו של פרויקט FrameNet, שהפיק את הלקסיקון החישובי הגדול הראשון שתיאר פרדיקטים רבים ואת תפקידם. פרויקט זה דרש משאבים רבים. דן ג'ורפסקי ודניאל גילדע פיתוח מערכת אוטומטית ראשונה שמבוססת על FrameNet.
קורפוס נוסף שמשמש למשימת התיוג הסמנטי הוא PropBank. מערכות אוטומטיות רבות לתיוג תפקידים סמנטיים משתמשות בקורפוס זה כסט הלמידה שלהן.
תיוג סמנטי של דוגמאות אימון כמו ב-PropBank או ב-FrameNet דרש משאבים רבים מאוד, בין היתר מפני שלא כל דובר שפה היה יכול לתייג את דוגמאות האימון, אלא היה צורך במומחים בבלשנות כדי לבצע תיוגים נכונים.
בשנת 2015 הוצעה שיטה חדשה בשם QA-SRL (Question-Answer Driven Semantic Role Labeling). שיטה זו משתמשת בשפה טבעית בשביל לתייג שפה טבעית. לפי שיטה זו, כל דובר שפה יכול לתייג משפטים, על ידי מענה על שאלות פשוטות שמגיעות בפורמט מובנה. זהו יתרון מובהק של השיטה, שכן אפשר להשתמש ב-crowdsourcing זול ומהיר בשביל לתייג דוגמאות אימון ובכך להשיג מדגמי אימון גדולים מאוד, מה שעשוי להביא לשיפור בתוצאות.[1]
שימושים
תיוג תפקידים סמנטי משמש כדי לגרום למחשב להבין את התפקידים הסמנטיים של מילים בתוך משפטים. תיוג טוב יותר של תפקידים סמנטיים במשפט עשוי להוביל לשיפור במשימות כגון תרגום מכונה, מענה לשאלות, חילוץ מידע, סיכום טקסט אוטומטי, כריית נתוני טקסט וזיהוי דיבור.
ראו גם
הערות שוליים