74
תתתתת תתתתתתת תתתתתתת תתתת תתתתתת תתתתת תתתתתתת- תתתתתתת תתתתת תתתתת תתתת תתת"ת תתתתתתת תתתת' תתתת- תתת תתתת תתתת תתתת תתתתת1

סמינר בבלשנות חישובית

  • Upload
    adila

  • View
    53

  • Download
    5

Embed Size (px)

DESCRIPTION

סמינר בבלשנות חישובית. מבנה מרכיבי המשפט הפקולטה למדעי המחשב - הטכניון חורף תשע"ג. הדר אורן וברק בנגד - בהנחיית פרופ' עוזי אורנן. מבנה מרכיבי המשפט - תוכן עניינים. בהרצאה זו נדבר על הנושאים הבאים: ניתוח תחבירי של המשפט - מרכיבים. ניתוח תחבירי של המשפט - קטגוריות וצירופים. דקדוקים. - PowerPoint PPT Presentation

Citation preview

Page 1: סמינר בבלשנות חישובית

סמינר בבלשנות חישוביתמבנה מרכיבי המשפט

הפקולטה למדעי המחשב - הטכניוןחורף תשע"ג

הדר אורן וברק בנגד - בהנחיית פרופ' עוזי אורנן1

Page 2: סמינר בבלשנות חישובית

מבנה מרכיבי המשפט - תוכן ענייניםבהרצאה זו נדבר על הנושאים הבאים:ניתוח תחבירי של המשפט - מרכיבים.

ניתוח תחבירי של המשפט - קטגוריות וצירופים.דקדוקים.

מהצרוף ועד המשפט.מיון חלקי הדיבר.

2

Page 3: סמינר בבלשנות חישובית

הקדמהמהו ניתוח של משפט?

ניתוח המבנה של המשפט: נושא, נשוא, 1(מושא, וכיוב'.

זההסטודנטים נהנים מאד

ז2(

ניתוח לפי קטגוריות וצירופים במשפט: 2(שם-עצם, פועל, תואר, צירוף-שמני

וכיוב'.

לוואינשואנושא

3

Page 4: סמינר בבלשנות חישובית

(Ambiguityדו-משמעות / עמימות )המונח כפל משמעות / דו-משמעות / עמימות, מתאר מצב שבו ניתן לפרש את אותה מחרוזת

של מילים ביותר מדרך אחת.

נבחין בין שני סוגים של דו-משמעות:דו-משמעות לקסיקליתדו-משמעות מבנית

4

Page 5: סמינר בבלשנות חישובית

.(Lexical Ambדו-משמעות לקסיקלית )משפטים הם בעלי דו-משמעות לקסיקלית

משום שהם מכילים מילים דו-משמעיות.

"הדר ביקרה את ברק""אברהם נשא את שרה"

ובלעז:“Bill claimed that he saw her duck”

5

Page 6: סמינר בבלשנות חישובית

Structural )1דו-משמעות מבנית Amb).

הפרושים השונים במשפט בעל דו-משמעות מבנית נובעים מכך, שאנו יכולים לייחס לאותה

המחרוזת מבנים דקדוקיים שונים.

ברק חיפש את הדר במכונית.הדר התרשמה מסיסמות הבחירות המוצלחות.

the tall bishop’s hat.

6

Page 7: סמינר בבלשנות חישובית

.Structural Amb )2דו-משמעות מבנית the [tall bishop]’s hatthe tall [bishop’s hat]

דוגמאות אלו ממחישות ,שמילים מתקבצות ( או פסוקית, phraseלקבוצות בתור צרוף )

וזיהוי הקיבוץ לעיתים הכרחי בקביעת המשמעות.

7

Page 8: סמינר בבלשנות חישובית

Structural )3דו-משמעות מבנית Amb).

איך נגדיר את הסביבה שבה המילים מתקבצות ליצירת משמעות יחידה?

האם זו מסגרת הצרוף שהמילה נתונה בו (phrase?)

האם זו היחידה התחבירית המיידית, הפסוקית (clause?)

האם זה המשפט הגדול המכיל את הפסוקית, (?sentenceשהמילה נמצאת בו )

או אולי תחום החיים שהטקסט מדבר עליו?

8

Page 9: סמינר בבלשנות חישובית

Structural )4דו-משמעות מבנית Amb).

הדוגמה הבאה לקוחה מכותרת אמיתית בעיתון:

Reagan Wins On Budget, But More Lies Ahead

דוגמה מסוג זה מדגימה את חשיבות סביבת המילה ואת חשיבות הקטגוריה התחבירית של

המילה.]]But [More [Lies Ahead]But [[More Lies] Ahead 9

Page 10: סמינר בבלשנות חישובית

(Constituents )1מרכיבים מרכיב - מילה או קבוצת מילים המתפקדות

כיחידה אחת במבנה היררכי.דוגמה בלעז )מלזית(:

Ahmad is eating rice.This person is eating fish.That old person is eating banana.Ahmad is eating that big fish.

Ahmad | makan | nasi.Orang ini | makan | ikan.Orang tua itu | makan | pisang.Ahmad | makan | ikan besar itu. כל מרכיב מהווה יחידה סמנטית, וטמון בותפקיד דקדוקי אחד.

10

Page 11: סמינר בבלשנות חישובית

2מרכיבים ש: האם בכל מצב שבו קבוצת מילים מרכיבה יחידה

מבחינת סדר המילים?רציפהסמנטית היא גם

מורכב משתי מילים: ’ small child‘ הנושאשם-עצם ותואר.

הנ"ל מופרדים במשפט, ולא מהווים יחידה רציפה.

ת: לא! 

:Warlpiriלמשל בשפת ה-

11

Page 12: סמינר בבלשנות חישובית

3מרכיבים ש: האם בכל מצב שבו קבוצת מילים מרכיבה יחידה

מבחינת סדר המילים?רציפהסמנטית היא גם

דוגמא ברוסית:Vshkolu | umnei | padhol | malchik

ילד הלך חכם)ל(בית ספר מילולית:מופרדים במשפט, ולא חכם ו- ילד גם בדוגמה זו,

מהוויםיחידה רציפה.

ת: לא!

12

Page 13: סמינר בבלשנות חישובית

13

דוגמא בלטינית:"Castra sunt in Italia contra populum Romanum in Etruriae faucibus conlocata” Marcus Tullius Cicero

שממוקמים באיטליה נגד העם הרומי מחנותיש במעברים הצרים באטרוריה

Castraמחנות = conlocataממוקמים )תואר( =

4מרכיבים

Page 14: סמינר בבלשנות חישובית

1זיהוי המרכיבים מחרוזות מילים שניתן להחליף אותן במילה בודדת במיקום

מסוים במשפט, חייבות להיות ביחידה אחת )כלומר, מרכיב( מאותו הסוג.

בדוגמה שראינו -Orang tua itu | makan | pisang. That old person is eating banana.

, Orang tua itu אנו רואים, שניתן להחליף את צרוף המילים.He או Ahmadבמילה בודדת, כדוגמת

כשניתן "להזיז" קבוצה של מילים כיחידה אחת, אנו יכולים להניח שהקבוצה מהווה מרכיב תחבירי.

לפני שהתחילו כל הפקקים.נסענו לתל-אביב נסענו לתל-אביב. לפני שהתחילו כל הפקקים

14

Page 15: סמינר בבלשנות חישובית

2זיהוי המרכיבים עוד כלי לזיהוי המרכיבים, הוא שניתן להחליפם במילת

שאלה.

למשל בדוגמה הבאה:

אוהב שוקולד ועוגות גבינה.אני

אוהב שוקולד ועוגות גבינה?מי

15

Page 16: סמינר בבלשנות חישובית

3זיהוי המרכיבים באופן דומה, מרכיבים יכולים להוות תשובה לשאלה, בעוד

שמחרוזת מילים שאינה מרכיב תחבירי, היא לא תשובה אפשרית.

.חוץ מהדרכל הילדים קופצים רוקדים,

הדרמי לא קופץ רוקד? חוץ מי לא קופץ רוקד?

16

Page 17: סמינר בבלשנות חישובית

מרכיבים - סיכוםמחרוזות מסוימות מהוות מרכיב תחבירי, משום שמחרוזות אלו:

יכולות להחליף או להיות מוחלפות ע"י מילה בודדת.1((הדרב הילדה הקטנה )ניתן להחליף את המרכיב

יכולות להיות מוזזות כיחידה אחת.2(לפני שהתחילו כל הפקקים.)נסענו לתל-אביב

נסענו לתל-אביב.(לפני שהתחילו כל הפקקים )אני אוהב. מי אוהב?(יכולות להיות מוחלפות ע"י מילת שאלה. 3()מי אוהב? אני אוהב.(יכולות לתפקד כתשובה לשאלה. 4(

איסוף נתונים אלו דורש ידע רב בדקדוק בשפה.כאשר מתחילים ללמוד שפה חדשה מאפס, זה הגיוני להניח

הנחות לגבי מבנה מרכיבי המשפט, המבוססות על גורמים כגוןמשמעות ופוטנציאל חלופה.

17

Page 18: סמינר בבלשנות חישובית

מבנה מרכיבי המשפט - תוכן עניינים

.ניתוח תחבירי של המשפט - מרכיביםניתוח תחבירי של המשפט - קטגוריות

וצירופים.דקדוקים.

מהצרוף ועד המשפט.מיון חלקי הדיבר.

18

Page 19: סמינר בבלשנות חישובית

1היררכיה - היחידה התחבירית הקטנה ביותר שיכולה (clauseפסוקית )

)המחנכת להביע רעיון שלם. הפסוקית תמיד במבנה של משפט הדגולה העבירה הרצאה(

- קבוצת מילים, אשר יכולה לתפקד כמרכיב (phraseצרוף ))המחנכת הדגולה(. בפסוקית פשוטה

משפט יכול להכיל פסוקית אחת, או מספר פסוקיות.•פסוקית בודדת יכולה להכיל מספר צרופים.•צרוף אחד יכול להכיל מספר מילים.•מילה יחידה יכולה להכיל מספר צורנים או מורפמות•

)מורפמה - יסוד בעל ערך משמעותי במבנה הדקדוקי(.

19

Barak B
p
Page 20: סמינר בבלשנות חישובית

2היררכיה משפט, אשר מהווה יחידה דקדוקית בנויה היטב ושלמה,

מורכב ממרכיבים, אשר הם בעצמם יחידות דקדוקיות הבנויות היטב )פסוקיות, צרופים, וכיוב'(.

קיים מספר קטן )וסופי( של יחידות בסיסיות כאלו )שם-עצם, פועל, צירוף שמני, שם-תואר, וכיוב'(.

הארגון המבני הזה בנוי מיחידות אלו, אשר יוצרות את היחידה השלמה.

20

Page 21: סמינר בבלשנות חישובית

קטגוריות תחביריותעל-מנת להבין את תפקיד המילים והצרופים

במשפט, עלינו לסווג אותן לקטגוריות תחביריות )פועל, שם-תואר, צירוף שמני, צירוף פעלי

'(.וכיוב

נפתח בקטגוריות מילים, דהיינו, קטגוריות לקסיקליות, שבעקבותיהן נקבעות הקטגוריות של

הצרופים.

21

Page 22: סמינר בבלשנות חישובית

1קטגוריות לקסיקליות / חלקי הדיבר לחלקי הדיבר מבוססת על מסורתיתהגדרה

תכונות סמנטיות כמובא להלן:

.פועל - מילה המכנה פעולה או אירוע.שם-עצם - מילה המכנה אדם, מקום או דבר.שם-תואר - מילה המכנה מצב או תכונה

22

Page 23: סמינר בבלשנות חישובית

2חלקי הדיבר עם זאת,

:סיווג זה נכשל בזיהוי שמות-פעולה כגוןdestruction, theft.הליכה, כתיבה ,

'לא ניתן להבדיל בין הפועל ובין השם - 'שומר)שומר גן החיות / שומר נפשו ירחק מהם )משלי כב ה((.

)חכם - שם-עצם? )מלומד ובקי בתורהתואר? )נבון, פיקח(

23

Page 24: סמינר בבלשנות חישובית

3חלקי הדיבר ומה לגבי המשפטים הבאים:

שתיתי את השלובלובגצצתי את השולחן, וחשבתי לעצמי כי הדבר מאד

משוטב

האם עליי לדעת מהו שלובלוב בשביל לדעתלאיזו קטגוריה הוא שייך?

?ומה לגבי גצצתי? ומשוטב

24

Page 25: סמינר בבלשנות חישובית

4חלקי הדיבר אנו מבינים שסיווג כזה לא יכול להיות מבוסס על

תכונות סמנטיות, משום של"מילים" כאלו אין בכלל משמעות.

נשתמש בתכונות של מילים אלו, כגון התכונות המורפולוגיות על מנת לנחש את תפקידו במשפט.

נבחין כי העברית שונה בתכונותיה מן האנגלית )באנגלית מיקומה של המילה במשפט יכול לרמוז

על תפקידה(.25

Page 26: סמינר בבלשנות חישובית

5חלקי הדיבר שיוך המילים לקטגוריות כרוך בשתי שאלות מהותיות:

אילו מילים שייכות יחד לאותה הקטגוריה?1()למשל - האם אכל, לאכול ואכילה באותה קטגוריה? האם אכל ונשם

באותה קטגוריה?(בתשובה לשאלה יינתן ייחוס לתכונות הדקדוקיות השונות

שיכולות להיות שונות בכל שפה.

איך ראוי לקבוע את השם הראוי לקטגורית מילים 2(נתונה?

תשובה לשאלה זו לרוב מבוססת על התכונות הסמנטיות המקובלות, אשר משותפות לשפות רבות.

26

Page 27: סמינר בבלשנות חישובית

6חלקי הדיבר נראה שלמילים בקטגוריות שונות תכונות

דקדוקיות שונות באמצעות הדוגמאות הבאות.

בעברית: שם-הפעולה לעומת פועל ושם-התואר foolבאנגלית: עבור שם-העצם foolish.

27

Page 28: סמינר בבלשנות חישובית

7חלקי הדיבר :בעברית

- פועל ניתן א. הטייה לפי ממ"ג )מין, מספר, גוף( להטות לפי ממ"ג ושם פעולה לא:

שתה / שתיתם / שתינו

- לשם פעולה ניתן להוסיף תווית ידוע תווית ידוע ב. ולפועל לא:

הכתיבה הלגם / הלגמה / הלגמנו

28

Page 29: סמינר בבלשנות חישובית

8חלקי הדיבר :באנגלית

- שם-עצם אל מול ( intensifiersשינוי ע"י העצמה )א. שם-תואר:

They are utter fools. They are very fools. They are utter foolish. They are very foolish.

ריבוי: ב. fool foolsfoolish foolishes

29

Page 30: סמינר בבלשנות חישובית

9חלקי הדיבר רק לאחר שיוך המילים לקטגוריות, כמוצג לעיל, עבור

שפה כלשהי, ניתן לכנות אותן בשמות )שם-עצם, פועל, וכיוב'( ע"פ תבניות רעיוניות )סמנטיות( המשותפות

להרבה שפות.

: מילה אשר מבטאת את כל התכונות הדקדוקיות הגדרה של אב-טיפוסאשר שייכות לקטגוריה מסוימת, נקראת

המחלקה.

שמות הקטגוריות יקבעו על-פי אבות הטיפוס. למשל, את הקטגוריה, אשר אבות הטיפוס שלה מכילים

אתרוב המילים המייצגות עצמים מוחשים )שולחן, חלון,

מחברת(, נכנה "שם-עצם".30

Page 31: סמינר בבלשנות חישובית

1צרופים וקטגוריות של צרופים צרוף היא קבוצה של מילים שמהווה מרכיב

(constituent .)+

: צרוף הוא קבוצת מילים, אשר יכולה לתפקד הגדרהכמרכיב בפסוקית.

איך נדע איך לחלק את הצרופים לקטגוריות?

צרוף הוא נמוך יותר בהיררכית הדקדוק מאשר פסוקית.

31

Page 32: סמינר בבלשנות חישובית

נסתכל על קבוצת הקטגוריות הנפוצות הבאה:N = )Noun( שם עצם ; NP = )Noun Phrase( צרוף שמני V = )Verb( פועל ; VP = )Verb Phrase( צרוף פעליP = )Preposition( מילת יחס ; PP = )Prepositional

Phrase( צרוף יחסA = )Adjective( שם תואר; AP = )Adjectival Phrase(

צרוף תאריADV = )Adverb(תואר הפועל ; ADVP = )Adverbial Phrase( צרוף של תואר הפועל;D = )Determiner( תוויתM = )Modal( פועל עזר

2צרופים וקטגוריות של צרופים

32

Page 33: סמינר בבלשנות חישובית

3צרופים וקטגוריות של צרופים גם כאן, בהגדרת הקטגוריות של הצרופים, אנו

נתקלים באותן שתי שאלות מהותיות:

איך אנו יודעים האם שני צרופים שייכים 1(לאותה קטגוריה או לקטגוריות שונות?

איך אנו יודעים איך עלינו לכנות קטגוריה 2(מסוימת של צרופים?

33

Page 34: סמינר בבלשנות חישובית

4צרופים וקטגוריות של צרופים שני צרופים שייכים לאותה הקטגוריה אם הם

חולקים את אותן תכונות דקדוקיות.למשל הצרופים השמניים:

חזרה שוב ושוב על בקשתההילדה הקטנה חזרה שוב ושוב על בקשתהחברת הסגל

מבחן שימושי לקביעה האם שני צרופים שייכים לאותה mutualהקטגוריה הוא מבחן החלופה ההדדית )

substitutability.)

34

Page 35: סמינר בבלשנות חישובית

מבחן החלופה ההדדיתמבחן החלופה ההדדית כרוך בעקרון ששני

צרופים השייכים לאותה הקטגוריה יכולים להיות בעלי אותו תפקיד במשפט. דוגמה:

דיבר רבותהמרצה השנון והגבוה דיבר רבותהסטודנט המחונן

עם-זאת, ייתכן כי החלופה איננה מתאימה בשל סיבות סמנטיות.

התפוח הירוקאכלתי את החדישהטלפוןאכלתי את

35

Page 36: סמינר בבלשנות חישובית

1צרופים וקטגוריות של צרופים ואיך נדע איך נכנה קטגוריות אלו?

ברוב הצרופים, ניתן לזהות מילה אחת בתור "המילה ."גרעין הצרוף"החשובה ביותר". מילה זאת נקראת

גרעין הצרוף קובע הרבה מתוך התכונות הדקדוקיות שלהצרוף הכולל.

.הגרעין עשוי לקבוע את מספר המרכיבים וסוגם בצרוףהגרעין בד"כ יהיה הכרחי, בעוד ששאר הרכיבים בצרוף לא

יהיו הכרחיים.אכלה ארטיק ילדת הקומה השניה אכלה ארטיקהקומה השניה

the beautiful girl ate ice-cream the beautiful ate ice-cream

[זה דבר רגיל, לא יוצא דופן]אך יש יוצאי דופן / הילדה היפה אכלה ארטיק היפה אכלה ארטיק

36

Page 37: סמינר בבלשנות חישובית

2צרופים וקטגוריות של צרופים לא כל קטגוריה לקסיקלית )ברמת המילה( יכולה לשמש כגרעינים

לצרופים.

קטגוריות ראשיות - קטגוריות לקסיקליות שיכולות לשמש כגרעינים לצרופים.

שם-עצם - כלב, מים, אדיבות...פועל - רץ, נמס, אהב...

שם-תואר - גדול, אדום, משובח...

קטגוריות משניות - קטגוריות לקסיקליות שאינן יכולות לשמש כגרעינים לצרופים.

מילת איחוי - גם, או, אבל...מילת קריאה - האח! וואי! אבוי!...

/מספרים - שלושה, חמישה, של... מיליות אחרות37

Page 38: סמינר בבלשנות חישובית

קטגוריות של מילים וצרופים האם יש יוצאי דופן בתוך הקטגוריה?

נסתכל על הפועל משכתי: )משכתי את כל כספי )מהבנק

משכתי הפועל משכתי מחייב צרוף שמני אחריו.

המגבלות על פעלים הן תחביריות בלבד. הפעלים מתמיינים לסוגים שונים לפי מספר הארגומנטים שהם מקבלים.

[= תכונות מילים הנמצאות באותה קטגוריה יכולות לקבל טווח שונה של ארגומנטים. ?]

38

Page 39: סמינר בבלשנות חישובית

הצגת הצרופים בפסוקיתמשימה חשובה בניתוח המבנה הדקדוקי של משפט היא

לזהות את:א. מרכיבי המשפט

ב. סדר הופעתם של מרכיבי המשפט.

ראינו כבר את השיטה להפרדת מרכיבי המשפט ע"י קוים אנכיים, למשל:

הכלב הזה | אוכל להנאתו | עצם גדולה מאד

שיטה זו אינה מספקת עבור מבנים יותר מורכבים.

39

Page 40: סמינר בבלשנות חישובית

הצגת הצרופים בפסוקית - דיאגרמת עץאחת הדרכים הנפוצות ביותר לייצג מידע אודות מרכיבי המשפט והסדר בו המרכיבים מופיעים במשפט היא באמצעות דיאגרמת

עץ.A

B C מורכבת Aעבור הדיאגרמה הנ"ל, נאמר שיחידה מקטגוריה

, המופיעים בסדר הזה.C ו-Bמשני מרכיבים מקטגוריות

כאשר דיאגרמות עץ משמשות לייצוג מבנה לשוני,תויות הצמתים מספקות עבור כל יחידה את המידע הבא:

הקטגוריה התחבירית )שם-עצם, פועל וכיוב'(1(הרמה שלו בהיררכיה הדקדוקית.2(

בהמשך נתאר היררכיות עצים יותר גדולות.40

Page 41: סמינר בבלשנות חישובית

מבנה מרכיבי המשפט - תוכן עניינים

.ניתוח תחבירי של המשפט - מרכיבים.ניתוח תחבירי של המשפט - קטגוריות וצרופים

דקדוקים.מהצרוף ועד המשפט.

מיון חלקי הדיבר.

41

Page 42: סמינר בבלשנות חישובית

הגישה המבנית - הקדמהFerdinand de Saussure )1857-1913(

פיתח גישה בה השפה הטבעית בנויה מרכיבים הקשורים יחדיו בקשר דומה או מהופך.

בעקבות גישה זו, וגישות נוספות שבאו בעקבותיו, משפטים נותחו ע"י חלוקתם למרכיבים, צרופים

ותת-צרופים. שיטה זו של הבניה התחבירית נקראה "גישת המבנה הצרופי" או "גישת הצרוף".

42

Page 43: סמינר בבלשנות חישובית

(1928נועם חומסקי )נולד ב-מבין הכלים החשובים המזוהים עמו:

יצירת גרעין מתמטי, הכולל דקדוק יוצר1()דקדוק גנרטיבי(, המאורגן בהיררכיה דקדוקית.

הדקדוקים היוצרים מייצרים שרשרת סימנים )שפה פורמלית(.

נסיונות לתאר מספר שפות פורמליות ומלאכותיות 2(הנגזרות מהדקדוקים היוצרים שתוארו לעיל. המבנים

( כדקדוקים חסרי-הקשר formalizedהצרופיים הוצרנו )(CFG.והפכו לכלי המרכזי בניתוח שפות טבעיות )

43

Page 44: סמינר בבלשנות חישובית

1דקדוקים חסרי הקשר • 

44

Page 45: סמינר בבלשנות חישובית

2דקדוקים חסרי הקשר

45

• 

Page 46: סמינר בבלשנות חישובית

3דקדוקים חסרי הקשר כאשר הרחיבו את הגישה היוצרת, רעיון הדקדוק חסר

ההקשר התעורר ובעית עיבוד השפות הטבעיות נתפסה כבעיה של קביעת המבנה התחבירי של כל משפט

שמרכיב טקסט.

-עץ הצרוףהמבנה התחבירי של משפט מזוהה ע"י עץ המתאר את גזירת המשפט לפי כללי היצירה.

46

Page 47: סמינר בבלשנות חישובית

4דקדוקים חסרי הקשר • 

47

Page 48: סמינר בבלשנות חישובית

הצגת הצרופים בפסוקית - דיאגרמת עץ 1

נציג אפוא להלן את רשימת הקטגוריות הנפוצות שישמשו אותנו בדיאגרמות העצים:

ברמת המילהN )noun(שם-עצם -

A )adjective(שם-תואר - V )verb(פועל -

P - )preposition(מלת יחס - Adv - )adverb(תואר הפועל -

Det - )determiner(תוית - Conj - )Conjunction( מילת -

איחוי

ברמת הצרוףNP )noun p.( צרוף -

שמניA )adjective p.( צרוף -

תאריV )verb p.(צרוף פעלי -

P - )preposition p.( - צרוף יחס

S- )sentence / clause( - משפט / פסוקית

48

Page 49: סמינר בבלשנות חישובית

הצגת הצרופים בפסוקית - דיאגרמת עץ 2

לקסיקון של שפה הוא המילים הסופיות.

בגזירה הסופית הבסיסית נשתמש בלקסיקון של השפה.למשל בגזירה פשוטה ניתן ליצור את המשפטים:

אכלתי את התפוח הירוקאכלתי את הטלפון

ניתן למנוע גזירות, אשר יתנו משפטים לא דקדוקיים או לא נכונים סמנטית, ע"י מתן התייחסות למידע הנוסף

הסמנטי. לפעמים, גם התכונות הפונולוגיות, המורפולוגיות

והתחביריות קובעות.49

Page 50: סמינר בבלשנות חישובית

הצגת הצרופים בפסוקית - דיאגרמת עץ 3

בזיהוי מבנה של משפט, מרכיבי המשפט מזוהים על בסיסהמבחנים הבלשניים שהוצגו קודם לכן )שיוך המילים

לקטגוריות לקסיקליות, זיהוי גרעין הצרוף וקביעת קטגורית הצרוף(.

רק לאחר ביצוע סיווג הצרופים, נוכל לבנות עץ צרוף שיתאר נכונה את מבנה המשפט.

50

Page 51: סמינר בבלשנות חישובית

למה דווקא עצים?דיאגרמות מבנה צרופי לשפות טבעיות, בד"כ מתישבות

עם שני אילוצים:; - קווים מצומת לבניו לא יצטלבואילוץ ההצטלבות 1(

אף מילה ששייכת למרכיב מסוים לא תשועבד למרכיב אחר.

- כל צומת שאינו השורש חייב להיות אילוץ האב היחיד 2(בן של צומת אחד בלבד.

המוטיבציה בשימוש בעצים היא, שאנו מונעים יצירה של מבנים מורכבים, אשר לא קיימים בשפות טבעיות

אמיתיות.

51

Page 52: סמינר בבלשנות חישובית

1דקדוק גלגולים (Transformational Grammer)

חומסקי הציע את רעיון דקדוק הגלגולים.דקדוקים אלו, היו מכווני-אנגלית בעיקר, והסבירו כיצד יש

לבנות משפט שאלה או משפט שלילה מהמשפט החיובי המתאים. כמו-כן, הציעו פתרון איך להפוך את המשפט

מפעיל לסביל. )אכל / נאכל(לדוגמה )באנגלית(, משפט השאלה:

Does John see Mary?

איננו יכולים להציג באופן מקונן )למשל ע"י עץ צרופים(, שייכים לאותו הצרוף, שאליו see ו-Doesכי בבירור

הנושאJohn.איננו שייך

52

Page 53: סמינר בבלשנות חישובית

2דקדוק גלגולים רעיון הגלגול מובא להלן ובהתאם לדוגמה שהראינו קודם

לכן:

53

Page 54: סמינר בבלשנות חישובית

3דקדוק גלגולים דקדוק גלגולים הוא למעשה קבוצה של חוקים

עבור פעולות כאלו של הכנסות, החלפות, הזזות ושינויים דקדוקיים מתאימים.

אפשר להתייחס לכך כמו תכנית המקבלת כקלט משפט, אשר נבנה מדקדוק חופשי-הקשר ומייצר

את המחרוזת המגולגלת.

54

Page 55: סמינר בבלשנות חישובית

מבנה מרכיבי המשפט - תוכן עניינים

.ניתוח תחבירי של המשפט - מרכיבים.ניתוח תחבירי של המשפט - קטגוריות וצרופים.דקדוקים

מהצרוף ועד המשפט.מיון חלקי הדיבר.

55

Page 56: סמינר בבלשנות חישובית

מבוא למבנה התחבירי של משפטבחלק זה:

נציג איך מילים מתחברות ביחד ליצירתצרופים, פסוקיות ומשפטים.

נבנה דיאגרמת עץ שתייצג את צרופיהמילים.

56

Page 57: סמינר בבלשנות חישובית

1בניית צרוף נסתכל על הדוגמא הבאה:

SPEAKER A: What are you trying to do?

SPEAKER B: Help you

מדגים את הדרך הפשוטה ביותר Bדובר .חיבור שתי מיליםליצירת צרוף -

57

Page 58: סמינר בבלשנות חישובית

2בניית צרוף (?help youאיך מזהים את גרעין הצרוף )

:help you בצרוף helpהאם ניתן להחליף את הפועל 1.We are trying to help

We are trying to help you :help you בצרוף youהאם ניתן להחליף את השם

You are very difficult Help you are very difficult

מתארת פעולה של עזרה ולא סוג של help youהצרוף 2.בן

אדם.58

Page 59: סמינר בבלשנות חישובית

3בניית צרוף איך מזהים את גרעין הצרוף?

לפי מבחנים אלו ניתן לומר כי גרעין הצרוף

help you הוא הפועל help .

צרוף שהגרעין שלו הוא פועל נקראת .verb phrase - VPצרוף פעלי

59

Page 60: סמינר בבלשנות חישובית

1ייצוג צרוף

באמצעותHelp youנייצג את הצרוף (:bracketingמסגור )

[ [ ][ ]]vp v prnHelp you

60

Page 61: סמינר בבלשנות חישובית

2ייצוג צרוף נייצג את הצרוף באמצעות דיאגרמת עץ:

61

Page 62: סמינר בבלשנות חישובית

1בניית צרוף כעת נרצה להרחיב את עקרון בניית הצרופים.

נניח כי כל צרוף נבנה באמצעות מיזוג בינארי של מילים. (Help you.)הוא מיזוג של שתי מילים

אולם, יש צרופים הבנויים מיותר משתי מילים:

SPEAKER A: What was your intention?SPEAKER B: To help you

עםTo נוצר ע"י מיזוג המילית To help youהצרוף .help youהצרוף הפעלי

62

Page 63: סמינר בבלשנות חישובית

2בניית צרוף של ים בינארייםבכלליות- ניתן לבנות צרוף ע"י סדרה של מיזוג

:מיליםSPEAKER A: What are you doing?SPEAKER B: Trying to help you

63

Page 64: סמינר בבלשנות חישובית

כללים אוניברסלים למבנה הצרוףנבנה כללים כלליים למרכיבי המבנים שראינו עד כה:

- הצרוף הוא תולדה של הגרעין.עקרון הגרעין - כל מבנה תחבירי תמיד מתחלק עקרון הבינריות

לזוגות.

מדוע אנו זקוקים לעקרונות אלו?.שימוש בעקרונות לבניית דקדוק אוניברסלי .יצירת הגבלות על התחביר

64

Page 65: סמינר בבלשנות חישובית

1בניית פסוקיות ומשפטים כעת שאנו יודעים איך צרופים נוצרים,

נרצה לבנות פסוקיות ומשפטים.

SPEAKER A: What are you doing?

SPEAKER B: We are trying to help you

65 ע"י דיאגרמת עץ.Bנתאר את משפט דובר

Page 66: סמינר בבלשנות חישובית

2בניית פסוקיות ומשפטים SPEAKER B: We are trying to help you

נסתכל על דיאגרמת העץ המלאה:

66

Page 67: סמינר בבלשנות חישובית

פירוק משפטים מורכבים למשפטים פשוטים - מוטיבציה

עד כה דיברנו על איך ליצור צרוף. מהצרוף ליצור פסוקית ומהפסוקית משפט.

ניתן, בדרך זו לנתח משפטים פשוטים.

נרצה להשתמש בכלים אלו על-מנת לפרק )לנתח( משפטים מורכבים יותר, שמכילים משפטים פשוטים בקשר

של איחויאו שעבוד )ו-, ש- וכיוב'(.

67

Page 68: סמינר בבלשנות חישובית

פירוק משפטים מורכבים - דוגמהנציע פירוק למשפט הבא:

סבור אני, שאיגרת כזו, אשר שיגרה הוועדה - לא יכתוב אותה אדם בעל זיקה לספרות ולמחשבה.

באמצעות כללים מסוג זה ניתן לבנות אלגוריתם לפירוק משפטים איזו תועלת יש בכך?.מורכבים

68

Page 69: סמינר בבלשנות חישובית

פירוק משפטים מורכבים - סיכוםלכשנתקל במשפט מורכב, נפרק אותו למשפטים

פשוטים ואת אלה נפרק בשיטות עליהן דיברנו.)מציאת גרעיני הצירוף, חלוקה לצרופים, וכיוב'(

למה זה דרוש? מי ייהנה מפעולה כזאת?

69

Page 70: סמינר בבלשנות חישובית

מבנה מרכיבי המשפט - תוכן עניינים

.ניתוח תחבירי של המשפט - מרכיבים.ניתוח תחבירי של המשפט - קטגוריות וצרופים.דקדוקים.מהצרוף ועד המשפט

מיון חלקי הדיבר.

70

Page 71: סמינר בבלשנות חישובית

1מיון חלקי הדיבר במהלך ההרצאה, ראינו כי קימיים הבדלים רבים בין אנגלית ועברית

בניתוח התחבירי.ראינו שניתן לבחון קטגוריות ע"י מבחן ריבוי עבור קטגוריות מסוימות fool fools :באנגלית

foolish foolishes

אך בעברית, עבור אותן הקטגוריות, מבחן זה נותן תוצאות שונות: טיפשים טיפש טיפשיים טיפשי

לשמש לשונות רבות.נרצה להציע שיטה למיון חלקי הדיבר שתוכל

71

Page 72: סמינר בבלשנות חישובית

2מיון חלקי הדיבר המיון אותו מציעים צריך לענות על האילוצים הבאים:

המיון חייב להיות כולל - כל צורות הלשון יעמדו למיון.1(המיון חייב להעמיד קבוצות בלבדיות - כל צורת לשון 2(

נמצאת בקבוצה אחת בלבד.

במונחי תורת הקבוצות, המיון חייב להיות זר וממצה.

72

Page 73: סמינר בבלשנות חישובית

3מיון חלקי הדיבר במהלך השנים, חקרו הבלשנים ופיתחו מיונים שונים, אך כל אלו כשלו בעמידה מלאה אחר

האילוצים.

אף-על-פי חסרונותם של מיונים אלו, נעשה שימוש נרחב בהם גם כיום. נושא זה דורש יתר הרחבה.

73

Page 74: סמינר בבלשנות חישובית

שאלות?

74