תרגום מכונה ויצירתיות אנושית

"תרגום מכונה ויצירתיות אנושית" (Machine Translation and Human Creativity) הייתה הכותרת של יום עיון מקוון שנערך במרץ האחרון במסגרת היריד בינלאומי לספרות ילדים בבולוניה. קניתי כרטיס, אבל רק השבוע, רגע לפני שמורידים אותו מהאתר, הצלחתי לצפות בו. אני מרשה לעצמי להעלות את הרשמים שלי לבלוג מכיוון שהוא עוסק בספרות ובתרגום, ומושב אחד מבין החמישה היה באיטלקית – אבל שוחרי ספרות איטלקית בלבד פטורים מקריאה. יום העיון כולו ארך שבע שעות, והסיכום כאן חלקי מאוד. בכל אופן, מדובר ברשמים שלי, לא בסיכום מובנה פרק אחר פרק, כלומר בפרשנות שלי לדברים שנאמרו.

הקדמה או למה להתעסק בזה בכלל? תתביישי לך!

כזכור, אני מהנדסת מחשבים בעברי, ואין לי רתיעה מטכנולוגיה. טכנולוגיה בתחום העיסוק שלי מעניינת אותי, היא מתפתחת מהר, מה שהיה נכון לפני עשר שנים כבר לא רלוונטי כיום, וגם מה שהיה לפני שנה. חשוב לי להבין היכן ההתפתחות הזו יכולה להועיל לי וממה עלי להיזהר.

ספציפית, ביום העיון הזה השתתפו חוקרים רציניים מהתחום (כדי לסבר את האוזן: הרצאת הפתיחה הייתה של אנטוני פים Anthony Pym שקראנו מאמרים שלו במסגרת לימודי תרגום באוניברסיטה, התכנית המלאה כולל שמות המשתתפים נמצאת כאן). צריך גם לזכור שהשם "תרגום מכונה" מטעה, המכונה לא מתרגמת כלום על דעת עצמה, המכונה רק משתמשת (טוב יותר או פחות) בתרגומים קודמים של בני אדם.


דוגמה משעשעת של אנטוני פים לתרגום מכונה: נתוני הבחירות לכנסת ה-23 שלנו: תוצאות רשמיות תורגמו truthful results   במקום Official  דבר שהוביל אותו להתפלספות קטנה על האמת, והוא למד משהו על התרבות העברית כשהקולות הכשרים תורגמו ל-KOSHER במקום VALID.

כמה מושגים

בשנים האחרונות הוחלף האלגוריתם המרכזי ברוב תרגומים המכונה, בעבר הוא היה סטטיסטי (SMT) כיום הוא מבוסס נוירונים* (NMT). NMT מסוגל לטפל טוב יותר במשפטים שלמים, ואיכות תרגומי המכונה השתפרה מאוד, עד כדי כך שחלק מהדוברים טענו שהיה להם קשה למצוא דוגמאות מסמרות שיער עדכניות לצורך המצגת.

ברור לכל ש-MT (Machine Translation) אינו מיועד/בשל כרגע להחליף לגמרי את המתרגם האנושי, ולכן נושא הדיון היה POST-EDITING (PE) של MT כשיטת עבודה בתרגום ספרות. כלומר, ההנחה היא שמתרגם בשר ודם יעבור על תרגום המכונה ויתקן אותו. יש תוכנות (Computer-Aided-Translation Tools)  שמציעות תרגום מכונה כחלק מסביבת העבודה של המתרגם, אני משתמשת בתוכנה כזאת, MemoQ.

השאלות שהחוקרים ניסו לענות עליהן היו:

  • האם זה יעיל? האם צורת העבודה הזאת, בסופו של דבר, חוסכת זמן? מאמץ? כסף?
  • האם זה טוב? האם התוצאה הסופית איכותית? האם התרגום יצירתי מספיק (אנחנו מדברים רק על ספרות)? האם הקורא יחוש בהבדל?
  • איפה מתחבאים הפחים ב-PE, ממה להיזהר?  איך להוציא את המקסימום מ-MT?
  • עתיד הטכנולוגיה: מה השיפורים שיהפכו MT ליעיל יותר לתרגום ספרות?
  • עתיד האדם: כיצד זה ישפיע על החברה? על מתרגמי הספרות?

יעילות

החוקרים בדקו כמה זמן לקח למתרגמים מנוסים ומתחילים להשלים את התרגום, כשהתחילו מדף חלק או כשהתחילו מתרגום מכונה. הם בדקו גם את "מספר ההקשות" שלהם, כלומר כמה תיקונים, הקלדות והקשות היו מעורבים בתהליך. המסקנות החד משמעיות הן שהתהליך כולו יעיל ב-30% לערך. אני מדגישה שמדובר בכל התהליך עד להשלמת העבודה, עד שמתרגם ספרות טוב ומוערך (הם נעזרו במתרגמים עתירי ניסיון וזוכי פרסים) יהיה מרוצה מהתוצאה. לחלק מתרגומי המכונה יש עלות, ועדיין, התהליך כולו זול יותר (אחת החוקרות העירה בציניות שעלות תרגום מכונה לא רחוקה מהשכר העלוב שמקבלים מתרגמי ספרות). אפשר לראות את ההתקדמות העצומה של NMT ביחס ל-SMT, גם בטקסט ספרותי אחוז גדול מאוד מהמשפטים לא דרש שום התערבות של המתרגם או התערבות מינימלית (כמו התאמת מין, מילת יחס, ריבוי או זמן דקדוקי).

איכות ויצירתיות

יש יתרון קטן לתרגום מדף חלק על פני PE, נראה שכאשר מתרגם מתחיל מ-PE הוא נוטה פחות לשנות אותו, תופעה המכונה "אפקט הראשוניות", התקבעות על הפתרון הראשון שמעלה ה-MT, גם במקרים שבהם המחקר מראה שתרגום אנושי (human translation, HT) היה מתחיל מפתרון אחר**. כלומר יש פגיעה מסוימת ביצירתיות של המתרגם, תרגום המכונה משפיע על מרחב הפתרונות שלו. מבחינת הקוראים וההנאה מהקריאה, ההבדל לא היה גדול. החוקרים הראו גם נתון משעשע: הם השוו תרגום חובבני ל-NMT, ולהפתעתם תרגום המכונה היה טוב יותר לדעת הקוראים.

עתיד הטכנולוגיה

איכות MT תלויה באיכות וכמות הנתונים שבהם הוא משתמש. כאשר בונים MT  יעודי לתחום, למשל MT שמבוסס על תרגומי ספרות בלבד, מקבלים תרגום ראשוני הרבה יותר טוב. כיום, כשיש הרבה ספרים בפורמט דיגיטלי אין קושי לבנות NMT מבוסס ספרות.
בנוסף, כלי CAT יכולים להציע למתרגם כמה אפשרויות של  NMT וללמוד תוך כדי העבודה על אותו ספר מה ההעדפה שלו, ובכך לשפר את המקור ל-PE (אולי המונח POST קצת מטעה בצורת עבודה אינטראקטיבית שכזו). חלק מהחוקרים העירו שבמצב זה אין הבדל מהותי בין MT למילון – בשני המקרים כלי העזר מציע למתרגם כמה אפשרויות והמתרגם בוחר את המתאימה בהקשר. יתרה מכך, דווקא למתרגמים מאוד מנוסים יש לפעמים "קיבעונות תרגום" של ביטויים ומונחים, ולפעמים MT יכול לחלץ אותם מהם ולהציע פתרונות עדכניים ויצירתיים יותר. כזכור, כל הפתרונות של MT מקורם בתרגומים אנושיים, אבל אולי של אדם אחר, כך שבעצם השימוש ב-MT מאפשר למתרגם לשבת על כתפיהם של הרבה מאוד מתרגמים אחרים, לא פחות טובים ממנו.

עתיד האדם

יש לזכור שההתקדמות של תרגומי מכונה, גם אם הם לא מושלמים, מסייעת להורדת חסמים בין תרבויות ולהקטנת הדומיננטיות של האנגלית בתור ה"לינגווה פרנקה" – תופעה מוכרת ועתיקה (בעבר היו שפות אחרות במעמד הזה) שיש בה השתקה ודיכוי של אוכלוסיות שוליים חלשות יותר.

המסקנות שלי

הרכבת הזאת יצאה כבר מהתחנה. PE של MT תהפוך לשיטת עבודה נפוצה ומקובלת, גם בספרות. יש כיום עדיין מלכודות ליצירתיות שצריך להיות מודעים להן ולהתחשב בהן (למשל, להחליט בהתאם לאופי הטקסט האם להשתמש ב-PE או לא, ואם כן, לבדוק את עצמך שוב ושוב). תרגום ספרות כמקצוע עומד להשתנות, רוב עבודת התרגום תעשה ב-PE ויתכן שיהיה צורך בפחות מתרגמים – אבל רק הטובים ביותר. הגבול בין עורך תרגום ומתרגם יטשטש. יתכן שבמקום מתרגם ייווצר תפקיד חדש (משעמם מאוד לטעמי) של תיקון שגיאות MT טריוויאליות לפני העברת הטקסט לעורך התרגום. לאנשים צעירים, בתחילת דרכם, אני ממליצה לבחור מקצוע אחר, קשה לי להאמין שניתן יהיה להתפרנס מתרגום ספרות לאורך זמן.


* אני עדיין לא מבינה מספיק טוב את המשמעות, זאת המשימה הטכנולוגית הבאה שלי. פרויקט הגמר שלי בטכניון, לפני שלושים שנה, עסק ברשתות נוירונים, התחום היה אז בחיתוליו, מאז היו הישגים עצומים, ולצערי אני לא יכולה לומר שאני מבינה משהו בתחום כיום.

** אני יכולה להעיד, וגם קולגה שלי שניסתה טענה כך, שחשתי באפקט הזה כשניסיתי להפעיל MT מההתחלה.

פרסם תגובה או השאר עקבות: Trackback URL.

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת /  לשנות )

תמונת גוגל

אתה מגיב באמצעות חשבון Google שלך. לצאת מהמערכת /  לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת /  לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת /  לשנות )

מתחבר ל-%s

%d בלוגרים אהבו את זה: