להבין את המידע

היום אני מרצה בכנס שמטריקס עורכת למנהלי מוקדים בנושא ניהול ידע. אני מספרת בכנס על המוצרים של חברת מלינגו, שלאחרונה חתמנו מולם על הסכם ייצוג בלעדי. גם מי שלא מכיר את כל המוצרים והפתרונות של מלינגו, בטח מכיר את מורפיקס – המילון המקוון מעברית לאנגלית ולהיפך. אבל מלינגו עושים הרבה יותר מאשר מילונים, ובשבועות האחרונים אנחנו לומדים לעומק את המוצרים שלהם, והאפשרויות הן אדירות ומרתקות.

שני המוצרים המעניינים ביותר (אבל לא היחידים) הם החיפוש – Concept Search, המכונה CS ומוצר ניתוח תכנים –

Intelligent Content Analysis, המכונה ICA. “חיפוש” נשמע מאוד פשוט, הרי היום כולם מציעים חיפוש. אני תמיד חושבת שזו מילה בעייתית, כי נכון שכולם מציעים חיפוש אבל ביננו, הבעיה היא לא לחפש אלא למצוא… ומנוע החיפוש של של מלינגו הוא מנוע שמוצא.

CS מציע פתרון מורפולוגי מלא לעברית, כלומר אם חיפשתי “עיר”, המנוע ידע לחפש עיר, ערים, הערים, העיר, עירי, וערי; והוא יודע להטות שורשים כדי לתת לי, אם חיפשתי למשל “עיתון”, גם את עיתוני, עיתונים, עיתונאי, עיתונאים ועיתונות. אבל ההטיות האלו הן רק ההתחלה, כיוון שהיא עלולה להציף אותי בהמון זבל. ולכן מופעל גם ניתוח קונטקסטואלי, שבודק את המשמעות של המילה בהקשר שלה במשפט, ולכן אקבל טקסט שהכיל את המשפט "הגענו אל העיר הגדולה" ולא את המשפט "המנכ"ל העיר לדובר". היכולת הזו היא ממש לא טריוואלית, ומצריכה מומחיות לשונית גבוהה ופיתוח מתוחכם.

למוצר יש עוד יכולות מגוונות, למשל טיפול באחידות האיות (כתיב מלא/חסר וכו'), זיהוי אנשים  (למשל אם כותבים שוורצמן, שורצמן,Shvartsman וכד’), זיהוי שפת הטקסט וחיפושים במספר שפות, ניתוח מילים נרדפות (למשל נגיפי, וירלי או ויראלי), חיפוש וקטגוריזציה אוטומטית ועוד. חלק מהיכולות האלו ניתנות באמצעות מילונים יחודיים שנבנו ע”י מלינגו. ניתן גם לבנות מילונים יחודיים של הלקוח, שכוללים שמות של מוצרים או מונחים שבהם הארגון משתמש.

ICA הוא מוצר מאוד מעניין, שלוקח את הטיפול בטקסטים רמה אחת הלאה. ניתוח הטקסט מאפשר לחלץ מהטקסטים מידע שהוא מעבר למילים בתוכו. אם החיפוש מאפשר לי לשפר את האופן בו אני מחפשת מידע, ניתוח הטקסטים עוזר לי להבין את המידע. למשל, ICA מבצע זיהוי וחילוץ ישויות. ראו למשל את צילום המסך המצורף שמדגימה את היכולת הזו. מתוך הטקסט ניתן לזהות ולחלץ שמות של אנשים, ארגונים, מקומות, זמן, כסף ועוד.

melingo-ICA

היכולת הזו פותחת הרבה מאוד אפשרויות, למשל תקצור של טקסט ארוך או מיצוי עובדות (fact extraction). יש גם את היכולת להגדיר ישויות מותאמות לארגון. לדוגמא, אם ניקח פרוטוקול של ישיבת הכנסת, ונדע לחלץ מתוכו את שמות חברי הכנסת ושמות תפקידי הדוברים (ולפעמים האחד שווה לשני), ואת שמות הצעות החוק, ניתן לחלץ מידע מתוקצר על מה שהתרחש בישיבה, לבצע חיפוש יעיל יותר ועוד. כחלק מהכנת המצגת היום, לקח איתי מצוות מלינגו טקסט ארוך, חופר ומייגע של תלונת לקוח, ובשתי שניות חילץ את עיקרי המידע מתוכו.

המוצר מאפשר גם תיוק אוטומטי וקטגוריזציה של מידע – ע"פ סטטסטיקה או מנוע חוקים. תכונה מדליקה נוספת היא ניתוח רגשי, sentiment analysis – האם הטקסט מבטא רגשות חיוביים, שליליים וכו’. המוצר מאפשר לבצע דירוג עדיפויות – דירוג מתוחכם של תוצאות חיפוש ע”פ משמעות ולא דירוג טכני, וכן הפיכה של טקסטים למידע מובנה, שמאפשר להפעיל שאילתת SQL על טקסטים לא מובנים.

בכנס מנהלי המוקדים אני מדברת על דרכים שבעזרתם ניתן לרתום את היכולות האלו, לטובת שיפור השירות ללקוחות. אחד השינויים שמתרחשים היום בעולם שירות הלקוחות הוא המעבר לשימוש בטקסט. כולנו מכירים ולא תמיד אוהבים את שירות הלקוחות הטלפוני, שיש בו המתנות ארוכות, תוכנות ניתוב שיחה מרגיזות ועוד. גם לארגונים לא פשוט להחזיק מוקד שירות, מדובר בעסק יקר וההדרכה שנדרשת הולכת ומתייקרת. כך שהמעבר לשירות עצמי הוא מתבקש. יחד עם זאת, הקמת אתר שירות עצמי היא משימה לא פשוטה גם כן, ופה לחיפוש יש תרומה מכרעת להצלחה.

נניח שטסתי לחו”ל ושכחתי את האייפון בטיסה. סיפור דימיוני כמובן, כי אין לי אייפון ואין לי זמן לטוס לחו”ל. אבל נחזור לעניינו – באתר של חברת התעופה אני צריכה לחפש את האזור של שירות הלקוחות ולמצוא בו את המידע על איתור חפצים אבודים. אם ארצה לחסוך זמן, אנסה להפעיל חיפוש – באתר או דרך גוגל. אני צריכה להשקיע מחשבה בניסוח השאילתה כדי להגיע לדף הנכון. המשפט “שכחתי את האייפון בטיסה” יחזיר לי במקרה הטוב תוצאות בלתי רלוונטיות, כגון מידע על אפליקציית האייפון החדשה של חברת התעופה או מידע על טיסות… אבל מנוע חיפוש שמבין שפה, יוכל לזהות את מבנה המשפט שלי, לעשות את הקישור בין “שכחתי” והחפץ שבא אחריו ולהפנות אותי ישירות לדף הרלוונטי של איתור חפצים אבודים.

לפעמים המידע שקיים באתר לא מספיק, גם אם מנוע החיפוש יודע תמיד להביא אותי לפריט המידע הנכון. האתר שיציע לי להמשיך ישירות מול נציג שירות, יאפשר לי צורות שונות של קשר איתו. בהתאם לתפיסה הרב-ערוצית, אני יכולה לפנות אליו בדרכים שונות, החל ממייל, דרך צ’אט באתר או יוזמת שיחה עם הנציג. כשהנציג יוצר קשר איתי, הלקוח, הוא רואה מה חיפשתי ומקבל את המידע שאני צפיתי בו. אבל לנציג השירות יש עוד מאגר מידע שאין לי – כל מערכת שירות הלקוחות שלו. המערכת תוכל לשלוף ולהציג לו פניות של לקוחות אחרים שעשויות להיות רלוונטיות וכך לקצר משמעותית את ההתמודדות עם בעיה שהיא קצת יוצאת דופן.

זה היה ממש על קצה המזלג, יש עוד הרבה רעיונות מעניינים ויכולות מדליקות למוצרים של מלינגו. עכשיו אלך להרצות..

מודעות פרסומת

חיה על 5 שעות שינה

עם התגית: , , , , , , , ,
פורסם ב-טכנולוגיה אנושית
4 תגובות ב“להבין את המידע
  1. שרון שוורצמן הגיב:

    אדוה,
    ההרצאה שלך היום הייתה מצויינת.
    קולעת ומעניינת.
    את כשרון אמיתי
    תודה על הכל
    שרון.

  2. אדוה,
    התגלית ככשרון עולה גם בכתיבה וגם בהכנת מצגות!
    כל נכבוד,
    ירון

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s

לצערי פייסבוק מסתירים את רוב העדכונים מדפים שנרשמתם אליהם. כדי להבטיח את קבלת העדכונים, עליכם להכנס לעמוד ולבצע את הפעולות הבאות:
1. העמידו את סמן העכבר על הריבוע בצד הימני העליון של המסך שבו כתוב Liked. ייפתח תפריט.
2. בראש התפריט מוצגת האפשרות Get Notifications. סמנו אותה.

אין בעיה. הזינו את האימייל שלכם כדי להרשם לבלוג ולקבל עדכונים על רשומות חדשות האימייל.

הצטרפו אל 80 שכבר עוקבים אחריו

Creative Commons License התכנים בבלוג זה מופצים תחת רישיון ייחוס-איסור יצירות נגזרות 2.5 ישראל של Creative Commons, אלא אם צויין אחרת. לשימוש נא ליצור קשר במייל.

Add to Technorati Favorites

%d בלוגרים אהבו את זה: