מה זה חיפוש סמנטי ? חיפוש מבוסס ישות

סמנטיקה = תורת המשמעות, אך רובם מגדירים חיפוש סמנטי תוך התמקדות בכוונה. "משמעות" אינה זהה ל"כוונה". למד עוד.

מהו זה חיפוש סמנטי? אתה יכול למצוא לזה הרבה הסברים כשאתה מחפש בגוגל תשובה לשאלה הזו - אבל רובם לא מדויקים ויוצרים אי הבנות.

מאמר זה יעזור לך להבין באופן מקיף מהו חיפוש סמנטי.

גוגל הופך למנוע חיפוש סמנטי

גוגל מתפתחת בהדרגה למנוע חיפוש סמנטי של 100%, ניתן לאתר את המאמצים של גוגל לפתח מנוע חיפוש סמנטי בחידושים העיקריים האחרים כגון RankBrain , EAT , BERT ו- MUM תומכים במישרין או בעקיפין במטרה להפוך למנוע חיפוש סמנטי מלא.

על ידי הכנסת עיבוד שפה טבעית (NLP) לחיפוש, גוגל נעה בקצב אקספוננציאלי לעבר מטרה זו.

עדכון Hummingbird של גוגל

Hummingbird הוא השינוי הגדול ביותר בעיבוד שאילתת החיפוש ובדירוג שגוגל ביצעה אי פעם, והשפיע על למעלה מ-90% מכל החיפושים היה כבר בשנת 2013. Hummingbird החליף ביסודו חלק ניכר מאלגוריתמי הדירוג הקיימים.

באמצעות Hummingbird, גוגל יכלה מיד לכלול ישויות שנרשמו ב- Knowledge Graph (גרף הידע) בתוצאות החיפוש.

ישות מתארת ​​את המהות או הזהות של אובייקט קונקרטי או מופשט של הוויה. ישויות ניתנות לזיהוי ייחודי ולכן בעלות משמעות ייחודית.

ביסודו של דבר, ניתן להבדיל בין ישויות בשם לבין מושגים מופשטים.

ישויות בשמות הן אובייקטים מהעולם האמיתי, כגון אנשים, מקומות, ארגונים, מוצרים ואירועים.

מושגים מופשטים הם פיזיים, פסיכולוגיים או חברתיים באופיים, כגון מרחק, כמות, רגשות, זכויות אדם, שלום וכו'.

לפני Hummingbird, גוגל עשתה בעיקר התאמה של מסמכי מילות מפתח לדירוג ולא הצליחה לזהות את המשמעות של שאילתת חיפוש או תוכן.

מה זה מנוע חיפוש סמנטי?

מנוע חיפוש סמנטי מחשיב את ההקשר הסמנטי של שאילתות חיפוש ותוכן כדי להבין טוב יותר את המשמעות. מנועי חיפוש סמנטיים מתייחסים גם ליחסים בין ישויות להחזרת תוצאות חיפוש.

לעומת זאת, מערכות חיפוש מבוססות מילות מפתח פועלות רק על בסיס התאמה של מילת מפתח - טקסט.

מה זה חיפוש סמנטי?

הגדרות רבות של חיפוש סמנטי מתמקדות בפירוש כוונת החיפוש כעיקרו. אבל בראש ובראשונה, חיפוש סמנטי עוסק בזיהוי המשמעות של שאילתות חיפוש ותוכן על סמך הישויות המתרחשות.

סמנטיקה = תורת המשמעות.

אבל "משמעות" אינה זהה ל"כוונה". כוונת החיפוש מתארת ​​למה המשתמש מצפה מתוצאות החיפוש. משמעות היא משהו אחר.

זיהוי משמעות יכול לעזור לזהות את כוונת החיפוש, אבל הוא יותר יתרון נוסף של חיפוש סמנטי.

גרף הידע Knowledge Graph

תפקידו של גרף הידע (Knowledge Graph) בחיפוש הסמנטי של גוגל הוא דירוג מבוסס ישות. גרף הידע הוא אינדקס הישויות של גוגל שלוקח בחשבון קשרים בין ישויות.

מדדים קלאסיים מאורגנים בצורת טבלה, ולכן, אינם מאפשרים מיפוי יחסים בין מערכי נתונים.

גרף הידע הוא מסד נתונים סמנטי בו המידע בנוי בצורה כזו שידע נוצר מהמידע. כאן, ישויות (צמתים) קשורות זו לזו באמצעות קצוות, מסופקות בתכונות ומידע אחר וממוקמות בהקשר נושאי או אונטולוגי.

ישויות הן המרכיב הארגוני המרכזי במסדי נתונים סמנטיים, כגון גרף הידע של גוגל.

בנוסף ליחסים בין הישויות, גוגל משתמשת בכריית נתונים כדי לאסוף תכונות ומידע אחר על הישויות ומארגנת אותם סביב הישויות.

המבנה של אינדקס מבוסס ישות מאפשר תשובות לשאלות המחפשות נושא או ישות שאינם מוזכרים בשאלה.

שלוש רמות משמשות בסיס לתרשים ידע:

קטלוג ישויות : כל הישויות שזוהו לאורך זמן מאוחסנות כאן.

מאגר ידע : ישויות מובאות יחד במחסן ידע עם מידע או תכונות ממקורות שונים. מדובר בעיקר על מיזוג ואחסון תיאורים ויצירת מחלקות או קבוצות סמנטיות בצורה של טיפוסי ישויות. גוגל מייצרת את הנתונים דרך כספת הידע, שם היא מפעילה כריית נתונים ממקורות לא מובנים.

גרף ידע : ישויות מקושרות לתכונות ונקבעות קשרים בין ישויות.
גוגל יכולה להשתמש במקורות שונים כדי לזהות ישויות והמידע המשויך אליהן.

גרף הידע של גוגל: מקורות מידע.

לא כל הישויות שנלכדו במאגר הידע נכללות ב- Knowledge Graph. הקריטריונים הבאים עשויים להשפיע על הכללה בתרשים הידע:

  • רלוונטיות חברתית.
  • מספיק התאמות חיפוש עבור הישות באינדקס גוגל.
  • תפיסה ציבורית מתמשכת.
  • ערכים במילון או באנציקלופדיה מוכרים או בעבודת עיון מומחה.

ניתן להניח שגוגל רשמה באופן משמעותי יותר ישויות ארוכות זנב במאגר ידע כמו ה- Knowledge Vault מאשר ב- Knowledge Graph ומשתמשת בו לחיפוש סמנטי.

על ידי סריקת האינטרנט הפתוח ובאמצעות עיבוד שפה טבעית, גוגל מסוגלת לבצע כריית ישויות ונתונים מדרגיות ללא תלות בבסיסי נתונים מובנים ומובנים למחצה. זה מספקעוד ועוד מידע, כולל על מילות צפתח עם זנב ארוך.

איך גוגל עובד כמנוע חיפוש סמנטי?

החיפוש בגוגל מבוסס כעת על מעבד שאילתות חיפוש. בעיבוד שאילתות חיפוש, מונחי החיפוש מושווים עם הישויות הרשומות במאגרי המידע הסמנטיים ונכתבים מחדש במידת הצורך.

בשלב הבא נקבעת כוונת החיפוש והתאמת של תוכן

גוגל משתמשת באינדקס החיפוש הקלאסי וכן במסד נתונים סמנטי משלה בצורה של גרף הידע. סביר להניח שמתבצעת החלפה בין שני מסדי הנתונים הללו באמצעות ממשק.

ישנו מנוע ניקוד המורכב מאלגוריתמים שונים המבוססים על אלגוריתם הליבה של Hummingbird. הוא אחראי להעריך את התוכן ולאחר מכן לסדר אותו לפי הניקוד. ניקוד עוסק ברלוונטיות של תוכן ביחס לשאילתת החיפוש או לכוונת החיפוש.

מה זה אומר עבור קידום אתרים סמנטי?

קראתי הרבה על נתונים מובנים, אופטימיזציה סמנטית של תוכן ומבנה עולמות אקטואליים סמנטיים בכל הנוגע לקידום אתרים סמנטי.

כן, זה הגיוני להראות לגוגל שאתה מכסה לחלוטין נושאים מסוימים בתוכן שלך, ולכן, מראה מומחיות.

חלק מהפטנטים עוסקים בהשוואה של גרפי ידע פנימיים של מסמכים עם גרף הידע של Google. התיאוריה כאן היא שרמה גבוהה של התאמה בין הישויות המשמשות בטקסט לבין מבני היחסים של הישות הראשית במסד הנתונים הסמנטי של גוגל מובילה לדירוג טוב יותר.

זה נשמע הגיוני. אבל בואו נהיה כנים, בסופו של דבר, אופטימיזציה מבוססת מילות מפתח אינה שונה משמעותית מאופטימיזציה של תוכן מבוסס ישות.

לדעתי, גוגל כל כך טובה בלמידת מכונה שהם משתמשים בנתונים מובנים כדי לאמן את האלגוריתמים מהר יותר.

זה רק עניין של זמן עד שגוגל לא תצטרך עוד נתונים מובנים.

גם נתונים מובנים אינם בסיס טוב להערכה. או שיש לך אותם או שאין לך.

מי קשור למי?
מי ממליץ על מי?
מי מסתובב עם מי?

קישורים ואירועים משותפים מ-Google יכולים לשמש כגורמים לקרבה זו בין ישויות רשות. וב-SEO סמנטי, אני מתכוון גם לאופטימיזציה שלהם.

בעוד שאנו עוסקים בנושא של שיתוף פעולה, כדאי לשקול גם כיצד NLP עובד בעת אופטימיזציה של תוכן. Google משתמשת ב-NLP כדי לזהות ישויות והקשר שלהן. זה עובד באמצעות מבני משפטים דקדוקיים, שלשות וטופלים המורכבים משמות עצם ופעלים.

לכן כדאי לשים לב גם למבנה משפטי פשוט דקדוקי בקידום אתרים סמנטי. השתמש במשפטים קצרים ללא כינויים אישיים. כך אנו משרתים את המשתמשים מבחינת קריאות ומנועי חיפוש.

העתיד של החיפוש הסמנטי

מתי ניתן להשיג חיפוש בגוגל מבוסס ישות ב-100%?

אני חושב שבעתיד תהיה החלפה גוברת בין אינדקס החיפוש הקלאסי של גוגל לבין גרף הידע באמצעות ממשק.

ככל שיותר ישויות נרשמות ב- Knowledge Graph, כך השפעתן על תוצאות החיפוש גדולה יותר. עם זאת, גוגל עדיין מתמודדת עם האתגרים הגדולים של התאמה בין שלמות ודיוק.

עבור הניקוד בפועל של Hummingbird, הישויות ברמת המסמך אינן ממלאות תפקיד מרכזי. במקום זאת, הם מהווים מרכיב ארגוני חשוב לבניית גופי מסמכים לא משוקללים בצד אינדקס החיפוש.

הניקוד בפועל של המסמכים נעשה על ידי Hummingbird לפי כללי אחזור מידע קלאסיים. עם זאת, ברמת התחום, אני רואה את ההשפעה של גופים על דירוג גבוה בהרבה. הזן EAT .

בשנים הבאות, סביר להניח שנראה את ההשפעה הגוברת של ישויות בחיפוש בגוגל.

המראה החדש של חיפושים מבוססי ישות מראה בבירור כיצד גוגל מארגנת בהדרגה את יצירת האינדקס של מידע ותוכן סביב ישות. זה מצביע על כמה חזק חידושים כמו MUM עוקבים אחר הרעיון של חיפוש סמנטי.

חיפוש סמנטי כולל את כוונת המשתמש, הקשר ומשמעויות לתוכן. גוגל יכולה להחזיר תוצאות שמטרתן להתאים למילת החיפוש של משתמש, גם כאשר אין התאמות בין מילים.

חיפוש סמנטי מאפשר למנועי חיפוש להבחין בין דברים שונים, כגון אנשים ומקומות . כעת גוגל יכולה לפרש את כוונת החיפוש על ידי התבוננות בגורמים כמו מיקום המשתמש, היסטוריית חיפושים וכו'..

בדף זה