שובר לפרסום בגוגל



הכנת זחלן-רשת (Web Spider) בפלאש

PDF הדפסה דוא
דירוג משתמש: / 0
גרועהכי טוב 
השיעור נכתב על ידי : אלעד כהן   
שישי, 27 אוגוסט 2010 02:40

מהו זחלן-רשת?


זחלן-רשת הוא תוכנת מחשב שסורקת אתרי-אינטרנט בזה אחר זה ומבצעת פעולות המבוססות על התוכן הנמצא בדפי-האתרים. המעבר של זחלן-הרשת מאתר לאתר מבוצע ע"י זיהוי הקישורים החיצוניים (קישורים לאתרים אחרים) שנמצאים באתר הנוכחי שנסרק. לדוגמא, זחלן-הרשת מתחיל מכתובת של אתר אינטרנט ומבצע את הפעולות הבאות: קבלת קוד ה-HTML של העמוד הראשי באתר, ניתוח קוד ה-HTML, שליפת הקישורים (תגי <a>) וסיווג כל קישור כקישור שמוביל לעמוד אחר באותו האתר (קישור פנימי) או כקישור שמוביל לאתר אחר (קישור חיצוני), לאחר מכן ביצוע אותם הפעולות בעמוד הבא באתר (שנשלף מרשימת הקישורים הפנימיים). בתום סריקת דפי-האתר, הזחלן מתקדם לאתר הבא מתוך רשימת הקישורים החיצוניים שנוצרה. כך הזחלן סורק את הרשת, דף אחר דף, אתר אחר אתר.

זחלן-הרשת של גוגל
זחלן-הרשת של גוגל סורק את כל הדפים שנמצאים באינטרנט בתדירות שונה לכל אתר (בהתאם לקצב השינויים באתר). הרובוט שומר את קוד ה-HTML של העמודים כדי שבשלב מאוחר יותר, קוד זה ישמש כקלט של האלגוריתמים של גוגל, המדרגים את העמודים וקובעים את מיקומם בתוצאות החיפוש. כאשר מבוצעת בקשה לקבלת דף-אינטרנט משרת Web, היא מבוצעת בפרוטוקול HTTP, אחד השדות בפרוטוקול HTTP הוא השדה UserAgent המכיל מחרוזת שמזהה את התוכנה שביצעה את הבקשה (לדוגמא שם הדפדפן שהגולש משתמש בו). כשהזחלן של גוגל מבקש דף-אינטרנט, בשדה UserAgent מופיעה המחרוזת Googlebot. שרת ה-Web יכול לדעת מהו ערך השדה UserAgent ולפיכך לדעת מתי הזחלן של גוגל סרק כל עמוד.

איך להכין זחלן-רשת בפלאש
ניתן להכין זחלן-רשת בפלאש (בשפת AS3) ע"י שימוש במחלקה URLLoader.
סדר הפעולות ליצירת זחלן-רשת:
א. שימוש במחלקה URLLoader כדי לקבל את קוד ה-HTML של דף האינטרנט הראשון ממנו הזחלן יתחיל לפעול. קוד ה-HTML מתקבל באמצעות הגדרת האירוע Event.COMPLETE.
ב. ניתוח קוד ה-HTML ע"י שימוש ב: Regular Expressions, indexOf, lastIndexOf, substr, substring כדי לשלוף את כל הקישורים הפנימיים (שמובילים לדפים אחרים בתוך האתר) והקישורים החיצוניים (שמובילים לאתרים אחרים).
ג. ביצוע פעולות שונות בהתאם למטרות הזחלן, הקלט של הפעולות הוא קוד ה-HTML של העמוד.
ד. שימוש ב-URLLoader שוב בצורה רקורסיבית על פני כל אחד מהעמודים ברשימת הקישורים הפנימיים ולאחר סריקת כל עמודי האתר, מעבר לאתר חדש.


www.win.co.il
 
מאמרים נוספים :

» מדריך למתחילים לSEO

חדש ל SEO? צריך ללטש את הידע שלך? המדריך למתחילים SEO -  אופטימיזציה למנועי חיפוש, או SEO.מהו אופטימיזציה למנועי חיפוש (SEO)?SEO היא המתמקדת בהגדלת הנראות בתוצאות מנוע החיפוש באופן אורגני (שאינו בתשלום). SEO כוללת הן את האלמנטים...

» קידום אורגני לעסקים

  הדרך הטובה ביותר כיום לחשוף ולפרסם חברה/בית עסק, הינו, באמצעות אתר אינטרנט פעיל ומעודכן. הודות לקידמת הטכנולוגיה, לכול אדם באשר הוא קיים בביתו מחשב עם גישה לאינטרנט, וכן מכשיר סמארטפון אשר באמצעותו ניתן לגשת לאינטרנט...

» קידום אתרים לשנת 2017

 כמות המידע ברשת הוא עצום. בלתי נתפס ממש. על כל ביטוי מתחרים כל כך הרבה עמודי אינטרנט וחלקם הגדול כלל אינו שייך לעסקים. לכן קידום אתרים לעסקים היא משימה מורכבת מאין כמוה. והצלחה במשימה הזו היא הרבה פעמים לשון המאזניים בין...

» קידום בגוגל 2016- החוקים החדשים

קידום בגוגל 2016- החוקים החדשיםזו עובדה ידועה, שבכל כמה חודשים, גוגל עורכת שינוי בחוקיה. אחד מהשיטות שגוגל משתמשת, הינה הארכת הכותרות של תוצאות החיפוש ואת תקצירן. הכותרות השנה – 2016, הוארכו ל-70-71 תווים לכותרת, במקום 50-60 שהיו...

» בחירת מילות מפתח לגוגל

כל מי שפותח אתר חדש צריך לשאול את עצמו את השאלה העיקרית שעוסקת שלו והיא אילו מילות מפתח מייצגות את האתר שלי? אם יש לי אתר שמוכר ארונות פלסטיק האם מילת מפתח 'פלסטיק' היא מספיק טובה? ומה עם רק 'ארונות'? בשביל לדעת איך עושים את...

» קידום אורגני בגוגל תוך הפצת קישורים נכנסים

כל תכנית קידום אתרים זקוקה לקישורים נכנסים, בעבור אלו אשר אינם מכירים את התחום נסביר כי מדובר בקישורים המשולבים באתרים אחרים ומובילים את הגולשים ואת מנועי החיפוש אל האתר שלכם. מנועי החיפוש של גוגל רואים בקישורים הללו...

» כיצד לבצע מחקר מילות מפתח גוגל - חוד החנית של קידום אתרים

מחקר מילות מפתח גוגל,פעילות שבה אני מומחה, הינה אחת מהפעילויות החשובות בקידום אתרים אורגני בגוגל ולה השפעה רבה על המיקום בגוגל של אתרכם. הידעתם שמחקר מילות מפתח גוגל הינה הפעילות הראשונה שמקדם אתרים מקצועי ואמין צריך...

» קידום אתרים בגוגל הוא קידום אורגני. למי הוא מיועד?

קידום אתרים בגוגל  הוא קידום אורגני. למי הוא מיועד?קידום אתרים בגוגל מיועד לכל בעלי העסקים שמעוניינים להגדיל את מאגר הלקוחות שלהם ולחלחל לתודעתם של מספר רב של לקוחות פוטנציאלי. ומה יותר מתאים לזה מאשר חשיפה ברשת...

» למה נכון לפרסם עסקים באמצעות האינטרנט?

למה נכון לפרסם עסקים באמצעות האינטרנט?ישנן אופציות פרסום נוספות ורובן ככולן טובות, אולם קידום אתרים באינטרנט עולה על כולן באופן חד משמעי. פרסום ברדיו פונה לקהל המאזינים, פרסום בעיתון פונה לקהל שקורא עיתונים, ואת העיתון...

» קידום אתרים באינטרנט- מינוף העסק שלך

קידום אתרים באינטרנט- מינוף העסק שלךולא סתם קידום אתרים באינטרנט אלא קידום אתרים בגוגל. גוגל הוא מנוע החיפוש המועדף באופן חד משמעי על אחוז גבוה מאוד של גולשים. עובדה נוספת שזה המקום לציינה היא שרוב הגולשים מסתפקים...
STU2

רוצים להוסיף מאמר לאתר? הרשמו עכשיו והכניסו מאמר חדש

חיפוש מהיר בגוגל

מאמרים - כל הזכויות שמורות לפרסום אתרים באינטרנט מבית אקטיביטק בע"מ קידום אתרים