63
SEO курс Лекция 1 Основи на търсенето Лили Грозева allviaweb.com

SEO курс 2014, лекция 1 - Основи на търсенето

Embed Size (px)

DESCRIPTION

SEO курс 2014, лекция 1 - Основи на търсенето

Citation preview

Page 1: SEO курс 2014, лекция 1 - Основи на търсенето

SEO курс

Лекция 1Основи на търсенето

Лили Грозеваallviaweb.com

Page 2: SEO курс 2014, лекция 1 - Основи на търсенето

Основи на търсенето

Page 3: SEO курс 2014, лекция 1 - Основи на търсенето

1.1 От какво се състои WWW

Мрежата е съвкупност от страници и файлове свързани, чрез сложен набор от хиперлинкове.

● Изображения● Видео● PDF документи● Flash видеа● Javascript

Page 4: SEO курс 2014, лекция 1 - Основи на търсенето

1.2 История и предназначение на търсачките.

● първите търсачки с хипертекст датират от 1945● мейнстрим интернетa е от около 20 години● първите търсачки - 1993/4 - Excite, Altavista, Yahoo!● Google стартира през 1996 като Backrub

Page 5: SEO курс 2014, лекция 1 - Основи на търсенето

1.3 трите стъпки на търсенето: обхождане, индексиране и позициониране

● Обхождане (намиране) - С този процес търсачките намират ново съдържание. Използват сложни машини, които посещават страниците и следват линковете в тях, за да го намерят.

● Индексиране (съхранение) - Търсачките поддържат “копие” на всяка страница, която посещават. Тази база данни от страници (индекс) се съхранява на огромен брой компютри по такъв начин, че може да се търси в нея много бързо.

● Позициониране (сортиране) - Когато потребителя търси, търсачката използва ‘рецепта’, известна като алгоритъм за да подреди намерените страници в съответствие с търсенето, и така образува класация по съответствие.

Page 7: SEO курс 2014, лекция 1 - Основи на търсенето

1.4 последни разработки на търсачките

● Социални мрежи - уебсасайтове като Facebook и Twitter помагат на търсачките да разберат кои страници са популярни и се споделят. Тази информация се добавя към алгоритъма на търсачките, и се взима предвид в позиционирането.

● Персонализирано търсене - по подобен начин, търсачките използват информация от социалната активност на потребителите и историята на търсенията им, за да определят какво е важно за всеки търсещ. Това означава, че двама потребители, търсещи с една и съща дума, могат да виждат различни резултати.

Page 8: SEO курс 2014, лекция 1 - Основи на търсенето
Page 9: SEO курс 2014, лекция 1 - Основи на търсенето

1.4 последни разработки на търсачките

● Google Suggest - стартира през август 2008, и използва сложни алгоритми за да предвиди какво търси потребителя. С набирането на думата, Google предлага допълнителни думи за да определи по-точно намерението на търсещия, или да му направи нови предложения, преди той да е натиснал enter.

● Google Instant - стартира през септември 2010, и значително променя начина по който търсят потребителите, като показва динамични резултати още преди потребителя да е натиснал enter.

Page 10: SEO курс 2014, лекция 1 - Основи на търсенето
Page 11: SEO курс 2014, лекция 1 - Основи на търсенето

Използване на търсачка

Page 12: SEO курс 2014, лекция 1 - Основи на търсенето

2.1 видове резултати

● изображения● местни бизнеси● marked up резултати (т.е. звездички/рейтинг)● продукти● видео● one-box резултати (knowledge graph)

Page 13: SEO курс 2014, лекция 1 - Основи на търсенето

2.2 ползи от оптимизацията за блендираните резултати

● възможност за повече видимост в страницата с резултати (SERP)

● възможност за предлагане на по-смилаеми формати● трупане на червени точки пред Google - използвате

техните продукти, използвате форматите на “бъдещето”

Page 14: SEO курс 2014, лекция 1 - Основи на търсенето
Page 15: SEO курс 2014, лекция 1 - Основи на търсенето
Page 16: SEO курс 2014, лекция 1 - Основи на търсенето
Page 17: SEO курс 2014, лекция 1 - Основи на търсенето
Page 18: SEO курс 2014, лекция 1 - Основи на търсенето
Page 19: SEO курс 2014, лекция 1 - Основи на търсенето

2.3 използване на оператори за търсене

Оператора за търсене, позволява да се филтрира набор от резултати, чрез добавяне на параметри и информация.

● можете да използвате повече от един в заявка● варират в различните търсачки, но най-популярните са

еднакви

Page 20: SEO курс 2014, лекция 1 - Основи на търсенето
Page 21: SEO курс 2014, лекция 1 - Основи на търсенето

2.4 оператори за търсене за напреднали

Web Search: allinanchor:, allintext:, allintitle:, allinurl:, cache:, define:, filetype:, id:, inanchor:, info:,intext:, intitle:, inurl:, link:, related:, site:Image Search: allintitle:, allinurl:, filetype:, inurl:, intitle:, site:Groups: allintext:, allintitle:, author:, group:, insubject:, intext:, intitle:Directory: allintext:, allintitle:, allinurl:, ext:, filetype:, intext:, intitle:, inurl:News: allintext:, allintitle:, allinurl:, intext:, intitle:, inurl:, location:, source:Product Search: allintext:, allintitle:

Page 22: SEO курс 2014, лекция 1 - Основи на търсенето

2.5 приложение на операторите за SEO

● SEO одити за проверки на индексираните страници, двойно съдържание, структура на уеб адресите, мапиране на ключови думи в заглавия и др.

● при линк билдинг за намиране на сайтове с тематично съдържание, гест постове

Page 23: SEO курс 2014, лекция 1 - Основи на търсенето
Page 24: SEO курс 2014, лекция 1 - Основи на търсенето

2.6 опции за ограничаване и филтриране на търсенията: вертикали

● уеб страници● изображения● новини● видео● книги● блогове● дискусии● приложения ● патенти

Page 25: SEO курс 2014, лекция 1 - Основи на търсенето

2.6 опции за ограничаване и филтриране на търсенията: филтри

● време на публикация● достъпност и ползваемост● местоположение

Page 26: SEO курс 2014, лекция 1 - Основи на търсенето
Page 27: SEO курс 2014, лекция 1 - Основи на търсенето

Обхождане

(crawling)

Page 28: SEO курс 2014, лекция 1 - Основи на търсенето

3.1 какво представлява обхождането

Обхождането се случва с програми, които преминават от линк на линк и събират информация като:

● откриват нови страници, които са с важно съдържание и биха показали на потребителите

● следят когато страниците, които вече са обходени и са в индекса се опресняват с ново съдържание

Page 29: SEO курс 2014, лекция 1 - Основи на търсенето

3.1 важно е да се има предвид:

● обхождането стартира от robots.txt файлът ● честотата на обхождане зависи от навиците ви за поддръжка

на съдържанието● често кролерите четат първото и последното изречение в

body text на индексирана страница, за да видят дали има промени преди да я обходят

● линковете се обхождат в последователността, в която са в HTML файла на страницата, а не както са визуализирани за крайния потребител

Page 30: SEO курс 2014, лекция 1 - Основи на търсенето
Page 31: SEO курс 2014, лекция 1 - Основи на търсенето

3.2 възможни препятствия пред кролерите: използвани уеб технологии:

● Javascript● AJAX● Flash

Важно!: В SEO понякога се използват точно тези технологии, за реализацията на текстове или линкове, които искаме да забраним за индексиране.

Page 32: SEO курс 2014, лекция 1 - Основи на търсенето

3.2 възможни препятствия пред кролерите: използвани уеб технологии:

● Javascript● AJAX● Flash

За любознателните: Intro to Javascript on W3Schools, Intro to AJAX

on W3Schools, Wikipedia article on Adobe Flash

Page 33: SEO курс 2014, лекция 1 - Основи на търсенето

1.3.2 възможни препятствия пред кролерите: видове съдържание

● изображения

● видео

Page 34: SEO курс 2014, лекция 1 - Основи на търсенето

3.3 видове кролери

Какво е user agent?

User agent е програма, която действа от нечие име под формата на client (в конфогурацията клиент - сървър).

Например, user agent Googlebot, което е официалното име на кролерите, са програми, които действат от името на Google като client Google, викайки заявки от сървъра на който са намира уебсайта.

Page 35: SEO курс 2014, лекция 1 - Основи на търсенето

3.3 видове кролери

Освен краткото си име всички кролери имат и дълго, което съдържа информация за произхода и версията им.

Важно!: не само търсачките са user agents. Такива са всички програми, които имат достъп до информацията в сайта, например браузърите.

Например, така изглежда user agent Google Chrome:

Page 36: SEO курс 2014, лекция 1 - Основи на търсенето
Page 37: SEO курс 2014, лекция 1 - Основи на търсенето

3.3 видове кролери

Търсачките обикновено имат повече от един вид кролери, според предназначението им:● Googlebot● Googlebot-News (Googlebot)● Googlebot-Image (Googlebot)● Googlebot-Video (Googlebot)● Googlebot-Mobile● Googlebot-Mobile (smartphone)● Mediapartners-Google (за AdSense)● AdsBot-Google (проверява качеството на ландинг страницата)

Page 38: SEO курс 2014, лекция 1 - Основи на търсенето

3.3 видове кролери

Mozilla

Mozilla, като наименование което можете да видите така:

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.47 Safari/536.11

не е браузъра Mozilla, а термин описващ технология в браузърите, въведена от Netscape, и в момента използван от всички видове браузъри, включително последната версия на Google Chrome.

Page 39: SEO курс 2014, лекция 1 - Основи на търсенето

Индексиране

Page 40: SEO курс 2014, лекция 1 - Основи на търсенето

4.1 какво е уеб индекс

Уеб индекс е база данни със страници, които в случая на търсачките съдържат милиарди страници, съхранявани на хиляди сървъри по целия свят, и много бързо достъпни при търсене.

Информацията, която се съхранява за всяка страница е придобита в предходната стъпка - обхождане с кролер.

Когато търсите с ключова дума, търсачката търси в индекса си страници които съдържат тази или близка до нея дума.

Page 41: SEO курс 2014, лекция 1 - Основи на търсенето

4.2 достигане до информация

За да намери такива страници, търсачката използва няколко алгоритъма:

● наличие на думата в страницата● честота на ключовата дума в страницата● свързани ключови фрази (намиране на тематично обвързани

страници)● тематично моделиране (намиране на страници по същата

тема)

Page 42: SEO курс 2014, лекция 1 - Основи на търсенето

4.2 достигане до информация

Наличие на думата в страницата: търсачките преглеждат само повърхностно съдържанието за да видят дали страницата съдържа думата на търсене.

Това е най-несъвършения начин за намиране подходящи на търсенето страници.

Page 43: SEO курс 2014, лекция 1 - Основи на търсенето

Дума на търсене: бизнес услуги

Съдържание А:

Един от най-добрите методи за пестене на средства в кризата са аутсорсинг услугите. Това е един по-особен вид бизнес услуги, които позволяват значителна част от разходите на която и да е компания, в който и да е бизнес да се съкратят чувствително.

Съдържание Б:

Консултантски услуги в областта на: разработване и внедряване на системи за управление; разработване и внедряване на стандарти за продуктова сертификация; Разработване и управление на проекти по различни финансиращи програми; Обучение

В този случай търсачката би показала Съдържание А, независимо че по всяка вероятност за търсещият би бил по-полезен втория материал. Изборът се определя от това, че думата “бизнес услуги” се съдържа в текста на А, но не и на Б.

Page 44: SEO курс 2014, лекция 1 - Основи на търсенето

4.2 достигане до информация

Честота на ключовата дума в страницата: в този модел, търсачката търси в индекса си страници, в които тази дума се повтаря често.

Важно!: този модел търсачките използват само когато фразите не са често срещани.

Page 45: SEO курс 2014, лекция 1 - Основи на търсенето

Дума на търсене: фелпс олимпиада

Съдържание А:

Със спечелването на 8 златни медала на Олимпиадата в Пекин през 2008 г.Фелпс спечелва рекорда за най-много първи места в рамките на едно първенство.

Съдържание Б:

Второто издание на Зелената олимпиада приключи успешно. В нея взеха участие над 5000 деца от цялата страна. 29% от участниците решиха ...

В този случай търсачката отново би показала Съдържание А, но този път причината е, че ’фелпс’ е много по-рядко срещан термин от ‘олимпиада’ и всички резултати на първа страница гравитират около тази дума.

Page 46: SEO курс 2014, лекция 1 - Основи на търсенето
Page 47: SEO курс 2014, лекция 1 - Основи на търсенето

4.2 достигане до информация

Свързани ключови фрази: От огромното количество информация с която разполагат, търсачките ‘знаят’ че понякога определени думи често се използват заедно. Затова, когато се използва една от думите, търсачката може да покаже страници, съдържащи и другата дума.

Page 48: SEO курс 2014, лекция 1 - Основи на търсенето

Дума на търсене: батман

Съдържание А:

Батман е най-популярния и любим супергерой създаван някога.

Съдържание Б:

Крисчън Бейл играе Батман в последните три филма от поредицата от 2008.

В този случай търсачката би избрала да покаже Съдържание Б, защото [крисчън бейл] е често употребяван термин заедно с [батман], докато в първия текст има само едно споменаване, което не е достатъчно за машината да е сигурна, че това е най-подходящата страница и наистина се има предвид супергероя.

Page 49: SEO курс 2014, лекция 1 - Основи на търсенето

4.2 достигане до информация

Тематично моделиране: Това е най-сложният модел от четирите. Чрез изследване на по-сложни взаимовръзки между различните ключови думи и тяхната честота, търсачките се опитват да разберат коя е темата на страниците. Това е базовата версия на семантичното търсене.

Важно!: Търсачките използват комбинации от много други фактори (200+), за да преценят показването или позицията на дадена страница, примерите в урока са опростени и напълно теоритични.

Page 50: SEO курс 2014, лекция 1 - Основи на търсенето

Дума на търсене: ски

Съдържание А:

Спускайки се по почти вертикалния участък, мъжът отмести щеките си в хоризонтално положение и така избегна удар с дърво.

Съдържание Б:

Той се взираше в монитора на телевизора, обхванат от тежка депресия. Погледна през прозореца, решен да сложи край на живота си, но бързо се уплаши при вида на вертикалния участък.

За човешкото око е очевидно, че в Съдържание А темата е ски, докато в Съдържание Б съвсем не е. За търсачките обаче, това е много трудна задача, особено ако разполага само с горните три модела и те няма как да се ориентират само по думата [вертикален участък], която инак е популарна в ски дисциплините.

Page 51: SEO курс 2014, лекция 1 - Основи на търсенето

4.3 какво е каширане и как да проверим кашето на уеб страница

За да оптимизират ресурсите си, търсачките използват каширани версии (опростени, обикновено текстови копия) на страниците в индекса си. Каширана версия е тази която се използва при горните модели. Обикновено кашето е на няколко часа или няколко дни, и това означава че решението за позициониране на дадена страница, може да не се базира на текущото й съдържание.

Page 52: SEO курс 2014, лекция 1 - Основи на търсенето

4.3 проверка на кашеЗа да не сте зависими от версията и вида на браузъра си, най-универсалният вариант е през самата търсачка:

Page 53: SEO курс 2014, лекция 1 - Основи на търсенето

Позициониране(ranking)

Page 54: SEO курс 2014, лекция 1 - Основи на търсенето

5.1 какво се случва при търсене

Когато потребителят търси с ключова дума, търсачката проверява индекса си за страници, които съдържат или са най-близо до тази дума. Тогава всяка от тези страници получава оценка (ранк), базиран на стотици фактори асоциирани със самата страница.

След оценяването, страниците се подреждат в страницата с резултати на база ранка си.

Page 55: SEO курс 2014, лекция 1 - Основи на търсенето
Page 56: SEO курс 2014, лекция 1 - Основи на търсенето

5.1 какво се случва при търсене

Важно!:

● диаграмата горе е изключително опростена за да е по-нагледна. Реално механизмите по които се случват процесите са много по-сложни

● в реалните търсения, Google използва както потребителското онлайн поведение, така и статистики от ползването, асоциирани към страниците от сайта, които взема от Google Analytics (и затова е безплатен :))

Page 57: SEO курс 2014, лекция 1 - Основи на търсенето

5.2 как персонализираното търсене влияе на позициите

Търсачките често използват потребителското поведение, за да преценят колко са доволни от резултатите. Те не използват тези данни само за цялостното им глобално подобрение, но и за да показват персонализирани, по-качествени резултати на индивидуалния потребител.

(В някои страни, Google имат легални проблеми с нивото на лични данни които те събират за това персонализиране.)

Page 58: SEO курс 2014, лекция 1 - Основи на търсенето

5.2 как персонализираното търсене влияе на позициите

Ако сте логнати в Google Account, Google ще използва историята на сайтовете които сте посещавали, и ще ви ги показва по-високо в резултатите.

Ако не сте логнати в Google Account, Google пак ще се опита да ви ги персонализира, но този път на база cookie, което е прикачено към браузъра ви за 180 дни.

Page 59: SEO курс 2014, лекция 1 - Основи на търсенето

5.3 как персонализираното търсене влияе на SEO целите ви

● софтуера за следене на позициите в Google до голяма степен се обезсмисля

● важността от доброто потребителско преживяване се увеличава

● от януари 2012, Google агресивно налагат използването на Google+, която видимо променя резултатите за всеки потребител

● когато проверявате позиции на уебсайт, трябва да използвате браузър без уеб история (като например Incognito Mode на Google Chrome)

Page 60: SEO курс 2014, лекция 1 - Основи на търсенето

Упражнения § Дискусия

Page 61: SEO курс 2014, лекция 1 - Основи на търсенето

● Назовете 5 вида файлове, които биха били трудни за обхождане от търсачките.

● Кои са трите основни стъпки, които използват търсачките при търсене?

● Назовете два начина, по които персонализираното търсене се отразява на SEO.

● Какъв оператор за търсене бихте използвали за да проверите приблизителния брой страници индексирани от Google?

Page 62: SEO курс 2014, лекция 1 - Основи на търсенето

● Опитайте се да изведете новинарски модул в резултатите на Google.● Опитайте се да изведете блендирано търсене● Опитайте се да изведете резултати със страници, които съдържат

думата [Google search] в заглавието си.● намерете user agent на текущата версия на браузъра си ● намерете пример за уебсайт, който не може да бъде добре

индексиран, защото използва Flash на 100%● проверете cache на уебсайт с Google и Bing. Сравнете кашетата с

реалните версии на сайта и се опитайте да установите какво липсва.● Отворете два браузър прозореца. Логнете се в Google Account с

единия, но не и с другия. Търсете с една и съща дума и сверете резултатите.