31
Фишки из патентов Google О которых вы могли не знать Сергей Кокшаров, 2017

Фишки из патентов Google на GuruConf-2017

Embed Size (px)

Citation preview

Page 1: Фишки из патентов Google на GuruConf-2017

Фишки из патентов GoogleО которых вы могли не знать

Сергей Кокшаров, 2017

Page 2: Фишки из патентов Google на GuruConf-2017

Семантическая близость слов важнее визуальной

ln2.in/pat_216

Page 3: Фишки из патентов Google на GuruConf-2017

"Масса" и "орбита" семантически одинаково удалены от "сатурна".

Page 4: Фишки из патентов Google на GuruConf-2017

Расстояния между словами пересчитываются, в зависимости от семантической разметки, а не удаленности в файле

Page 5: Фишки из патентов Google на GuruConf-2017

Google может сам размечать ваши документы

• Списки могут создаваться таблицами <table>, <tr>

• Могут создаваться блоковыми элементами <div>

• Тегами параграфа <p>

• Просто с помощью разделителей строки <br>

• Page analyzer component анализирует структуру документа, и не только списки

Page 6: Фишки из патентов Google на GuruConf-2017

Используйте правильную разметку, не спамьте ключами каждый элемент списка, учитывайте пересчет расстояний.

Page 7: Фишки из патентов Google на GuruConf-2017

Богатые семантикой страницы имеют дополнительный бонус

ln2.in/pat_409

Page 8: Фишки из патентов Google на GuruConf-2017
Page 9: Фишки из патентов Google на GuruConf-2017

Узнать количество мест в ТОПе можно, анализируя и сравнивая

частотные словари

Page 10: Фишки из патентов Google на GuruConf-2017

ln2.in/pat_225

Вес ссылок зависит от вероятности перехода по ним

Page 11: Фишки из патентов Google на GuruConf-2017

Учитываемые характеристики ссылок

• Размер и цвет текста ссылки

• Позиция в документе (списки, текст, до или после первого экрана 800х600, боковая панель, футер...)

• Позиция в списке (если ссылка в списке)

• Количество слов в анкоре, их коммерческость

• Тип ссылки (текст, картинка), соотношение сторон

• Слова, окружающие ссылку

• Внутренняя или внешняя, тематический кластер

Page 12: Фишки из патентов Google на GuruConf-2017

Учитываемые характеристики донора

• Количество ссылок

• Присутствие слов в тексте и заголовках

• Тематический кластер документа

• Степень соответствия тематических кластеров донора и ссылки

Page 13: Фишки из патентов Google на GuruConf-2017

Учитываемые поведение пользователей

• Клики по ссылкам, вводимые адреса, заполнения форм

• Язык и интересы пользователя

• Используемые ключевые слова

• Частота клика по ссылке

• Как часто ссылки не кликаются при выборе других

• Как часто ни одна ссылка в документе не кликается

• ...

Page 14: Фишки из патентов Google на GuruConf-2017

nofollow не учитывается в этой модели

Page 15: Фишки из патентов Google на GuruConf-2017

Для попадания в блок ответов используйте natural language answer

ln2.in/pat_354

Page 16: Фишки из патентов Google на GuruConf-2017

Особенности блок-ответов• Показываются только по intent- или factual- queries

• Натуральный язык запроса является intent-query

• Имеется ограниченный набор шаблонов, и блек-листы, созданные модераторами

• Основной ключ должен входить в заголовок

• Для тематической классификации используется анализ слов в релевантных пассажах (LSI-фраз)

• Для ряда тематик необходимы списки

• Ответ выбирается только из natural language

Page 17: Фишки из патентов Google на GuruConf-2017

Шаблон "Как делать {что-то}"

Page 18: Фишки из патентов Google на GuruConf-2017

Блеклист пока работает не для всех языков :)

Page 19: Фишки из патентов Google на GuruConf-2017

Сравните, кто из них дает естественный ответ

Page 20: Фишки из патентов Google на GuruConf-2017

Можно использовать в свою пользу

Page 21: Фишки из патентов Google на GuruConf-2017

Хотите еще в топ по запросу "жидкие обои"? :)

или "венецианская штукатурка"...

Контекст

ИзображенияБлок ответов

Ютуб

Page 22: Фишки из патентов Google на GuruConf-2017

ln2.in/pat_722

Рейтинг документа меняется не сразу после внесения изменений

Песочница

Page 23: Фишки из патентов Google на GuruConf-2017

Определить старый ранк документа

Определить целевой ранк

Выбрать функцию перехода

Определить ранк документа, исходя из функции перехода

Присвоить ранк

Page 24: Фишки из патентов Google на GuruConf-2017

Для чего?• Борьба со спамными техниками

• Дает не тот эффект, который ожидал оптимизатор (вводит в заблуждение)

• Позволяет выявлять документы и сайты, продвигающиеся спамом

Page 25: Фишки из патентов Google на GuruConf-2017

Окончательно рейтинг стабализируется через 70 дней после обнаружения изменений

Функция перехода с задержкой по времени

Page 26: Фишки из патентов Google на GuruConf-2017

10% изменение рейтинга дает обратный эффект

20 дней отрицательного рейтинга

Page 27: Фишки из патентов Google на GuruConf-2017

Особенности• Функция перехода выбирается из множества: с задержкой по времени, отрицательная, случайная.

• Модификация ранка на 10% включит отрицательную функцию перехода.

• Идентификация спама происходит во время действия функции перехода.

• Изменение сигналов выше порогового значения приводят к фильтрации спама (обнулении рейтинга).

• Функция перехода может устанавливаться не только для документа, но и для всего сервера.

Page 28: Фишки из патентов Google на GuruConf-2017

Анализируемые спам-техники• Переспам текста ключевыми словами

• Невидимый текст

• Мелкий шрифт

• Редиректы (подмена)

• Переспам мета-тегов

• Манипуляции ссылками

• С 2010 года список пополнился

Page 29: Фишки из патентов Google на GuruConf-2017

Как искать патенты• patents.google.com

• www.seobythesea.com

• http://patents.ic.gc.ca/opic-cipo/cpd/eng/search/advanced.html

• другие поисковики патентов

Page 30: Фишки из патентов Google на GuruConf-2017

Пример поиска патентов Google через их поисковый сервис

Page 31: Фишки из патентов Google на GuruConf-2017

Кокшаров Сергей

https://telegram.me/devakatalk https://fb.com/sevasjack

https://vk.com/devaka