30
ЖАДНЫЕ АЛГОРИТМЫ ОПТИМИЗАЦИИ

Жадные алгоритмы оптимизации для определения эффективности объявлений. Александр Швец (Marilyn)

  • Upload
    -

  • View
    256

  • Download
    4

Embed Size (px)

Citation preview

ЖАДНЫЕ АЛГОРИТМЫ ОПТИМИЗАЦИИ

О ЧЕМ

• Чтонужнознатьоматематическихалгоритмахоптимизации

• Какадаптироватьтеориюкпрактике

• Примерыуспешногоиспользования

ЧАСТЬ IМАТЕМАТИЧЕСКАЯ

“Оптимизация — задача нахождения экстремума целевой функции в некоторой области конечномерного векторного пространства, ограниченной набором линейных и/или нелинейных равенств и/или неравенств.”

N(x) - зависимость количества кликов от ставки.C(x) - зависимость стоимости от ставки.

ПРИМЕР ЗАДАЧИ

Симплекс-методВенгерскийметод

МетодФибоначчи

Методперебора

МетодЛагранжаПринципмногорукого бандита

Градиентныйспуск

Генетическиеалгоритмы

Метод Нелдера — Мида

Алгоритм Левенберга —Маркардта

Муравьиныеалгоритмы

Портфельнаятеория

Метод ветвей и границ

МетодМонте-Карло

ЛОКАЛЬНЫЙ И ГЛОБАЛЬНЫЙ

ЛОКАЛЬНЫЙ ГЛОБАЛЬНЫЙ

• Алгоритмвосхожденияквершине• Алгоритмимитацииотжига• Генетическиеалгоритмы• Симплекс-метод

• МетодМонте-Карло• Методвыделенияинтервалов

унимодальности• Методаппроксимирующихмоделей

ДЕТЕРМИНИРОВАННЫЙ И СТОХАСТИЧЕСКИЙ

ЖАДНЫЙ И НЕ ОЧЕНЬ

“В жадном алгоритме (greedy algorithm) всегда делается выбор, который кажется самым лучшим в данный момент — т.е. производится локально оптимальный выбор в надежде, что он приведет к оптимальному решению глобальной задачи.”

ЗАДАЧА МНОГОРУКОГО БАНДИТА

ПОСТАНОВКА ЗАДАЧИ

Имеетсямножестводопустимыхдействий(ручек,arms)сразличнымираспределениямиразмерапремии(reward,payoff)

• Какоедействиесовершитьследующим?• Какбыстреенайтисамоевыгодноедействие?• Какиевозможныстратегии?

УПРОЩЕННЫЙ ПРИМЕР

1/1=100% 1/1=100% 1/1=100%

Изначальновероятностьодинаковая

УПРОЩЕННЫЙ ПРИМЕР

1/2 =50% 1/1=100% 1/1=100%

Показаличерную– пользовательненажал

УПРОЩЕННЫЙ ПРИМЕР

1/4 =25% 1/4 =25% 1/4 =25%

Прошловремя… ниодинпользовательнекликнул

УПРОЩЕННЫЙ ПРИМЕР

2/5 =40% 1/4 =25% 1/4 =25%

Ура!Естькликпочерной!

УПРОЩЕННЫЙ ПРИМЕР

2/9 =22% 1/4 =25% 1/4 =25%

Прошлоеще4показа… Похоже,этобыласлучайность

УПРОЩЕННЫЙ ПРИМЕР

114/4071 = 2.8% 59/2264 = 2.6% 205/6385 = 3.2%

Витогекартинабудеткакая-тотакая

МЕТОДЫ РЕШЕНИЯ

• Жаднаястратегия• Стратегияsoftmax• МетодUCB(upper confidencebound)• Модель DynamicGamma-Poisson

UCB1

1. Инициализация:дёрнуть за каждую ручку один раз.

2.Пока продолжается работа:дёрнуть за ручку j,для которой максимальна величина

𝑥"# +2 ln 𝑛𝑛"

𝑥"# – средний доход от ручки j,𝑛" – то,сколько раз мы дёрнули за ручку j𝑛 – то,сколько раз мы дёргали за все ручки.

ЧАСТЬ IIПРАКТИЧЕСКАЯ

ГДЕ ИСПОЛЬЗУЕТСЯ

• A/Bтестированиелендингов (GoogleAnalytics)• Поисковаявыдача(Яндекс)• Рекомендательныесистемы(Yahoo!Today,Surfing bird)• Всевозможныекрутилки рекламы

А КАК ЖЕ ТГБ?

ТГБ – ЭТО ВАМ НЕ RTB!

ПОД ДРУГИМ УГЛОМ

𝐵𝑢𝑑𝑔𝑒𝑡𝑆ℎ𝑎𝑟𝑒3 =𝑊𝑒𝑖𝑔ℎ𝑡3∑ 𝑊𝑒𝑖𝑔ℎ𝑡88

𝑊𝑒𝑖𝑔ℎ𝑡8 - весi-креатива,считаетсяпоформуле

𝑊𝑒𝑖𝑔ℎ𝑡8 = 𝐶𝑇𝑅8 +2𝑙𝑛∑ 𝐼𝑚𝑝𝑠""

𝐼𝑚𝑝𝑠8

𝐶𝑇𝑅8 —CTRкреативаза прошедшие сутки,𝐼𝑚𝑝𝑠8 — количество показов по креативуза тот же период.

ПОВЕДЕНИЕ КАМПАНИИ

CTR

ВРЕМЯ

УЛУЧШАЙЗЕРЫ

1. Умныйалгоритмдобавлениявпроцессновыхкреативов.

2. Элементслучайностивоизбежаниепроблемылокальныхминимумов.

3. Дополнительныеманипуляцииставками.

РЕЗЮМЕ

• Безматематикихорошуюрекламнуюсистемунепостроишь

• Ненадопридумывать,надоадаптироватьготовое

• Методомпробиошибокнаходитсялучшее

СПАСИБО!