Upload
-
View
256
Download
4
Embed Size (px)
Citation preview
О ЧЕМ
• Чтонужнознатьоматематическихалгоритмахоптимизации
• Какадаптироватьтеориюкпрактике
• Примерыуспешногоиспользования
“Оптимизация — задача нахождения экстремума целевой функции в некоторой области конечномерного векторного пространства, ограниченной набором линейных и/или нелинейных равенств и/или неравенств.”
N(x) - зависимость количества кликов от ставки.C(x) - зависимость стоимости от ставки.
ПРИМЕР ЗАДАЧИ
Симплекс-методВенгерскийметод
МетодФибоначчи
Методперебора
МетодЛагранжаПринципмногорукого бандита
Градиентныйспуск
Генетическиеалгоритмы
Метод Нелдера — Мида
Алгоритм Левенберга —Маркардта
Муравьиныеалгоритмы
Портфельнаятеория
Метод ветвей и границ
МетодМонте-Карло
ЛОКАЛЬНЫЙ ГЛОБАЛЬНЫЙ
• Алгоритмвосхожденияквершине• Алгоритмимитацииотжига• Генетическиеалгоритмы• Симплекс-метод
• МетодМонте-Карло• Методвыделенияинтервалов
унимодальности• Методаппроксимирующихмоделей
“В жадном алгоритме (greedy algorithm) всегда делается выбор, который кажется самым лучшим в данный момент — т.е. производится локально оптимальный выбор в надежде, что он приведет к оптимальному решению глобальной задачи.”
ПОСТАНОВКА ЗАДАЧИ
Имеетсямножестводопустимыхдействий(ручек,arms)сразличнымираспределениямиразмерапремии(reward,payoff)
• Какоедействиесовершитьследующим?• Какбыстреенайтисамоевыгодноедействие?• Какиевозможныстратегии?
МЕТОДЫ РЕШЕНИЯ
• Жаднаястратегия• Стратегияsoftmax• МетодUCB(upper confidencebound)• Модель DynamicGamma-Poisson
UCB1
1. Инициализация:дёрнуть за каждую ручку один раз.
2.Пока продолжается работа:дёрнуть за ручку j,для которой максимальна величина
𝑥"# +2 ln 𝑛𝑛"
𝑥"# – средний доход от ручки j,𝑛" – то,сколько раз мы дёрнули за ручку j𝑛 – то,сколько раз мы дёргали за все ручки.
ГДЕ ИСПОЛЬЗУЕТСЯ
• A/Bтестированиелендингов (GoogleAnalytics)• Поисковаявыдача(Яндекс)• Рекомендательныесистемы(Yahoo!Today,Surfing bird)• Всевозможныекрутилки рекламы
ПОД ДРУГИМ УГЛОМ
𝐵𝑢𝑑𝑔𝑒𝑡𝑆ℎ𝑎𝑟𝑒3 =𝑊𝑒𝑖𝑔ℎ𝑡3∑ 𝑊𝑒𝑖𝑔ℎ𝑡88
𝑊𝑒𝑖𝑔ℎ𝑡8 - весi-креатива,считаетсяпоформуле
𝑊𝑒𝑖𝑔ℎ𝑡8 = 𝐶𝑇𝑅8 +2𝑙𝑛∑ 𝐼𝑚𝑝𝑠""
𝐼𝑚𝑝𝑠8
𝐶𝑇𝑅8 —CTRкреативаза прошедшие сутки,𝐼𝑚𝑝𝑠8 — количество показов по креативуза тот же период.
УЛУЧШАЙЗЕРЫ
1. Умныйалгоритмдобавлениявпроцессновыхкреативов.
2. Элементслучайностивоизбежаниепроблемылокальныхминимумов.
3. Дополнительныеманипуляцииставками.
РЕЗЮМЕ
• Безматематикихорошуюрекламнуюсистемунепостроишь
• Ненадопридумывать,надоадаптироватьготовое
• Методомпробиошибокнаходитсялучшее