Predikce poptávky – Sezonalita, trend a zisk pod kontrolou

Autor: Jan Matoušek, 10. října 2019

Pokud máte predikovat poptávku po tom, co se bude prodávat, máte v zásadě dvě cesty. První, historicky starší, je založena na expertním odhadu, což je cokoli mezi pohledem z okna a sofistikovanou znalostí manažera po dvaceti sezónách ve firmě. Pokud však toužíte po přesnějších číslech, povoláte na pomoc statistiku. Zde se vám rovněž otevře množství možností. Neprimitivnější metoda je prostě vzít prodeje z minulého roku. Nevýhody? Nemůžete naplánovat růst, ani se připravit na pokles. Také populární klouzavý průměr (čti průměr z více posledních období) vás moc daleko nedostane.

Na návštěvě v hlavách spotřebitelů

O trochu lepší je věštění z křišťálové koule zvané marketingový výzkum. Prostě se spotřebitelů zeptáme, kolik budou kupovat! Bohužel to není tak prosté. Prvním kamenem úrazu je důvěryhodnost výzkumné agentury včetně jejích tazatelů. Občas si někdo místo zdlouhavého vyptávání prostě vyplní dotazník sám. Pokud je nepocitový jeden tazatel z deseti, statistika si s tím poradí. Pokud je ale kamenem úrazu sám spotřebitel a má nerealistický odhad ohledně toho, co bude kupovat příští rok, ani sebelepší agentura vás nezachrání. Určitou validitu má jen kontinuální tracking (opakovaný výzkum), kdy porovnáváme nákupní záměry z měsíce na měsíc a sledujeme rozdíly. Ideální? Zdaleka ne, podívejme se na chytřejší nápady.

Statistika a strojové učení v predikci poptávky

Základem strojového učení v predikci poptávky je analýza časových řad. To znamená, že vezmeme minulé prodeje, například seskupené po týdnu a začneme s nimi kouzlit. První a nejlehčí je nalézt trend. Ten se hledá lehce a nalezne ho po chvilce bádání i manažer s Excelem. V poptávce jdoucí nahoru nebo dolu není žádná věda. Dále máme obvykle sezonalitu – o vánocích prodáme více sáněk než v létě. A nakonec již zmíněný klouzavý průměr – kdy průměrujeme poslední období.

Pokročilá statistika začíná u modelů ARIMA, které počítají závislost aktuálních hodnot na hodnotách minulých. Například pokud zvyšující se prodeje znamenají, že se budou prodeje zvyšovat dále, ARIMA tuto závislost zachytí a zobrazí. Pokud zvyšující se prodeje naopak znamenají brzký pád, model to zachytí rovněž. Přidáme-li k ARIMĚ sezónní složku, máme základní funkční model, který má v sobě trend, sezonalitu a základ v konzervativních klouzavých průměrech.

Alternativou k statistické metodě ARIMA je exponenciální vyrovnávání (ETS – exponential smoothing), což je metoda, která dává pozdějším pozorováním větší váhu než těm historickým. V základní podobě jde o primitivní vážený průměr, ale pokud k ní přidáme sezonalitu a trend, jde opět o životaschopný koncept.

Špičkové nástroje na časové ose

V posledních letech se k vousatým metodám časových řad přidala řada úplně nových – pokud začneme tou nejvíce cool – časové řady se predikují pomocí neuronových sítí. Mnohé jiné nové metody však jsou vylepšením těch starších. Zlepšilo se poznání správných intervalů sezonality, modely se obohatily o nové transformace, mnohé metody zažily update i v řešení svých chyb odhadu. Častý přístup je, že se prostě pustí nový optimalizační algoritmus k eliminaci chyb toho stávajícího. Jiné metody spouští stovky rozhodovacích stromů pro zjištění všech možných znáhodněných scénářů. Ještě další metody se snaží postihnout všechny kalendářní období najednou – od roku po sekundu, a využít i ty nejmenší informace ukryté v datech.

Automatické strojové učení

Zhruba posledních 10 let je nejlepší praxí – implementovanou v špičkových softwarových balíčcích – prostě spočítat všechny existující metody s všemi možnými parametry a automaticky vyhodnotit na testovacím období, která metoda dává nejlepší výsledky. Název pro takovýto postup je zcela fantastický – Automatic Machine Learning neboli automatické strojové učení, zkráceně Auto ML. Každá z pokročilých metod je automaticky pouštěna s mnoha různými parametry, například s různě složitou sezonalitou, s trendem a bez trendu, s učením na krátkém i dlouhém období. Následně se na testovacím období, pouští kontrola předpovědí oproti realitě. Za testovací období již musíme mít nasbíraná data, abychom mohli (opět automaticky) vyhodnotit, která metoda se nejlépe trefuje. Nakonec se vybere model do produkce, který dělá nejméně chyb z hlediska přesnosti předpovědí.

Aby to fungovalo

Konečným výsledem je zapojení do objednávkového systému. Zde je třeba ještě odlišit, které zboží jde například přes oceán lodí, které jde letadlem, a které kamionem například z Kolína. Skladová dostupnost je jedním z hlavních parametrů poptávky, protože kdo z nás rád objednává neskladové zboží? Cílem optimalizace je pořád ještě staromódní maximalizace zisku, takže je třeba dbát ohled na to, abychom měli zboží, které se firmě vyplatí prodávat. Na druhou stranu ani spokojenost zákazníka není k zahození, takže je třeba naskladnit i položky, které vedou k uspokojení zákaznických potřeb i za cenu malé marže. Pokud například papírnictví nebude mít levné papíry, zákazníci se obrátí jinam, a neprodá se ani související zboží, na kterém se již vydělává.

P.S.: Můj tajný tip na metodu, která překoná všechny AutoML metody na děravých a neúplných datech, vám řeknu až na schůzce.

Jan Matoušek – data scientista již od roku 2003. Od roku 2009 vede svoji firmu Data Mind a řeší s firmami využití dat. Postavil desítky prediktivních i segmentačních modelů, které vydělávají skutečné peníze pro klienty.

Nastavení cookies

Zde máte možnost přizpůsobit soubory cookies dle kategorií, jak vyhovují nejlépe Vašim preferencím.

Technické cookies

Technické cookies jsou nezbytné pro správné fungování webové stránky a všech funkcí, které nabízí a nemohou být vypnuty bez zablokování funkcí stránky. Jsou odpovědné mj. za uchovávání produktů v košíku, přihlášení k zákaznickému účtu, fungování filtrů, nákupní proces nebo ukládání nastavení soukromí. Z tohoto důvodu technické cookies nemohou být individuálně deaktivovány nebo aktivovány a jsou aktivní vždy

Analytické cookies

Analytické cookies nám umožňují měření výkonu našeho webu a našich reklamních kampaní. Jejich pomocí určujeme počet návštěv a zdroje návštěv našich internetových stránek. Data získaná pomocí těchto cookies zpracováváme anonymně a souhrnně, bez použití identifikátorů, které ukazují na konkrétní uživatelé našeho webu. Díky těmto cookies můžeme optimalizovat výkon a funkčnost našich stránek.

Preferenční cookies

Preferenční cookies umožňují, aby si webová stránka zapamatovala informace, které mění, jak se webová stránka chová nebo jak vypadá. Je to například Vámi preferovaný jazyk, měna, oblíbené nebo naposledy prohlížené produkty apod. Díky těmto cookies Vám můžeme doporučit na webu produkty a nabídky, které budou pro Vás co nejzajímavější.

Marketingové cookies

Marketingové cookies používáme my nebo naši partneři, abychom Vám dokázali zobrazit co nejrelevantnější obsah nebo reklamy jak na našich stránkách, tak na stránkách třetích subjektů. To je možné díky vytváření tzv. pseudonymizovaného profilu dle Vašich zájmů. Ale nebojte, tímto profilováním zpravidla není možná bezprostřední identifikace Vaší osoby, protože jsou používány pouze pseudonymizované údaje. Pokud nevyjádříte souhlas s těmito cookies, neuvidíte v reklamních sděleních obsah ušitý na míru Vašim zájmům.

Souhlasím s využitím vybraných souborů cookies Souhlasím s využitím všech souborů cookies