Autor: Jan Matoušek, 27. listopadu 2018
Datafesťák sliboval mnoho: Setkání datové scény, hackathon i business přednášky. Propagace byla na nás datové firmy z Karlína natolik cílená, že se ke mně nakonec přidala skalní část analytického týmu a vyrazili jsme plným autem.
Business track – letem světem
Už jsme v Hradci, ale Google mapa nás při zadání „fakulta informatiky“ směřuje neomylně do centra na rektorát. Bojovku si zopakujeme i s pomocí pracovníků místní (dez)informační kanceláře pro turisty, která nás pro jistotu směřuje na humanitní fakulty. Zmeškali jsme tedy jak BizTreat, nabízející rozlišení mezi datovými analytiky a datovými detektivy, tak i část krásné tváře Revolgy, která básnila o přechodu na Google Docs. Dále je business track celkem hustý, vyniká Adam Votava s rozpoznáváním špatných světel ve výrobě Bavoráků.
Trocha inovace a spousta poctivého řemesla, tak to má být. Příběh Adleru na mě působí již trochu obyčejněji, přechodů na BI jsme měli v minulém roce asi více. Čerpadla přidávají na autenticitě, protože to jsou kluci, z nichž část ještě dělá rukama. Dále tam máme Michala Bláhu, Hlídače státu. Obdivuhodné, co dokázal: je to show jednoho hrdiny na poli otevřených státních dat. Jeho produkt má ještě slabiny, ale více takových chlapů by tahle země potřebovala jak sůl.
To Pavel Indra z Dáme Jídlo si jde za tvrdě za svým businessem– má své dojezdové mapy a jeho tým chce analýzy. Mišmaš doplňuje výrobna lyží Head, celá česká a poctivá, jen do prediktivní údržby jí něco chybí, prezentuje se pečlivý monitoring strojů, přestávek a práce. Pietro Filipi je zde s modelem skladových zásob a pochvalou Kebooly. Nechybí ani textová analytika Geneea a Apify, scrapování webu. Apify má snahu profilovat se jako legitimní služba a vystoupit z temných vod boje proti scrapovacím robotům. To je fajn, ale jako uživatel bych si přál především dopracovat průvodce scrapováním, aby mi nestálo za to si vše napsat sám v Pythonu. Startupová hvězda Ytica prezentuje raketový start, a pokud budu mít možnost zopakovat cestu z nuly na miliardu, tak to také udělám; jen upřímně, tohle není typický příběh. Koncem business tracku přichází charizmatik Vojta Roček, který prodal Stories – jeho vzkaz je, že je za vodou.
Drbárna a bazar
Čas na drby a lobbying je zde, před finálním zadáním hackathonu. Setkání Padáka s Ditou Pé působí kouzelně, oba přerostly své vlastní geniální myšlenky. Padák udělá z punkové Kebooly firmu s procesy a Dita zase z Czechitas vzdělávací agenturu pro obě pohlaví. A já myslím, že vám to vyjde! Sejlsáci mezitím bojují o svůj chleba, ajťáci jedou na pivu a z Pavla Doležala je CEO.
Foto : Dita slibuje pod nátlakem Czechitas pro chlapy. Fotograf: Padák (zachycen okrajově)
Z datové scény jsou tu všichni (aspoň z Karlína): Clever analytics, Alook, Biztreat, Apify, Keboola a spoustu dalších. Chybí jen ti, kteří mají vlastní hackathony, zhruba od Microsoftu po Socialbakers.
Očekávání zadavatelů – udělejte nám to celý!
Večerní část, trocha únavy je již znát, a to máme teprve dostat zadání, které má být zítra odpoledne hotové. Můžeme si vybrat. No uf. Michal Bláha (Hlídač státu) má velice atraktivní státní datasety, všechny smlouvy, všechny zakázky, a k tomu další stovky tabulek. Pole široké a neorané. Nicméně, jak se později ukáže být osudovým, nejsou načteny v jednotném prostředí Kebooly, a není tedy záruka, že půjdou snadno použít. Nastupuje Bageterie Boulevard se zadáním na rok práce analytického týmu- jejich multizadání je odsouzeno zůstat z velké části nenaplněné. Dáme jídlo přichází s úkoly z oblasti kategorizace jídel, upsellu a dalších, také velmi ambiciózně. Dále tu máme data o letech z Kiwi, bohužel po interních bojích poněkud okleštěné, a to právě o lety (zůstává web search a letiště). Velmi úzký je dataset i zadání z výroby – jen práce a přestávky.
Nervous breakdown
Konec legrace, teď máme makat. Pustíme se do ambiciózního plánu konečně trochu pohnout se státními daty. Za noc. Ve dvě ráno se hroutíme pod tíhou nekompatibilních formátů, množství dat a rozhraní. Fatální ránu tomu zasazují víceřádkové záznamy v textových polích v stažených csv souborech. Něco, co bychom přes den v pohodě vyřešili, řádkování uprostřed textových polí, nám totálně vyčerpanými po business tracku, small talku a hledání zásuvek i wifiny, dá pořádně zabrat. Jdu spát s tím, že zítra už nebudu mít datovou firmu, ale raději bude prodávat bargy nebo tak něco. Spánek je ovšem silné slovo, převaluji se jak na fakírském loži a v pět ráno jsem zase u compu. Tentokrát s myšlenkou, že hacknout smlouvy přes noc je přece jen trochu moc, a že vezmeme zavděk business daty. Po zběžném ohledání chybí ve výrobních datech vazby, Kiwi chybí zase lety, takže kvalitní dataset nalézám jen u Dáme Jídlo. Zapojuji postupně celý ospalý tým včetně externího Matěje Pacovského a jdeme do toho. Do tří hodin odpoledne zvládneme Power BI dashboard, prediktivní model budoucí hodnoty zákazníka a next-best-offer nad jídly.
Porno a šunka kraluje
Jde se prezentovat. Vítězný tým třídí porno, ostatní kreslí mapy, vychytávají business nebo honí slevaře s bagetami v hubě. My – Data Mind a Alook máme Dáme jídlo. Konkurenti přichází s churnovým a kategorizačním modelem, my s predikcí nákupu a next-best-offer. Nastane poněkud improvizované hodnocení. Z původních cca deseti týmů přežilo do hodnocení šest. Ostatní se vypařili - přes noc. Bohužel i velké týmy mohou hlasovat sami pro sebe. O jedno místo nám uniká atraktivní cena v podobě Iberské šunky. Sláva, neztloustnu další kila, stačí mi to dosavadní přežírání. Neporažení, ale bez medaile, sedáme zpátky do auta, byl to dlouhý víkend, a to je teprve sobota.
Jan Matoušek, šéf analytické firmy Data Mind