Datafesťák 2018 – Popis jednoho zápasu

Autor: Jan Matoušek, 27. listopadu 2018

Datafesťák sliboval mnoho: Setkání datové scény, hackathon i business přednášky. Propagace byla na nás datové firmy z Karlína natolik cílená, že se ke mně nakonec přidala skalní část analytického týmu a vyrazili jsme plným autem.

Business track – letem světem 

Už jsme v Hradci, ale Google mapa nás při zadání „fakulta informatiky“ směřuje neomylně do centra na rektorát. Bojovku si zopakujeme i s pomocí pracovníků místní (dez)informační kanceláře pro turisty, která nás pro jistotu směřuje na humanitní fakulty. Zmeškali jsme tedy jak BizTreat, nabízející rozlišení mezi datovými analytiky a datovými detektivy, tak i část krásné tváře Revolgy, která básnila o přechodu na Google Docs. Dále je business track celkem hustý, vyniká Adam Votava s rozpoznáváním špatných světel ve výrobě Bavoráků. 
Trocha inovace a spousta poctivého řemesla, tak to má být. Příběh Adleru na mě působí již trochu obyčejněji, přechodů na BI jsme měli v minulém roce asi více. Čerpadla přidávají na autenticitě, protože to jsou kluci, z nichž část ještě dělá rukama. Dále tam máme Michala Bláhu, Hlídače státu. Obdivuhodné, co dokázal: je to show jednoho hrdiny na poli otevřených státních dat. Jeho produkt má ještě slabiny, ale více takových chlapů by tahle země potřebovala jak sůl. 
To Pavel Indra z Dáme Jídlo si jde za tvrdě za svým businessem– má své dojezdové mapy a jeho tým chce analýzy. Mišmaš doplňuje výrobna lyží Head, celá česká a poctivá, jen do prediktivní údržby jí něco chybí, prezentuje se pečlivý monitoring strojů, přestávek a práce. Pietro Filipi je zde s modelem skladových zásob a pochvalou Kebooly. Nechybí ani textová analytika Geneea a Apify, scrapování webu. Apify má snahu profilovat se jako legitimní služba a vystoupit z temných vod boje proti scrapovacím robotům. To je fajn, ale jako uživatel bych si přál především dopracovat průvodce scrapováním, aby mi nestálo za to si vše napsat sám v Pythonu. Startupová hvězda Ytica prezentuje raketový start, a pokud budu mít možnost zopakovat cestu z nuly na miliardu, tak to také udělám; jen upřímně, tohle není typický příběh. Koncem business tracku přichází charizmatik Vojta Roček, který prodal Stories – jeho vzkaz je, že je za vodou.

Drbárna a bazar

Čas na drby a lobbying je zde, před finálním zadáním hackathonu. Setkání Padáka s Ditou Pé působí kouzelně, oba přerostly své vlastní geniální myšlenky. Padák udělá z punkové Kebooly firmu s procesy a Dita zase z Czechitas vzdělávací agenturu pro obě pohlaví. A já myslím, že vám to vyjde! Sejlsáci mezitím bojují o svůj chleba, ajťáci jedou na pivu a z Pavla Doležala je CEO. 
Foto : Dita slibuje pod nátlakem Czechitas pro chlapy. Fotograf: Padák (zachycen okrajově)
Petr Šimeček Keboola Dita Přirylová Czechitas Jan Matoušek Data Mind Radovan Jirka BizzTreat
Z datové scény jsou tu všichni (aspoň z Karlína): Clever analytics, Alook, Biztreat, Apify, Keboola a spoustu dalších. Chybí jen ti, kteří mají vlastní hackathony, zhruba od Microsoftu po Socialbakers.

Očekávání zadavatelů – udělejte nám to celý!

Večerní část, trocha únavy je již znát, a to máme teprve dostat zadání, které má být zítra odpoledne hotové. Můžeme si vybrat. No uf. Michal Bláha (Hlídač státu) má velice atraktivní státní datasety, všechny smlouvy, všechny zakázky, a k tomu další stovky tabulek. Pole široké a neorané. Nicméně, jak se později ukáže být osudovým, nejsou načteny v jednotném prostředí Kebooly, a není tedy záruka, že půjdou snadno použít. Nastupuje Bageterie Boulevard se zadáním na rok práce analytického týmu- jejich multizadání je odsouzeno zůstat z velké části nenaplněné. Dáme jídlo přichází s úkoly z oblasti kategorizace jídel, upsellu a dalších, také velmi ambiciózně. Dále tu máme data o letech z Kiwi, bohužel po interních bojích poněkud okleštěné, a to právě o lety (zůstává web search a letiště). Velmi úzký je dataset i zadání z výroby – jen práce a přestávky. 

Nervous breakdown

Konec legrace, teď máme makat. Pustíme se do ambiciózního plánu konečně trochu pohnout se státními daty. Za noc. Ve dvě ráno se hroutíme pod tíhou nekompatibilních formátů, množství dat a rozhraní. Fatální ránu tomu zasazují víceřádkové záznamy v textových polích v stažených csv souborech. Něco, co bychom přes den v pohodě vyřešili, řádkování uprostřed textových polí, nám totálně vyčerpanými po business tracku, small talku a hledání zásuvek i wifiny, dá pořádně zabrat. Jdu spát s tím, že zítra už nebudu mít datovou firmu, ale raději bude prodávat bargy nebo tak něco. Spánek je ovšem silné slovo, převaluji se jak na fakírském loži a v pět ráno jsem zase u compu. Tentokrát s myšlenkou, že hacknout smlouvy přes noc je přece jen trochu moc, a že vezmeme zavděk business daty. Po zběžném ohledání chybí ve výrobních datech vazby, Kiwi chybí zase lety, takže kvalitní dataset nalézám jen u Dáme Jídlo. Zapojuji postupně celý ospalý tým včetně externího Matěje Pacovského a jdeme do toho. Do tří hodin odpoledne zvládneme Power BI dashboard, prediktivní model budoucí hodnoty zákazníka a next-best-offer nad jídly. 

Porno a šunka kraluje

Jde se prezentovat. Vítězný tým třídí porno, ostatní kreslí mapy, vychytávají business nebo honí slevaře s bagetami v hubě. My – Data Mind a Alook máme Dáme jídlo. Konkurenti přichází s churnovým a kategorizačním modelem, my s predikcí nákupu a next-best-offer. Nastane poněkud improvizované hodnocení. Z původních cca deseti týmů přežilo do hodnocení šest. Ostatní se vypařili - přes noc. Bohužel i velké týmy mohou hlasovat sami pro sebe. O jedno místo nám uniká atraktivní cena v podobě Iberské šunky. Sláva, neztloustnu další kila, stačí mi to dosavadní přežírání. Neporažení, ale bez medaile, sedáme zpátky do auta, byl to dlouhý víkend, a to je teprve sobota. 
 
Jan Matoušek, šéf analytické firmy Data Mind 
 
Tyto webové stránky používají k poskytování svých služeb soubory Cookies. Používáním těchto webových stránek souhlasíte s použitím souborů Cookies.
Nastavení Souhlasím
Souhlas můžete odmítnout zde.
×
Nastavení cookies

Zde máte možnost přizpůsobit soubory cookies dle kategorií, jak vyhovují nejlépe Vašim preferencím.

Technické cookies

Technické cookies jsou nezbytné pro správné fungování webové stránky a všech funkcí, které nabízí a nemohou být vypnuty bez zablokování funkcí stránky. Jsou odpovědné mj. za uchovávání produktů v košíku, přihlášení k zákaznickému účtu, fungování filtrů, nákupní proces nebo ukládání nastavení soukromí. Z tohoto důvodu technické cookies nemohou být individuálně deaktivovány nebo aktivovány a jsou aktivní vždy

Analytické cookies

Analytické cookies nám umožňují měření výkonu našeho webu a našich reklamních kampaní. Jejich pomocí určujeme počet návštěv a zdroje návštěv našich internetových stránek. Data získaná pomocí těchto cookies zpracováváme anonymně a souhrnně, bez použití identifikátorů, které ukazují na konkrétní uživatelé našeho webu. Díky těmto cookies můžeme optimalizovat výkon a funkčnost našich stránek.

Preferenční cookies

Preferenční cookies umožňují, aby si webová stránka zapamatovala informace, které mění, jak se webová stránka chová nebo jak vypadá. Je to například Vámi preferovaný jazyk, měna, oblíbené nebo naposledy prohlížené produkty apod. Díky těmto cookies Vám můžeme doporučit na webu produkty a nabídky, které budou pro Vás co nejzajímavější.

Marketingové cookies

Marketingové cookies používáme my nebo naši partneři, abychom Vám dokázali zobrazit co nejrelevantnější obsah nebo reklamy jak na našich stránkách, tak na stránkách třetích subjektů. To je možné díky vytváření tzv. pseudonymizovaného profilu dle Vašich zájmů. Ale nebojte, tímto profilováním zpravidla není možná bezprostřední identifikace Vaší osoby, protože jsou používány pouze pseudonymizované údaje. Pokud nevyjádříte souhlas s těmito cookies, neuvidíte v reklamních sděleních obsah ušitý na míru Vašim zájmům.

DALŠÍ ČLÁNKY