neděle 4. srpna 2013

Jaký je zájem o čaj v české Wikipedii

Nedělní chvilka praktické analytiky.

Když chci prodávat čaj, měl bych vědět, jak moc ho chtějí lidé kupovat. Nebo aspoň jak moc si o něm na Webu čtou. Na to se docela hodí Wikipedie a její statistika zhlédnutých stránek. Chtělo by to ovšem dostat data do přehledné tabulky, třeba takové:



Jak jsem ji vyrobil?

Vyšel jsem z hesla Čaj a klikal a klikal. URL každého relevantního hesla, ke kterému jsem se doklikal, jsem zkopíroval do googlí tabulky (Google Drive, jestli neznáte). Celkem jsem jich našel 51 a pomocí hledání v Googlu site:cs.wikipedia.org čaj jsem zkontroloval, zda mám opravdu vše.

Ve všech URL jsem pak nahradil doménu Wikipedie adresou stránky se statistikou vzorcem

=replace(A2;1;29;"http://stats.grok.se/cs/latest90/")

a z upravené adresy jsem vytáhl samotnou statistiku vzorcem

=ImportXML(C2;"/html/body/p[1]")

Ten otevře stránku, jejíž URL je v buňce C2, a pomocí XPath vykousne z HTML příslušnou část, v tomto případě první odstavec. Výsledek rozdělí do dvou buněk. V první je titulek hesla (např. Čaj) a v druhé text: „has been viewed 916 times in the last 90 days.“. Z toho už stačí vykousnout požadované číslo vzorcem

=value(regexextract(F2;"\d+"))

a je hotovo.

Tím jsem zjistil, že si lidé od dubna do června 2013 zobrazili ve Wikipedii celkem 58 763 stránek o čaji, tj. 653 stránky za den. Není to žádná bomba, ale zájem se o čaji něco dozvědět evidentně existuje a jde z něj vycházet v marketingové a obsahové strategii. Navíc přehled ukazuje i rozdělení zájmu na dílčí témata. Např. o zeleném čaji si asi lidé chtějí číst zhruba čtyřikrát častěji než o čaji bílém (93 vs. 22 zhlédnutí denně).

A co vy? Máte rádi čaj a hledáte si o něm různé informace? Napíšete mi jaké, kde a jak často?

26 komentářů:

  1. Marku a myslíš, že je nějaká kauzalita nebo korelace mezi počtem čtenářů Wikipedie a potenciálními zákazníky? Nerozporuji to, jen se ze zájmem ptám.

    OdpovědětVymazat
    Odpovědi
    1. Pavle, asi tam nějaká korelace bude, ale nevím jaká. Proto to beru spíš jen jako indikátor zájmu o informace a v tomto konkrétním případě si z toho dělám závěr ve smyslu: jo, lidi o čaji chtějí ty a ty obecnější informace, takže by dávalo smysl jim je nabídnout.

      Důsledky to pak může mít hlavně na obsahovou koncepci webu a link building.

      Vymazat
  2. Moc dobře Marku, díky. Už několikrát jsem si lámal hlavu nad tím, jak rozlišit transakční dotazy od informačních. Zejména pokud jsou zadány obecně. Takovéto řešení mě nenapadlo. Díky vám.

    OdpovědětVymazat
    Odpovědi
    1. Dovolil jsem si zpracovat porovnání hledanosti na Googlu a Seznamu vs. zobrazení ve Wikipedii pro výše uvedené fráze. Přestože tam vstupuje poměrně dost neznámých, pro obecnou představu o poměru informačních dotazů ku všem typům dotazů je myslím tato metoda vhodná: http://www.radekhojgr.cz/blog/jak-moc-lide-hledaji-informace/ Pokud má někdo nějakou jinou, přesnější, prosím svěřte se.

      Vymazat
    2. To je hezká úvaha, Radku, a hezký článek. Asi ho tweetnu :-)

      Reálně ten podíl informačních dotazů bude asi trochu větší, protože čísla hledanosti od vyhledavačů bývají nafouknutá, resp. zdaleka ne každé hledání vede k prokliku.

      Vymazat
    3. Díky Marku, budu poctěn :)

      Vymazat
  3. K Puehru jsem se dostal úplně náhodou, ale už nevím, kde to bylo. Snad v kung-fu kurzu, kde náš si-fu pije nějaký činský čaj. Pak jsem začal trochu hledat na Google, přečetl si o něm na webech různých čajoven. Překvapivě jsem na Wikipedii nebyl. A pak jsem hledal čajovnu v okolí, kde bych si koupil nějakou cenově rozumnou variantu. Když mi bude hodně chutnat, zkusím třeba i relativně drahý "koláč". A protože mi čaj chutnal, začal jsem se zajímat i o další druhy.

    OdpovědětVymazat
  4. Bohužel ale to co na wiki lidi zajíma primárně jsou IMHO účinky.
    Ty jsou zdravotní tvrzení - http://cs.wikipedia.org/wiki/Zdravotn%C3%AD_tvrzen%C3%AD - a většina z nich je zakázána: http://ec.europa.eu/nuhclaims/resources/docs/euregister.pdf

    Tato tvrzení nesmí být na stránce produktu ( kde je přidat do košíku nebo odkaz na stránku kde lze produkt přidat).
    Takže lze vytvořit stránku kde je popíšete ale nesmíte odkázat na produkt :/ Jak budete toto řešit?
    Popisek zdravotní účinky viz stránka ...

    OdpovědětVymazat
    Odpovědi
    1. Ano, vím, že se hodně lidí zajímá o čaj z pohledu léčivých nebo kosmetických účinků. Ze všech analýz se je snažím eliminovat, protože nejsou naší cílovou skupinou. Chceme čaj prezentovat výhradně jako chutný nápoj.

      Vymazat
    2. Toto mé dokáže naštvat. Dvě stě nebo tři sta let staré ověřené léčebné účinky bylin, a i čajů, nelze popsat, ale dvacet let staré "výskumy" syntetických podpíračů zdraví s mnoha vedlejšími účinky ano. Osobně věřím, že za tímto nařízením stojí klesajíci zisky farmafirem, protože čím dál víc lidí se vrací k udržování zdraví potravinami a bylinami. A kdyby byl ten afil, tak by byl zájem u nás na webu ;)

      Vymazat
  5. Protože čaj miluji, rád bych k Markovým otázkám něčím přispěl.

    Už jsem jeden příběh o čajovém byznysu četl - v antikvariátu v Mountain View jsem si koupil Mela Zieglera - The Republic of Tea (http://www.amazon.com/The-Republic-Tea-Creation-Business/dp/0385420579, existuje i verze pro Kindle). Právě The Republic of Tea je v USA hodně populární už i internetovým obchodem (http://www.republicoftea.com/), takže doporučuji prozkoumat maximum.

    Osobně si informace o čaji hledám dost často, aspoň jednou měsíčně. Nejčastěji různé názvy čajů, abych pochopil, co jsou zač. Zrovna předevčírem jsem hledal "tung ting", dříve "si ji chun". Pak jsem spokojen, že se dostanu na stránku jako třeba http://www.luyutea.cz/nabidka/caje-1/oolongy-18/taiwanske-oolongy-22/formosa-si-ji-chun-oolong-60/, kde překlad i výstižný popis původu jsou uvedeny. Informacím důvěřuji, protože zrovna tuto firmu znám z offline světa. Paradoxně až dnes jsem si prošel i jiné výsledky na "si ji chun" a všiml si, že třeba http://www.cinsky-caj.cz/cinsky-caj/oolong-z-taiwanu-formosa/si-ji-chun-oolong.html obsahuje výrazně více informací, byť asi zrecyklovaných.

    U některých čajů a nápojů (např. pro maté yerba, pro rize) jsem také brouzdal po youtube, abych se podíval na různé typy přípravy.

    OdpovědětVymazat
    Odpovědi
    1. Děkuju, Pavle, za velmi cenné informace.

      Republic of Tea znám a je pro nás jednou z inspirací. O knížce jsem ale neměl ani tušení. Hned jsem ji koupil, díky za tip.

      Snad ti bude chutnat i náš čaj :-)

      Vymazat
  6. Přestože mnoho mých přátel čaji žije, vzpomínám si pouze na 1 své hledání - po tom, co jsem ochutnal u své kamarádky výborný Darjeeling fair trade. Šlo o větší balení, které prodává 1 německá firma. Ta se specializuje pouze na Darjeeling a má vlastní farmy v Asii, jestli jsem dobře pochopil. Tenkrát jsem hledal nějaký český e-shop, který by ten čaj prodával. Cena mně zajímala, ale nebyla rozhodující.

    Jinak, děkuji za další zajímavý způsob analýzy klíčových slov. Nevěděl jsem o statistikách wikipedie.

    Ať se daří a pokud byste se pustili do zajímavého affiliate, určitě zvážím účast.

    OdpovědětVymazat
    Odpovědi
    1. Děkuju, Nishkame, taky hezký příběh.

      Affiliate zatím neplánujeme, ale člověk nikdy neví.

      Vymazat
  7. Hezký den, Marku, díky za super eshopový seriál :-)
    Chtěl bych se zeptat, proč jsou pro Vás údaje o hledanosti z Wikipedie při tvorbě webu tak důležité? Není lepší použít nástroj pro tvorbu klíčových slov Skliku, popř. nějaké testovací kampaně? Přeju mnoho zdaru!

    OdpovědětVymazat
    Odpovědi
    1. Oba způsoby se doplňují. Nástroje vyhledavačů ukazují, co lidé hledají, ale už neříkají proč. Wikipedie ukazuje, jaké informace lidi zajímají, ale už neříká, jak je se k nim dostávají.

      Vymazat
  8. Děkuji za inspiraci, zatím paráda. Zkoušel jsem si vytvořit tabulku, podle tvého návodu, ale musím někde dělat chybu, hlásí mi to Prázdný argument. Máš to taky v tomhle tvaru: =replace(A2;1;29;"http://stats.grok.se/cs/latest90")=ImportXML(C2;"/html/body/p[1]")=value(regexextract(F2;"\d+"))?
    Nejsem zrovna programátor, ale baví mě to a líbí se mi, když něco funguje, díky :-)

    OdpovědětVymazat
    Odpovědi
    1. Vzorce mám přesně tak, jak jsem je zkopíroval do článku. Ale tabulku mám nastavenou na češtinu. Kdyby byla nastavená angličtina, místo středníků by musely být čárky.

      Vymazat
  9. Jedno vím jistě, pijáci čajů mají rádi příběhy, kterými je ten či onen čaj opředen. Pak jsou schopni pít kdejakou žbrundu a při pití ten příběh vyprávět. Příběh = dobrý marketingový tahák.

    OdpovědětVymazat
    Odpovědi
    1. To platí v mnoha oborech, Pavle, ale souhlasím, že k čaji se příběhy obzvlášť hodí.

      Vymazat
  10. > A co vy? Máte rádi čaj a hledáte si o něm různé informace? Napíšete mi jaké, kde a jak často?

    Momentálně věnuji na čaj odhadem 500 Kč měsíčně, dříve násobně více. Informace si o něm nehledám, protože necítím po nich potřebu. To intenzivní období zájmu o teorii je asi za mnou a pokud bych chtěl něco vědět, informacím na webu bych příliš nedůvěřoval, protože na ně dle mé zkušenosti není spoleh. To, co se často na webu, ale i v tištěných publikacích od renomovaných autorů píše má podle mě blíže k pověstem, než k realitě. Na druhou stranu, citovatelná realita prezentovaná Wikipedií také není tím, co bych si v případě zájmu rád četl. Jediná informace, které důvěřuji je ta, kterou mi předá (klidně i on-line, klidně i zprostředkovaně) jeden z těch dvou lidí, které v této věci považuji za informované nebo důvěryhodné, a s kterými mám osobní zkušenost.

    OdpovědětVymazat
  11. Čaje prodáváme okrajově. Bereme čaj z http://www.mixtee.cz/ . Mají velký sortiment. Jako tip uvádím, že si tento druh sortimentu říká o filtraci: druh čaje (černý, zelený, ovocný), balení (sáček, papírová krabička,plechová dóza) , sypané/porcované, značka apod. Zákazníkům to ušetří čas protože každý má určité preference.

    OdpovědětVymazat
    Odpovědi
    1. Jiří, o tom, jaký čaj budeme prodávat (a proč), ještě někdy napíšu.

      Vymazat
  12. Marku, děkuji za zajímavý seriál. Čaj piji velmi rád, ale vůbec se v něm nevyznám (a ani po tom moc netoužím). Kupuji si je nejčastěji v čajovně na doporučení personálu, který mi čaj srozumitelně popíše a případně jej přirovná k jinému čaji, který už znám. Abych si tedy nakoupil čaj přes internet, tak bych potřeboval právě pomoc s výběrem (hodně dobrý popisek, případně chat). Uvítal bych také, kdybych dostal vzorky čajů k nákupu, případně si vzorky mohl zakoupit.
    Přeji ať se daří:).

    OdpovědětVymazat

Díky za váš čas věnovaný článku a za váš komentář. Všechny věcné připomínky, doplnění či otázky k článku mi pomohou posunout náš obchod dál. Nechcete-li komentovat veřejně, napište mi prosím na marek@sovavsiti.cz.