Mestské parky optikou 
Instagramu

Aj vďaka sociálnej sieti, akou je Instagram, dnes už vieme efektívne a pomerne presne identifikovať a vyhodnocovať, aké sú potreby túžby obyvateľov Bratislavy. Pozrite sa s nami bližšie na to, ako príspevky na Instagrame prezentujú najdôležitejšie miesta Bratislavy a ilustrujú rozmanitosť aktivít vo verejných priestoroch.

 

Scroll down hand

Vyberte si park alebo sa posuňte nadol a prečítajte si viac o spôsobe analýz

Photo of Sad Janka Kráľa

Sad Janka Kráľa

Najväčší centrálny mestský park v Bratislave umožňuje návštevníkom vychutnať si prírodu bez toho, aby vám unikla živosť mesta »

Photo of Horský Park

Horský Park

Pomerne veľký park v blízkosti starého mesta Bratislavy vhodný na vonkajšie cvičenie »

Photo of Medická Záhrada

Medická Záhrada

Kompaktný park, ktorý si návštevníci cenia pre svoju centrálnu polohu a zelený pokoj uprostred akcie mesta »

Photo of Mestské Lesy

Mestské Lesy

Mestský les v Malých Karpatoch povzbudzuje obyvateľov a turistov k objavovaniu „skutočnej“ prírody »

Photo of Jazero Rohlík

Jazero Rohlík

Malé útulné jazero uprostred obytnej štvrte a nemocničného komplexu v mestskej časti Ružinov »

Ako získavame a vyhodnocujeme tisíce príspevkov na Instagrame? 

Príspevky na Instagrame môžu prezentovať najdôležitejšie miesta Bratislavy, odhaľovať túžby obyvateľov a ilustrovať množstvo ich aktivít vo verejných priestoroch. Aj keď netreba od Instagramu očakávať, že poskytne presný obraz reality, môže byť cenným zdrojom údajov na prieskum mesta. Pozrite sa, ako sme preskúmali bratislavské parky pomocou Pythonu a služby Instagram API1.

The most instagrammable posts published from Bratislava parks in 20202.

Prechádzanie informačnými kanálmi a skúmanie hashtagov môže byť pre mestských výskumníkov zábavou. Ako to však urýchliť automatizáciou extrakcie tisícok príspevkov na ďalšie získavanie a vyhodnocovanie dát? Na tento účel sme vyvinuli balík Python3, ktorý uľahčuje proces. Na čo nám slúži? 

  1. získavanie príspevkov z Instagram API
  2. predbežné spracovanie a triedenie
  3. analýza a vizualizácia

Možno sa pýtate, ako vyzerá príspevok získaný z Instagramu. Aké informácie obsahuje? 4 Aké využitie by mohol mať pre mestský výskum?

Python nám umožnil analyzovať desiatky tisíc nespracovaných príspevkov na Instagrame do databázy a stiahnuť príslušné obrázky. 

V snahe zabezpečiť, aby náš nástroj vyhovoval účelu, sme na Instagrame vybrali päť verejných parkov v Bratislave s rôznymi úrovňami obľúbenosti a charakteristickými znakmi. Keď sme stiahli všetky dostupné príspevky5, podarilo sa nám objaviť ich podrobný obsah a témy. Túto výzvu sme riešili niekoľkými spôsobmi, v ktorých zohrali kľúčovú úlohu hashtagy (krížiky na označovanie obsahu). 

Začnite objavovať parky kliknutím na odkazy alebo pokračujte v čítaní o tom, ako sme údaje spracovali.

  1. Sad Janka Kráľa
  2. Horský Park
  3. Medická Záhrada
  4. Mestské Lesy
  5. Jazero Rohlík

Objavovanie tém a základný prieskum 

Hľadanie najpopulárnejších hashtagov je známy prístup, ktorý môže priniesť zaujímavé výsledky, najmä ak sú hashtagy zoskupené do časových intervalov. Takto sme sledovali, ako sa frekvencia vybraných tém v priebehu rokov vyvíjala alebo menila v priebehu týždňa. 

2. Preddefinované kategórie

Ďalším krokom bolo priradenie hashtagov k našim deviatim samostatne určeným kategóriám. Ak bol napríklad príspevok uverejnený aspoň s jedným zo štítkov ako #beh, #bicykel, #turistika, zaradili sme ho do širšej kategórie „outdoorové aktivity“. 

animals

built elements

food & events

friends & family

happiness & love

nature

outdoor activity

photography

self-promotion

Sad Janka KráľaSad

2.8%

2.85%
animals
297 of 10424 posts

9.6%

9.58%
built elements
999 of 10424 posts

8.1%

8.09%
food & events
843 of 10424 posts

10.5%

10.5%
friends & family
1093 of 10424 posts

18.5%

18.5%
happiness & love
1926 of 10424 posts

32.4%

32.4%
nature
3382 of 10424 posts

18.2%

18.2%
outdoor activity
1901 of 10424 posts

14.5%

14.5%
photography
1511 of 10424 posts

17.1%

17.1%
self-promotion
1781 of 10424 posts
Horský ParkHorský

7.2%

7.23%
animals
321 of 4442 posts

6.6%

6.55%
built elements
291 of 4442 posts

5.8%

5.81%
food & events
258 of 4442 posts

6.4%

6.39%
friends & family
284 of 4442 posts

12.5%

12.5%
happiness & love
554 of 4442 posts

26.0%

26.0%
nature
1157 of 4442 posts

21.2%

21.2%
outdoor activity
943 of 4442 posts

7.1%

7.11%
photography
316 of 4442 posts

9.2%

9.19%
self-promotion
408 of 4442 posts
Medická ZáhradaMedická

0.4%

0.414%
animals
8 of 1934 posts

4.5%

4.50%
built elements
87 of 1934 posts

16.2%

16.2%
food & events
313 of 1934 posts

10.0%

10.0%
friends & family
194 of 1934 posts

20.4%

20.4%
happiness & love
395 of 1934 posts

47.5%

47.5%
nature
919 of 1934 posts

15.1%

15.1%
outdoor activity
292 of 1934 posts

17.6%

17.6%
photography
340 of 1934 posts

22.1%

22.1%
self-promotion
427 of 1934 posts
Mestské LesyLesy

3.8%

3.82%
animals
18 of 471 posts

2.3%

2.34%
built elements
11 of 471 posts

1.3%

1.27%
food & events
6 of 471 posts

6.2%

6.16%
friends & family
29 of 471 posts

7.4%

7.43%
happiness & love
35 of 471 posts

52.0%

52.0%
nature
245 of 471 posts

27.6%

27.6%
outdoor activity
130 of 471 posts

13.6%

13.6%
photography
64 of 471 posts

12.3%

12.3%
self-promotion
58 of 471 posts
Jazero RohlíkRohlík

20.8%

20.8%
animals
27 of 130 posts

3.1%

3.08%
built elements
4 of 130 posts

2.3%

2.31%
food & events
3 of 130 posts

4.6%

4.62%
friends & family
6 of 130 posts

11.5%

11.5%
happiness & love
15 of 130 posts

46.9%

46.9%
nature
61 of 130 posts

13.8%

13.8%
outdoor activity
18 of 130 posts

8.5%

8.46%
photography
11 of 130 posts

5.4%

5.38%
self-promotion
7 of 130 posts

3. Modelovanie tematiky 

Namiesto zoraďovania kategórií zhora nadol sme zvolili úplne odlišný prístup, pri ktorom sme analýzu hashtagov prenechali algoritmom, ktoré identifikovali najrelevantnejšie tematické skupiny. 

Ako to v praxi funguje? Stručne povedané, algoritmus hľadá asociácie medzi všetkými hashtagmi odvodenými z príspevkov. Potom identifikuje témy a označuje pre ne najreprezentatívnejšie hashtagy (z ktorých je len 10 zobrazených v poslednom stĺpci). Podiel 24,9 % v druhom stĺpci znamená, že téma „jarné kvety magnólie“ pokrýva štvrtinu všetkých zozbieraných hashtagov. 

Táto metóda6 sa ukázala ako nesmierne užitočná vo fáze získavania údajov a pomáha nám odhaliť vzťahy medzi viacerými hashtagmi. Ak si želáte zobraziť podrobnosti, pozrite si grafy údajov. 

4. Rozpoznávanie obrazových vzorov 

Spôsob kategorizácie, ktorý sme využili ako posledný, bol zásadne odlišný. Kým predtým sme sa spoliehali na hashtagy používateľov, tu sme skúmali samotné fotografie. Algoritmy Google Vision API automaticky rozpoznávajú obsah obrázkov a označujú ich (vrátane úrovne pravdepodobnosti7), ktoré sme potom zoskupili a zoradili podľa frekvencie výskytu. 

Jazero Rohlík, photo by sysina93

V tomto bode procesu sme boli pripravení začať prieskum. Pozrite si výsledky našich prieskumov. 

Sezóny parkov 

Na jeseň zažíva každý mestský park nárast návštevnosti. Kto by si nechcel „zarobiť“ kopec lajkov za trendovú fotku farebných gaštanových alebo javorových listov? Tento predpoklad potvrdzujú aj najbežnejšie hashtagy, ktoré majú obzvlášť vysoké hodnotenie #fall alebo #jeseň. Zaujímavé však bolo zistenie, že jeden z parkov je obľúbený najmä na jar vďaka rozkvitnutým kvetom. Ukázalo sa tiež, že jeden špecifický park bol zas najnavštevovanejší počas zimnej sezóny.8 

2.8% 10.9% 3.1% 1.9% #spring #autumn #summer #winter Sad JankaKráľa Jazero Rohlík 2.3% 4.6% 5.4% 0% #spring #autumn #summer #winter 2.5% 6.2% 1.5% 2.7% #spring #autumn #summer #winter Horský park 13.4% 6% 4.8% 1.1% #spring #autumn #summer #winter Medickázáhrada 3.4% 10.2% 0.4% 7% #spring #autumn #summer #winter Mestskélesy

Zatiaľ čo analýza len jedného miesta nás upriamuje na tie najfrekventovanejšie, najtypickejšie parametre (hashtagy či fotoštítky), porovnanie parkov odhaľuje významné črty v širšom kontexte a ukazuje nuansy v ich významoch. 

Implicitné väzby medzi aktivitami

Predmet príspevku je ďalším prvkom, ktorý môžeme využiť pri porovnávaní kategórií. Sledovanie popularity určitej témy má samo o sebe výhody, pretože nám umožnilo identifikovať, že jedno miesto je preplnené milovníkmi zvierat, zatiaľ čo iné sa viac raduje z popularity instagramových influencerov. Hlbšie skúmanie a pohľad na súbežné kategórie nám však poskytli širší prehľad o aktivitách návštevníkov. Mali sme napríklad možnosť  vypozorovať, že zatiaľ čo v jednom parku sa šťastie spája s rodinou, v inom sa pripisuje domácim miláčikom a outdoorovým aktivitám. 

nature happy/love self- promo photo- graphy activity friend/family built elements food /events animals nature 128 511 202 446 1058 863 879 1077 happy/love self- promo photo- graphy activity friend/family built elements food /events animals happy/love 105 185 203 533 1058 595 516 700 nature self- promo photo- graphy activity friend/family built elements food /events animals self- promo 58 232 138 260 700 1077 476 788 nature happy/love photo- graphy activity friend/family built elements food /events animals photo- graphy 49 206 89 261 516 879 326 788 nature happy/love self- promo activity friend/family built elements food /events animals activity 73 261 258 248 595 863 326 476 nature happy/love self- promo photo- graphy friend/family built elements food /events animals friend/family 51 63 83 533 446 248 261 260 nature happy/love self- promo photo- graphy activity built elements food /events animals built elements 18 98 63 185 511 261 206 232 nature happy/love self- promo photo- graphy activity friend/family food /events animals food /events 18 98 83 203 202 258 89 138 nature happy/love self- promo photo- graphy activity friend/family built elements animals animals 18 18 51 105 128 73 49 58 nature happy/love self- promo photo- graphy activity friend/family built elements food /events

Posun vzorcov používateľov 

Ďalším cenným prístupom bolo skúmať, ako sa trendy menili v priebehu určitého obdobia, najmä počas turbulentného obdobia kovidu. Osobitnú úlohu tu zohrala vizualizácia prieskumných údajov, ktorá nám pomohla odhaliť trendy v počte príspevkov alebo frekvencii určitých hashtagov. Týmto spôsobom sme zistili, ktoré parky strácajú alebo získavajú priazeň návštevníkov, ako aj to, ako opatrenia v roku 2020 posunuli niekdajšie čísla návštevnosti. 

Zatiaľ čo vyššie uvedený graf ukazuje širší uhol pohľadu umocnený pandémiou, bližšie preskúmanie údajov len z jedného parku odhaľuje pravdepodobne dočasnú zmenu v správaní používateľov v priebehu jedného roka. 

Niektoré z našich postrehov boli špecifické pre vybrané parky alebo jednotlivé udalosti, mnohé odhalili širšie trendy v tom, ako sa v súčasnosti využívajú verejné priestory. Bude zaujímavé sledovať, či ich pandémia Covid natrvalo zmení, a ako často a akým spôsobom budeme využívať mestské parky. Zatiaľ si pozrite naše podrobné reportáže venované piatim obľúbeným parkom v Bratislave. 

Výsledok prieskumu 

Prečo je Instagram cenným zdrojom údajov? 

1. Sociálne siete sú obľúbeným nástrojom pre obyvateľov mesta. Využívajú ich, aby vyjadrili svoj postoj k mestu vo forme obrázkov, videí a iných príspevkov. 

2. Na rozdiel od všeobecného presvedčenia, veľká a rôznorodá časť verejnosti v súčasnosti aktívne využíva Instagram; zaiste to už nie sú „len mladí ľudia“. 

3. Používatelia nevedome poskytujú údaje o svojich vzorcoch správania a pocitoch, čo pri správnej interpretácii robí údaje relevantnejšími v porovnaní s priamym kladením otázok ľuďom o ich myšlienkach či pocitoch. 

4. Hoci je ľahké spochybniť kvalitu údajov Instagramu, príspevkov sa dá pomerne ľahko získať, vďaka čomu je platforma dobrým zdrojom na doplnenie ďalších štúdií. 

V ktorých oblastiach výskumu mesta sú údaje z Instagramu najužitočnejšie?

1. Sledovanie obľúbenosti miest v určitom časovom rozmedzí. 

2. Pozorovanie zmien vnímaného a skutočného charakteru miesta v určitom časovom rozmedzí (napr. pomocou hashtagov). 

3. Sledovanie pohybu osôb v rámci pozorovaného priestoru preverovaním miesta, odkiaľ návštevníci publikovali príspevky. 

4. Identifikácia toho, ako konkrétne podujatia, ako sú festivaly, projekty revitalizácie verejného priestoru alebo akékoľvek iné, vytvárajú zmeny v okolí a ovplyvňujú pocity návštevníkov parkov. 

5. Kľúčové je tiež určiť, do akej miery sú jednotlivé miesta zastúpené na Instagrame a identifikovať ich online profil. To umožňuje porovnanie medzi fyzickým priestorom a jeho imidžom na Instagrame. 

Čo robí prieskum založený na Instagrame presnejším? 

1. Porovnanie viacerých prvkov namiesto zamerania sa na jeden prvok by mohlo čiastočne kompenzovať problém nereprezentatívnych vzoriek údajov zo sociálnych médií. 

2. Časová perspektíva pomáha zachytiť občasné skoky v popularite spôsobené jednorazovými udalosťami, ktoré by mohli skresliť výsledky širšej analýzy trendov. 

3. Výber relatívne úzkej témy môže obmedziť potrebu zaoberať sa irelevantným obsahom a bežným spamom, ale príliš špecifický môže viesť k nedostatku príspevkov a nevýznamných vzoriek údajov. Napríklad štúdia bratislavského cestovného ruchu by bola určite zaujímavá, ale aj časovo náročná. Môže však byť náročné použiť údaje Instagramu na štúdium iba jednej malej ulice alebo jedinej mestskej atrakcie. 


  1. PI (rozhranie pre programovanie aplikácií) je nástroj, ktorý umožňuje iným počítačom pristupovať k príspevkom na Instagrame a automaticky ich vo veľkom sťahovať.  ↩︎

  2. Na základe nasledujúceho výberu hashtagov: #esthetic, #Autumnvibes, #coffee, #enjoythelittlethings, #fashiongram, #fashioninspo, #foodporn, #happiness, #instagood, #ootd, #photography, #photooftheday, #photoshoot, #picoftheday, #portraitphotography, #smile, #sonyimages, #vsco, #vscocam. ↩︎

  3. Zdrojový kód bude k dispozícii v júli 2021.. ↩︎

  4. Na rozdiel od minulosti, Instagram už neposkytuje podrobné umiestnenie príspevku (ani ho nie je možné identifikovať na základe údajov EXIF ​​obrázku) – čo je hlavné obmedzenie pre mestských výskumníkov. ↩︎

  5. We accessed the posts (excluding stories and videos) via two Instagram API endpoints – using specific hashtags (e.g. #sadjankakrala) and the parks’ location. ↩︎

  6. Read more about LDA model↩︎

  7. By testing multiple diverse samples, we defined a confidence level at above 0.81. ↩︎

  8. The data presented in this article is valid as of April 1, 2021. ↩︎

Táto experimentálna výskumná iniciatíva skúmajúca bratislavské parky prostredníctvom údajov z Instagramu vznikla vďaka spolupráci ľudí z medzinárodného projektového tímu v zložení:

  • Karol Piekarski (Výskumný pracovník a dátový analytik v Medialab Katowice)
  • Hannah Kleine (Stážistka na Sekcii mestských štúdií a participatívneho plánovania, MIB)
  • Waldek Węgrzyn (Dizajnér a lektor, Medialab Katowice / Akadémia výtvarných umení v Katoviciach)
  • Nina Fabšíková (Dátová analytička na Oddelení dátovej politiky a analýz Magistrátu hlavného mesta SR Bratislavy)
  • Rebeka Petrtylová (Špecialistka na priestorové plánovanie na Sekcii mestských štúdií a participatívneho plánovania, MIB)

Prečítať viac