Mestské parky optikou
Instagramu
Aj vďaka sociálnej sieti, akou je Instagram, dnes už vieme efektívne a pomerne presne identifikovať a vyhodnocovať, aké sú potreby túžby obyvateľov Bratislavy. Pozrite sa s nami bližšie na to, ako príspevky na Instagrame prezentujú najdôležitejšie miesta Bratislavy a ilustrujú rozmanitosť aktivít vo verejných priestoroch.
Vyberte si park alebo sa posuňte nadol a prečítajte si viac o spôsobe analýz
Sad Janka Kráľa
Najväčší centrálny mestský park v Bratislave umožňuje návštevníkom vychutnať si prírodu bez toho, aby vám unikla živosť mesta »
Horský Park
Pomerne veľký park v blízkosti starého mesta Bratislavy vhodný na vonkajšie cvičenie »
Medická Záhrada
Kompaktný park, ktorý si návštevníci cenia pre svoju centrálnu polohu a zelený pokoj uprostred akcie mesta »
Mestské Lesy
Mestský les v Malých Karpatoch povzbudzuje obyvateľov a turistov k objavovaniu „skutočnej“ prírody »
Jazero Rohlík
Malé útulné jazero uprostred obytnej štvrte a nemocničného komplexu v mestskej časti Ružinov »
Ako získavame a vyhodnocujeme tisíce príspevkov na Instagrame?
Príspevky na Instagrame môžu prezentovať najdôležitejšie miesta Bratislavy, odhaľovať túžby obyvateľov a ilustrovať množstvo ich aktivít vo verejných priestoroch. Aj keď netreba od Instagramu očakávať, že poskytne presný obraz reality, môže byť cenným zdrojom údajov na prieskum mesta. Pozrite sa, ako sme preskúmali bratislavské parky pomocou Pythonu a služby Instagram API1.
The most instagrammable posts published from Bratislava parks in 20202.
Prechádzanie informačnými kanálmi a skúmanie hashtagov môže byť pre mestských výskumníkov zábavou. Ako to však urýchliť automatizáciou extrakcie tisícok príspevkov na ďalšie získavanie a vyhodnocovanie dát? Na tento účel sme vyvinuli balík Python3, ktorý uľahčuje proces. Na čo nám slúži?
- získavanie príspevkov z Instagram API
- predbežné spracovanie a triedenie
- analýza a vizualizácia
Možno sa pýtate, ako vyzerá príspevok získaný z Instagramu. Aké informácie obsahuje? 4 Aké využitie by mohol mať pre mestský výskum?
Python nám umožnil analyzovať desiatky tisíc nespracovaných príspevkov na Instagrame do databázy a stiahnuť príslušné obrázky.
V snahe zabezpečiť, aby náš nástroj vyhovoval účelu, sme na Instagrame vybrali päť verejných parkov v Bratislave s rôznymi úrovňami obľúbenosti a charakteristickými znakmi. Keď sme stiahli všetky dostupné príspevky5, podarilo sa nám objaviť ich podrobný obsah a témy. Túto výzvu sme riešili niekoľkými spôsobmi, v ktorých zohrali kľúčovú úlohu hashtagy (krížiky na označovanie obsahu).
Začnite objavovať parky kliknutím na odkazy alebo pokračujte v čítaní o tom, ako sme údaje spracovali.
Objavovanie tém a základný prieskum
1. Populárne hashtagy
Hľadanie najpopulárnejších hashtagov je známy prístup, ktorý môže priniesť zaujímavé výsledky, najmä ak sú hashtagy zoskupené do časových intervalov. Takto sme sledovali, ako sa frekvencia vybraných tém v priebehu rokov vyvíjala alebo menila v priebehu týždňa.
2. Preddefinované kategórie
Ďalším krokom bolo priradenie hashtagov k našim deviatim samostatne určeným kategóriám. Ak bol napríklad príspevok uverejnený aspoň s jedným zo štítkov ako #beh, #bicykel, #turistika, zaradili sme ho do širšej kategórie „outdoorové aktivity“.
animals
built elements
food & events
friends & family
happiness & love
nature
outdoor activity
photography
self-promotion
3. Modelovanie tematiky
Namiesto zoraďovania kategórií zhora nadol sme zvolili úplne odlišný prístup, pri ktorom sme analýzu hashtagov prenechali algoritmom, ktoré identifikovali najrelevantnejšie tematické skupiny.
Ako to v praxi funguje? Stručne povedané, algoritmus hľadá asociácie medzi všetkými hashtagmi odvodenými z príspevkov. Potom identifikuje témy a označuje pre ne najreprezentatívnejšie hashtagy (z ktorých je len 10 zobrazených v poslednom stĺpci). Podiel 24,9 % v druhom stĺpci znamená, že téma „jarné kvety magnólie“ pokrýva štvrtinu všetkých zozbieraných hashtagov.
Táto metóda6 sa ukázala ako nesmierne užitočná vo fáze získavania údajov a pomáha nám odhaliť vzťahy medzi viacerými hashtagmi. Ak si želáte zobraziť podrobnosti, pozrite si grafy údajov.
4. Rozpoznávanie obrazových vzorov
Spôsob kategorizácie, ktorý sme využili ako posledný, bol zásadne odlišný. Kým predtým sme sa spoliehali na hashtagy používateľov, tu sme skúmali samotné fotografie. Algoritmy Google Vision API automaticky rozpoznávajú obsah obrázkov a označujú ich (vrátane úrovne pravdepodobnosti7), ktoré sme potom zoskupili a zoradili podľa frekvencie výskytu.
V tomto bode procesu sme boli pripravení začať prieskum. Pozrite si výsledky našich prieskumov.
Sezóny parkov
Na jeseň zažíva každý mestský park nárast návštevnosti. Kto by si nechcel „zarobiť“ kopec lajkov za trendovú fotku farebných gaštanových alebo javorových listov? Tento predpoklad potvrdzujú aj najbežnejšie hashtagy, ktoré majú obzvlášť vysoké hodnotenie #fall alebo #jeseň. Zaujímavé však bolo zistenie, že jeden z parkov je obľúbený najmä na jar vďaka rozkvitnutým kvetom. Ukázalo sa tiež, že jeden špecifický park bol zas najnavštevovanejší počas zimnej sezóny.8
Zatiaľ čo analýza len jedného miesta nás upriamuje na tie najfrekventovanejšie, najtypickejšie parametre (hashtagy či fotoštítky), porovnanie parkov odhaľuje významné črty v širšom kontexte a ukazuje nuansy v ich významoch.
Implicitné väzby medzi aktivitami
Predmet príspevku je ďalším prvkom, ktorý môžeme využiť pri porovnávaní kategórií. Sledovanie popularity určitej témy má samo o sebe výhody, pretože nám umožnilo identifikovať, že jedno miesto je preplnené milovníkmi zvierat, zatiaľ čo iné sa viac raduje z popularity instagramových influencerov. Hlbšie skúmanie a pohľad na súbežné kategórie nám však poskytli širší prehľad o aktivitách návštevníkov. Mali sme napríklad možnosť vypozorovať, že zatiaľ čo v jednom parku sa šťastie spája s rodinou, v inom sa pripisuje domácim miláčikom a outdoorovým aktivitám.
Posun vzorcov používateľov
Ďalším cenným prístupom bolo skúmať, ako sa trendy menili v priebehu určitého obdobia, najmä počas turbulentného obdobia kovidu. Osobitnú úlohu tu zohrala vizualizácia prieskumných údajov, ktorá nám pomohla odhaliť trendy v počte príspevkov alebo frekvencii určitých hashtagov. Týmto spôsobom sme zistili, ktoré parky strácajú alebo získavajú priazeň návštevníkov, ako aj to, ako opatrenia v roku 2020 posunuli niekdajšie čísla návštevnosti.
Zatiaľ čo vyššie uvedený graf ukazuje širší uhol pohľadu umocnený pandémiou, bližšie preskúmanie údajov len z jedného parku odhaľuje pravdepodobne dočasnú zmenu v správaní používateľov v priebehu jedného roka.
Niektoré z našich postrehov boli špecifické pre vybrané parky alebo jednotlivé udalosti, mnohé odhalili širšie trendy v tom, ako sa v súčasnosti využívajú verejné priestory. Bude zaujímavé sledovať, či ich pandémia Covid natrvalo zmení, a ako často a akým spôsobom budeme využívať mestské parky. Zatiaľ si pozrite naše podrobné reportáže venované piatim obľúbeným parkom v Bratislave.
Výsledok prieskumu
Prečo je Instagram cenným zdrojom údajov?
1. Sociálne siete sú obľúbeným nástrojom pre obyvateľov mesta. Využívajú ich, aby vyjadrili svoj postoj k mestu vo forme obrázkov, videí a iných príspevkov.
2. Na rozdiel od všeobecného presvedčenia, veľká a rôznorodá časť verejnosti v súčasnosti aktívne využíva Instagram; zaiste to už nie sú „len mladí ľudia“.
3. Používatelia nevedome poskytujú údaje o svojich vzorcoch správania a pocitoch, čo pri správnej interpretácii robí údaje relevantnejšími v porovnaní s priamym kladením otázok ľuďom o ich myšlienkach či pocitoch.
4. Hoci je ľahké spochybniť kvalitu údajov Instagramu, príspevkov sa dá pomerne ľahko získať, vďaka čomu je platforma dobrým zdrojom na doplnenie ďalších štúdií.
V ktorých oblastiach výskumu mesta sú údaje z Instagramu najužitočnejšie?
1. Sledovanie obľúbenosti miest v určitom časovom rozmedzí.
2. Pozorovanie zmien vnímaného a skutočného charakteru miesta v určitom časovom rozmedzí (napr. pomocou hashtagov).
3. Sledovanie pohybu osôb v rámci pozorovaného priestoru preverovaním miesta, odkiaľ návštevníci publikovali príspevky.
4. Identifikácia toho, ako konkrétne podujatia, ako sú festivaly, projekty revitalizácie verejného priestoru alebo akékoľvek iné, vytvárajú zmeny v okolí a ovplyvňujú pocity návštevníkov parkov.
5. Kľúčové je tiež určiť, do akej miery sú jednotlivé miesta zastúpené na Instagrame a identifikovať ich online profil. To umožňuje porovnanie medzi fyzickým priestorom a jeho imidžom na Instagrame.
Čo robí prieskum založený na Instagrame presnejším?
1. Porovnanie viacerých prvkov namiesto zamerania sa na jeden prvok by mohlo čiastočne kompenzovať problém nereprezentatívnych vzoriek údajov zo sociálnych médií.
2. Časová perspektíva pomáha zachytiť občasné skoky v popularite spôsobené jednorazovými udalosťami, ktoré by mohli skresliť výsledky širšej analýzy trendov.
3. Výber relatívne úzkej témy môže obmedziť potrebu zaoberať sa irelevantným obsahom a bežným spamom, ale príliš špecifický môže viesť k nedostatku príspevkov a nevýznamných vzoriek údajov. Napríklad štúdia bratislavského cestovného ruchu by bola určite zaujímavá, ale aj časovo náročná. Môže však byť náročné použiť údaje Instagramu na štúdium iba jednej malej ulice alebo jedinej mestskej atrakcie.
-
PI (rozhranie pre programovanie aplikácií) je nástroj, ktorý umožňuje iným počítačom pristupovať k príspevkom na Instagrame a automaticky ich vo veľkom sťahovať. ↩︎
-
Na základe nasledujúceho výberu hashtagov: #esthetic, #Autumnvibes, #coffee, #enjoythelittlethings, #fashiongram, #fashioninspo, #foodporn, #happiness, #instagood, #ootd, #photography, #photooftheday, #photoshoot, #picoftheday, #portraitphotography, #smile, #sonyimages, #vsco, #vscocam. ↩︎
-
Zdrojový kód bude k dispozícii v júli 2021.. ↩︎
-
Na rozdiel od minulosti, Instagram už neposkytuje podrobné umiestnenie príspevku (ani ho nie je možné identifikovať na základe údajov EXIF obrázku) – čo je hlavné obmedzenie pre mestských výskumníkov. ↩︎
-
We accessed the posts (excluding stories and videos) via two Instagram API endpoints – using specific hashtags (e.g. #sadjankakrala) and the parks’ location. ↩︎
-
By testing multiple diverse samples, we defined a confidence level at above 0.81. ↩︎
-
The data presented in this article is valid as of April 1, 2021. ↩︎
Táto experimentálna výskumná iniciatíva skúmajúca bratislavské parky prostredníctvom údajov z Instagramu vznikla vďaka spolupráci ľudí z medzinárodného projektového tímu v zložení:
- Karol Piekarski (Výskumný pracovník a dátový analytik v Medialab Katowice)
- Hannah Kleine (Stážistka na Sekcii mestských štúdií a participatívneho plánovania, MIB)
- Waldek Węgrzyn (Dizajnér a lektor, Medialab Katowice / Akadémia výtvarných umení v Katoviciach)
- Nina Fabšíková (Dátová analytička na Oddelení dátovej politiky a analýz Magistrátu hlavného mesta SR Bratislavy)
- Rebeka Petrtylová (Špecialistka na priestorové plánovanie na Sekcii mestských štúdií a participatívneho plánovania, MIB)