Co dělají včely, když se nikdo nedívá
závěrečný projekt Digitální akademie Czechitas, Brno, 2019
Kristýna Špačková (Vojtíšková), Jana Mášová
mentor Jan Dupal
1. Účel projektu
Doktorandi z Mendelovy univerzity si položili otázku, zda jde zjistit, co se děje ve včelím úlu na dálku, aniž by k němu bylo potřeba jet, otevřít každý úl a podívat se dovnitř. Dění v úle by mělo být možné sledovat v reálném čase z domu, ze svého počítače. Aby otestovali, jak by to šlo provést, zvolili si 18 experimentálních úlů a nainstalovali do nich:
- mikrofon,
- váhu pro měření hmotnosti celého úlu,
- vlhkoměr,
- teploměry pro měření vnitřní a venkovní teploty.
To jsou data, která jsme díky Honzovi Dupalovi získaly pro projekt a nad kterými jsme si položily otázky: Co lze z dat vyčíst? Jakým způsobem mohou být získaná data užitečná včelaři, který se o úly stará?
2. Data
Úly se všechny s výjimkou jednoho nacházejí v Brně-Černých Polích, ten zbývající v Bílovicích nad Svitavou. Zmíněné měřící přístroje jsou napojeny na internet. Jejich výstupem jsou živá data ukládaná do cloudu.
Zvuk se ukládá ve formátu mp3 a v reálném čase se pomocí algoritmu rozepisuje do šesti proměnných. Ty jsou odvozené od frekvence zvuku a vlnového spektra a dohromady charakterizují každou zvukovou nahrávku. V praxi tyto metriky vypovídají o aktivitě v úlu: v noci jsou hodnoty stabilnější než ve dne, stejně tak za chladného počasí jsou nižší než za tepla, kdy mají včely víc práce. Přítomnost nebo nepřítomnost matky v úle je ze zvuků teoreticky také rozpoznatelná. My jsme pro zkoumání zvuku vycházely zejména z proměnné Spectral Centroid, která představuje střední frekvenci zvuku včelstva. Čím vyšší hodnota Spectral Centroid, tím větší aktivita nebo stres v úlu. Tuto hodnotu jsme nejdřív musely ověřit, abychom si byly jisté, že jsme vybraly správnou veličinu a má pro náš výzkum vypovídací hodnotu. Na grafu níže je porovnání zvuků, na kterém je vidět, že zvukové hodnoty jsou si podobné kromě hodnoty Peak Frequency, jejímž úkolem je zaznamenávat vrcholy výšek tónů. Proto je Peak Frequency velmi citlivá na okolní zvuky jako zpěv ptáků, a tedy nevhodná pro náš výzkum, kdy tyto zvuky potřebujeme spíše odfiltrovat. Naopak nejvíce imunní vůči těmto zvukům se ukázal být Spectral Centroid, který díky podobnosti s veličinami Bandwith a Root Varience Frequency můžeme používat jako zástupnou veličinu a nemusíme tak pro každou zvukovou veličinu tvořit stejný graf.
Hmotnost, teplota a vlhkost se ukládají do databáze několikrát za hodinu.
Pro praktickou obsluhu úlu je důležité také napětí baterie, aby se kvůli vybité baterii nepřerušilo měření.
K naměřeným datům jsme přidaly ještě informace o počasí. Kromě teploty nás zajímal také vítr, srážky a další potenciálně zajímavé údaje. Toto by splňovala data z ČHMÚ, která však byla dostupná pouze do konce roku 2018. Většina námi zkoumaných úlů ale byla nasazena až během jara 2019. Musely jsme tedy najít jiný zdroj. Nakonec jsme se rozhodly pro web Ogimet.com, kde je možné získat data s granularitou po hodinách, nějakým způsobem získaná z měřicí stanice ČHMÚ v Brně-Tuřanech.
3. Práce s daty
Navzdory našemu původnímu cíli naučit se v Pythonu psát skripty, které nám z internetové HTML tabulky stáhnou data očištěná od HTML kódu, jsme nakonec web-scraping nevyužily. Vzhledem k tomu, že se Power BI umí napojit na data téměř z jakéhokoliv zdroje a následná práce s daty byla složitější, než jsme si prve myslely, rozhodly jsme se Power BI jako nejvhodnější nástroj používat od začátku do konce. Problémy tedy nebyly ani tak s technickými nástroji, jako spíš se spolehlivostí vstupních dat.
Brzy se ukázalo, že vyčištěná data z úlů a data o počasí nejde prostě přiložit k sobě a hledat korelace. Velmi dlouhou dobu nám zabralo pouhé porozumění tomu, o čem přesně jednotlivé proměnné vypovídají a zda jsou hodnoty, jichž nabývají, pravděpodobné, nebo může jít o chyby. Řešily jsme například tyto dvě záhady:
3.1 Řídí se včely podle počasí, nebo počasí podle včel?
Na krátkou dobu jsme si myslely, že jsme objevily schopnost včel předpovídat budoucnost, zde konkrétně teploty. Dalo by se to využít i v jiných oborech než v meteorologii? Šlo by zapojit včely do předpovědí vývoje cen komodit? Než jsme si stihly registrovat patent, objevily jsme, v čem byla chyba – každá z teplotních proměnných se průměrovala k jiné hodině dne.
3.2 Slaví včely Vánoce?
Kromě zvuku ptáků nebo deště jsme narazily i na překvapivější zvuky. Například Na Štědrý den nahrál mikrofon jednoho z úlů nezaměnitelnou melodii písně Štědrý večer nastal. Jindy si zase včely pouštěly rádio. To je sice roztomilé, ale protože smysluplnost našeho projektu závisí na kvalitě vstupních dat, moc nás to nepotěšilo. Abychom něco smysluplného zjistily, musely jsme tyto zvuky identifikovat a odstínit. Kromě zjišťování optimálního rozsahu zvukových nahrávek jsme velkou část těchto zvuků odstranily přidáním sloupce s filtrem, které ověřovaly, zda byla zvuková nahrávka pořízená až po nasazení mikrofonu do úlů. Část těchto zvuků, jako rádio nebo naopak naprosté ticho, pocházela totiž z testování mikrofonů mimo úly.
4. Rozdíly mezi vybranými úly
Ne všechny úly měřily stejné hodnoty, např. úl v Bílovicích nad Svitavou nazvaný Muf, který byl nasazený nejdříve, neměřil vlhkost. Některé úly z Černých Polí, např. Gregor 2 nebo Gregor 5, neměří hmotnost úlu. Když se k tomu připočítá nespolehlivost přístrojů a měření, není snadné jednotlivé úly srovnávat mezi sebou.
Tomu nepomáhají ani rozdílná data nasazení jednotlivých úlů. Např. Muf byl nasazený 22. 12. 2018, zatímco Gregor 2 a Gregor 5 byly nasazeny 14. 3. 2019 a úly Gregor 1 a Gregor 4 ještě později, a to 27. 3. 2019. Z toho důvodu jsme se rozhodly opustit náš púvodní plán hledat pro všechny úly společné tendence v chování včel v závislosti na počasí. Místo toho jsme se rozhodly použít úl Muf, který sleduje aktivitu včel nejdéle a nachází se na jiném místě než zbylé úly, právě pro zjišťování trendů v chování včel v závislosti na změně ročních období a počasí. Zbylé úly Mendelovy univerzity jsme se rozhodly využívat k porovnávání jednotlivých včelstev a jejich chování mezi sebou.
Všechny výše zobrazené grafy sledují aktivitu včel, která s postupným oteplováním roste. U úlech Gregor 5 a 4 je tento trend výraznější než u Gregora 1 a Gregora 2. Brzy se nám podařilo zjistit, že u Gregora 1 je z části na vině mikrofon, který je nastavený citlivěji než mikrofony zbývajících úlů, a proto je i k běžnému bzučení senzitivnější a jeho hodnoty se liší (viz graf níže srovnávající hodnoty pro správně měřícího Gregora 5 a nespravně měřícího Gregora 1). Nejdřív jsme si myslely, že to bude příčina opačného výsledku také u úlu Gregor 2, ale zde jsme žádné významné odchylky v zaznamenávání zvuku neobjevily. Až díky informacím od včelařů jsme zjistily, že tyto včely se svým temperamentem a chováním vymykají ostatním včelstvům, které sledujeme, a je tedy možné, že tomu mohou odpovídat i naměřené hodnoty.
5 Kdy jsou včely aktivní?
To, že jsou včely aktivnější přes léto než v zimě, asi mnoho lidí nepřekvapí. Nás však překvapilo, že včelstvo, alespoň podle našeho zkoumání, téměř nespí. Čekaly jsme, že se s večerem včely uloží ke spánku a budou sbírat energii na další den, ale překvapivě tomu tak nebylo. Nejprve jsme si myslely, že jde o chybu měření způsobenou cvrklikáním ptáků, kteří se nám v některých nahrávkách mezi druhou a čtvrtou ranní objevovali. Ale i poté, co jsme přidaly filtry, které by tyto hodnoty měly odfiltrovat, a naposlouchaly jsme dostatečné množství zvukových nahrávek ve snaze přijít na další rušení, nám grafy stále ukazovaly, že jsou včely aktivní i během noci. Pokles aktivity nastává kolem čtvrté až páté ráno, během dne se pak aktivita zvyšuje, ale hlavně jsou patrné velké výkyvy pravděpodobně způsobené vylítáváním včel shánějích pyl. Zhruba kolem čtvrté hodiny odpoledne aktivita včel opět lehce klesne a často kolem sedmé o něco vyroste. Přes noc se stabilizuje a nedochází k tak velkým výkyvům jako přes den. Z tohoto schématu opět vybočuje úl Gregor 2.
6. Report pro včelaře
Výstupem naší práce jsou dva praktické reporty pro včelaře:
Kromě nich jsme publikovaly ještě množství dalších grafů pro ilustraci dění v úlech.
Jejich účelem není podchytit souvislosti mezi reportovanými daty nebo předpovídat chování včel – k tomu bychom musely být v daleko užším spojení se včelaři a vědět, kdy se jednotlivé úly otevírají, zda se do nich něco přidává nebo naopak odebírá a podobně. Také bychom toho musely vědět víc o chování včel a včelstev.
Účelem reportů je poskytnout včelaři rychlý přehled o dění v úle za posledních 24 hodin ve srovnání s předchozími dny. Díky tomuto přehledu může identifikovat anomálie, které nemají žádnou zjevnou příčinu.
Pomocí srovnání frekvence zvuku (Spectral Centroid) v posledních 24 hodinách s předešlými dny včelař pozná, když se dění v úlu vymyká normálu.
Z reportu včelař zjistí také stoupající a opět klesající hmotnost úlu, která je důsledkem toho, jak včely opouštějí úl, vracejí se do něj s nektarem a během nočních hodin z nasbíraného nektaru vysoušejí přebytečnou vodu. Větší změny v hmotnosti mohou být způsobeny například deštěm nebo včelařovými zásahy do úlu, například velký propad zachycený grafem je způsobem odstraněním jednoho prázdného patra úlu.
Přehled pro včelaře obsahuje přehled teploty vs. aktivity v úlu na základě zvuku za sledovanou dobu.
Pro zajímavost, graf vlevo ukazuje tendenci pro jednotlivé měsíce od prosince 2018 do května 2019. S rostoucí teplotou roste také aktivita včel, ale ani teplý duben (růžová) nepředčil co do aktivity měsíc březen (žlutá), kdy se teplota ustálila v rozmezí 5–10°C a včely začaly ve velkém opouštět úl.
Pro praktické účely nepřerušovaného měření jsme do reportu zahrnuly také stav napětí baterie napájející měřicí přístroje.
Součástí reportu je přehled srážek a počtu slunných hodin, zde úsek dubna a května, v pohledu pro včelaře omezený na sledovaný týden.
7. Závěr
Děkujeme Honzovi Dupalovi za trpělivé vedení projektu a Mendelově univerzitě za to, že jsme mohly použít její data. Doufáme, že výsledek naší práce bude využitelný při každodenní péči o včelstva, ať už ho včelaři vezmou tak, jak je, nebo si ho po otestování ještě přeskládají, aby jim vyhovoval lépe.
Pro nás byl projekt příležitostí naučit se pořádně pracovat s Power BI a vyzkoušet si práci s živými, nepředvídatelnými daty, se všemi výhodam a nevýhodami, které to přináší.
Jak by se dalo na naši práci navázat? Aby se s reportem lépe pracovalo, nabízí se jeho automatická integrace se surovými daty ukládanými průběžně v cloudu. To jsme už v průběhu projektu nestihly, a praktické využitelnosti projektu by to velmi pomohlo.
Dalším krokem by mohlo být zapojení strojového učení pro včasnou detekci rojení (podle akademické literatury se má projevit náhlým nárůstem frekvence zvuku a zároveň propadem teploty a vlhkosti v úlu) nebo pro stanovení, kdy je nebo není v úlu přítomna královna.