
Strojové učenie v Pythone 1 – prostredie Google Colab
Začíname nový seriál, v ktorom na praktických príkladoch ukážeme ako programovať úlohy strojového učenia v programovacom jazyku Python. Uvidíte, že je to oveľa jednoduchšie ako by sa na prvý pohľad mohlo zdať. Postup tvorby kódu a sprievodných poznámok v prostredí Google Colab je v krátkom videu
Pre tento seriál budeme využívať online prostredie Google Colaboratory (Colab), ktoré je dostupné na adrese https://colab.research.google.com. Toto vývojové prostredie vytvárať a spúšťať kód v programovacom jazyku Python priamo v prehliadači bez toho aby ste museli niečo inštalovať na svoj počítač. Pre pokročilejších čitateľov Colaboratory je cloudová implementácia nástroja Jupyter Notebook, ktorá beží na serveroch Google. Jupyter Notebook si môžete nainštalovať aj lokálne na svoj počítač, napríklad ako súčasť platformy Anaconda https://www.anaconda.com/. Zápisníky Colab sú zápisníky projektu Jupyter hostované službou Colab. Viac o projekte Jupyter sa dozviete na jupyter.org.
Základná verzia Colab je zdarma, ak potrebujete vyšší výpočtový výkon môžete si predplatiť Colab Pro, alebo Colab Pro+, prípadne využívať model Pay As You Go
Na rozdiel od klasických vývojových prostredí v prostredí Colab vytvárate nielen kód, samozrejme čo najlepšie komentovaný, ale pomedzi bloky kódu môžete písať poznámky vrátane vzorcov. Kód sa tvorí v interaktívnom prostredí Notebook Colab, ktoré skutočne pripomína zápisník. Keď neskôr otvoríte projekt, budete tam mať všetko vysvetlené a okomentované, samozrejme len v prípade, ak budete jednotlivé bloky kódu svedomito popisovať.
V prvom príklade vypočítame a zobrazíme faktoriál zadaného čísla. Nový zápisník Colab môžete vytvoriť pomocou menu Súbor
Príklad upravíme tak, aby ste mohli zadať hodnotu ktorej faktoriál potrebujete vypočítať. Za parameter je potrebné pridať #@param, prípadne aj so špecifikáciou typu premennej #@param {type: 'integer'}
Námetom ďalšieho jednoduchého príkladu bude vizualizácia údajov formou grafu. Na vykreslenie grafu využijeme knižnicu matplotlib.
V ďalšom príklade budeme hodnoty generovať náhodne funkciou z balíka NumPy
Premenné, ktoré definujete v jednej bunke kódu, je možné použiť neskôr v iných bunkách:
premennú použijem v ďalšom bloku kódu
Globálne premenné môžete zresetovať príkazom
%reset -f
Predpona %. Špecifikuje, že sa jedná o funkciu iPythonu typu Magic a táto funkcia sa vzťahuje sa na jeden riadok. Ukážeme si to na funkcii %timeit, kde porovnáme čas výpočtu pre tretiu mocninu a tretiu odmocninu
Magic funkcia pre celú bunku má prefix %%.
V pokračovaní sa budeme venovať knižnici funkcií Pandar na prácu s údajmi.
Zobrazit Galériu