Jak znaleźć jednorożca?

Na ich pierwszy meet up. przyszło ok. 60 osób. Na kolejnym – ich liczba zbliżyła się już do setki. Nic dziwnego: Machine Learning i Data Science to gorące, ale wciąż nieco tajemnicze tematy. W dodatku – mocno interdyscyplinarne, co pokazuje skład ich społeczności. Agnieszka Kamińska – od której wszystko się zaczęło – robi karierę naukową, a w stronę uczenia maszynowego zaprowadziło ją zainteresowanie możliwościami ludzkiego mózgu. Basia Sobkowiak zajmuje się Business Intelligence, ale studiowała geoinformację, czyli najpierw miała kontakt z danymi przestrzennymi. Monika Koprowska pomaga we wdrażaniu rozwiązań opartych na sztucznej inteligencji i Machine Learning w produktach startupu ulam.ai. Sama uczyła się wszystkiego jeszcze w czasach, gdy zawodowo “siedziała” w marketingu i BI. Zuzanna Kunik miała być software deweloperką w firmie zajmującej się cyberbezpieczeństwem. Okazało się jednak, że jej pracodawca szuka Data Scientist, a ona to potrafi.

Agnieszka założyła Women In Machine Learning & Data Science PL (istnieje też globalna organizacja o takiej nazwie) w Poznaniu po tym, jak taki pomysł padł na popularnej grupie “Programuj, dziewczyno!”. – Mijał czas i nikt nie wyszedł z inicjatywą. W końcu zrobiłam to ja! Stwierdziłam, że byłam na wielu meetupach, na których ktoś poświęcił mi swój czas, udostępnił materiały do nauki. Też mogę dać coś od siebie innym. – mówi. Wkrótce potem zgłosiły się pierwsze chętne. Agnieszka spotkała się z Moniką i od razu między nimi “kliknęło”. Zabrały się za organizację meetupu. Dziś są po drugim, sierpniowym spotkaniu, i planują kolejne, w październiku. Równocześnie rozwija się oddział w Trójmieście, który zrobił już pierwsze warsztaty z wizualizacji danych.

Dlaczego to miała być właśnie kobieca społeczność? – Brałam udział w wielu międzynarodowych wydarzeniach w środowisku akademickim i słuchałam wystąpień wielu wybitnych prelegentek. Wydawało mi się zatem, że w neuronauce obecność kobiet jest po prostu oczywista. Tymczasem, gdy zaczęłam chodzić na eventy organizowane przez środowisko IT, zobaczyłam pojedyncze kobiety, tak wśród prelegentów, jak i słuchaczy. – wspomina Agnieszka. Zaczęła czytać o sytuacji kobiet w IT, o tym, że dziewczynki w okolicach 12. roku życia przestają interesować się przedmiotami ścisłymi (bo otrzymują przekaz, że to “mało kobiece” dziedziny), a programistki z 8-letnim stażem mają ten sam poziom zawodowej pewności siebie, co programiści z… rokiem doświadczenia. – Co takiego dzieje się z systemie kształcenia, czy potem na rynku pracy, że kobietom tak bardzo brakuje siły przebicia i przekonania o własnej wartości? Dostałam koronny argument, że warto robić wydarzenia female friendly. – mówi Aga.

Agnieszka Kamińska na sierpniowym meetupie WiMLDS w Poznaniu

Monika dodaje, że WiMLDS powstało między innymi po to, by ośmielić kobiety z branży do “pokazania się”: – Kiedy pierwszego dnia w nowej pracy rozmawiałam o kryteriach awansu i podwyżki, moja ówczesna szefowa stwierdziła: “Jesteś pierwszą kobietą, która chce wiedzieć takie rzeczy na tym etapie. U mężczyzn to norma”. To nie była krytyka, tylko uznanie. Uważam, że więcej kobiet powinno umieć rozmawiać o takich standardach. Ale nie popieram postaw roszczeniowych! – mówi zdecydowanie. Podkreśla, że siłą kobiet są ich wiedza i umiejętności, i na to powinny postawić.

Tym bardziej, że w uczeniu maszynowym i Data Science nie brakuje dziewczyn ze świetnym przygotowaniem merytorycznym. Basia pracuje w dziale BI firmy Britenet, który w 40 proc. składa się z kobiet, i tworzy w jego ramach komórkę Data Science, w której z kolei są trzy dziewczyny i jeden chłopak. – Kiedy dziś byłam na spotkaniu projektowym i przyszli sami faceci, to była dla mnie trochę… niezwykła sytuacja! – przyznaje ze śmiechem. Według niej, kobiety chętnie dzielą się wiedzą i nie traktują siebie nawzajem jak konkurencji. Dlatego łatwiej w ich gronie zacząć naukę czegoś nowego: – Będę szczera, w otoczeniu mężczyzn, którzy już dawno wybrali tę ścieżkę, czasami czuję się niepewnie. Pewności siebie dodaje mi za towarzystwo dziewczyn w WiMLDS!

Zuza, Data Scientist w firmie F-Secure i współzałożycielka pythonowskiej społeczności PyLove, działa w społeczności, bo też chce walczyć z tą kobiecą – również własną – niepewnością. Wspomina międzynarodową konferencję, w której brała udział: prelegentki z wieloletnim doświadczeniem przyznawały, że boją się pytań z sali:  – Nawet celowo przeciągały swoje wystąpienia, żeby nikt nie miał szans ich o coś zapytać. Rozumiem to, ja też mam takie obawy. Ale właśnie po to występuję na meetupach i je współorganizuję, żeby pokazać kobietom, że mają prawo dzielić się wiedzą i konieczne do tego umiejętności.  

To, że między nimi “zagrało”, jest o tyle ciekawe, że każda z nich zajmuje się czym innym.

Agnieszka robi doktorat w Zakładzie Logiki i Kognitywistyki Instytutu Psychologii na Uniwersytecie w Poznaniu. Pracuje z danymi, które pozyskuje dzięki funkcjonalnemu rezonansowi magnetycznemu (fMRI): – Takie badanie pozwala w nieinwazyjny sposób sprawdzić zależność między występowaniem określonych procesów poznawczych a zmianami aktywności mózgu. – wyjaśnia. Ponieważ interesowało ją, jak mózg “widzi” pojęcia, z myślą o doktoracie sama nauczyła się języka migowego.

Co to ma wspólnego z Data Science i Machine Learning? – Rozpoczęłam studia psychologiczne, bo interesowały mnie związki różnych procesów psychicznych z budową i aktywnością mózgu. Zajęłam się badaniami w obszarze neuronauki poznawczej, dzięki czemu mogłam “zaglądać” do ludzkiego mózgu i dowiedzieć się, jak zmienia się jego praca w zależności od różnych zadań, jakie wykonuje nasz umysł. Stąd, jak mówi, “prosta droga” do zainteresowania uczeniem maszynowym: – Badania z wykorzystaniem rezonansu wiążą się z przetwarzaniem dużych ilości bardzo złożonych danych. Poszukiwałam metod, aby móc się przyjrzeć tym danym na różne sposoby. – tłumaczy.

Monika Koprowska zajmuje się Business Developmentem w startupie ulam.ai, który tworzy produkty oparte na sztucznej inteligencji i Machine Learning. Poza tym, jest “ewangelistką” AI, prowadzi z mężem edukacyjnego vloga Jako Rzecze Maszyna. Studiowała informatykę i ekonometrię; początkującym adeptom Data Science może polecić tę drugą: – Właśnie na ekonometrii miałam statystykę, tworzenie modeli, a to są podwaliny Data Science.

Potem każdy kolejny krok w życiu zawodowym prowadził ją do tego, co robi dzisiaj.  Pracując w dziale Business Intelligence Kampanii Piwowarskiej, miała do czynienia z bazami danych, musiała te dane analizować i sporządzać raporty. W Accenture była konsultantką SAP, brała udział we wdrożeniach w ponad 10 krajach i pełniła funkcję “pierwszego kontaktu” dla lokalnych biznesów. Z kolei w Procter & Gamble zajmowała się automatyzacją procesów, która dziś interesuje ją najbardziej: – Dla mnie ideałem byłoby, gdyby aplikacja wydawała mi rano spersonalizowaną rekomendację, w co mam się ubrać, czy jak rozplanować optymalnie logistykę przejazdów w czasie dnia, bo szkoda mi czasu na myślenie o tym. – twierdzi Monika.

Basia właśnie tworzy w Britenet komórkę Data Science. Jak tłumaczy, była jedyną osobą w firmie o statusie lidera, która zgłosiła się do tego zadania. Nadal jednak pracuje głównie w BI: – Mam kontakt z klientami odnośnie wszystkich projektów związanych z danymi. Muszę wiedzieć dokładnie, jak się wyliczają wszystkie miary, które klient stosuje, i jeszcze znać jego oczekiwania biznesowe. Co to znaczy? – Moim ulubionym przykładem jest liczba polis. Tylko laikom się wydaje, że tyle polis, ile ich wystawiliśmy! Tymczasem każda firma ubezpieczeniowa – w zależności od kontekstu biznesowego analiz i sposobów przechowywania danych – ma swoje algorytmy obliczania tego wskaźnika. Ja ustalam, jak się te dane pobiera, co w nich analizuje, a potem przekazuję deweloperom, jak powinni z nimi pracować. Do tego dochodzi odpowiedzialność za graficzne przedstawienie tych danych zgodnie z potrzebami klienta.

Basia Sobkowiak

W nowej komórce Data Science Basia czuwa też nad projektami, które mają wspomóc rozwój zespołu. Jeden z jej kolegów tworzy skrypt analityczny w R, za pomocą którego władze firmy będą analizować dane, do których tylko one mają dostęp, a koleżanka pracuje nad modelem machine learningowym wykorzystującym predykcję (czyli przewidywanie przyszłych realizacji albo cech statystycznych zjawisk losowych).

Choć zaczynała od danych przestrzennych, to analiza danych biznesowych okazała się w jej przypadku zawodowym strzałem w dziesiątkę: – Fascynowało mnie, jak rynek może np. skorzystać na informacji, że jakaś licząca się firma kupiła dany towar w danej ilości: co z tego wynika, i jak te zależności zmieniają się w czasie? – mówi obrazowo.

Zuzanna, Data Scientist w firmie F-Secure oferującej rozwiązania z zakresu cyberbezpieczeństwa, pamięta czasy, gdy nie chciała uczyć się programowania: – Na informatyce w liceum uczyliśmy się pisać w Pascalu, kompletnie mnie to nie wciągnęło, w dodatku te zajęcia były fatalnie prowadzone. – mówi. Jak to się stało, że później współtworzyła PyLove? – Pythona zaczęłam uczyć się z myślą o mojej pracy inżynierskiej na automatyce i robotyce. Dotyczyła przetwarzania sygnałów, więc była już blisko analizy danych. – wyjaśnia Zuza. Samą robotykę wybrała dlatego, że informatyka jej nie interesowała, była za to dobra z matematyki i chciała dowiedzieć się więcej o elektronice. Ale… – Na drugim czy trzecim roku studiów zaczęłam oglądać filmiki o algorytmach i sieciach neuronowych. Wtedy zrozumiałam, że, jeśli chcę sama robić takie magiczne rzeczy, znajomość C raczej mnie do tego nie zaprowadzi.

Później na studiach magisterskich uczyła się systemów wizyjnych, czyli przetwarzania obrazów, i tu już musiała używać narzędzi, którymi dziś posługuje się jako Data Scientist: – Chodziło o to, żeby filtrować obrazy, odszumiać je i dodawać do nich nowe featury. Na tym etapie nie wykorzystywałam jeszcze tak dużo i często sieci neuronowych, ale po tym, jak nauczyłam się Pythona, poszło z górki. – wspomina Zuza. Uczyła się pracować na Kaggle’u, czyli platformie do tworzenia projektów z wykorzystaniem Data Science, a na studiach dostała solidną porcję wiedzy o matematycznych podstawach sieci neuronowych. – Wszystko, co związane z kodowaniem, przyswoiłam sobie sama. Na zajęcia np. zaawansowanej grupy PyLadies z Django chodziłam bardziej po to, żeby poznać ludzi. Poznała między innymi Piotra, swojego obecnego Team Leadera, z którym rozkręciła później PyLove, i który później dał jej znać, że w F-Secure trwa rekrutacja na staż.

Zaczynała tam rzeczywiście jako deweloperka. Dziś wspomaga pracę specjalistów od cyberbezpieczeństwa: – Moim zadaniem jest usprawnić ich pracę tak, żeby łatwiej im było ocenić, czy dana sytuacja odpowiada modelowi, a więc jest np. jest potencjalnie niebezpieczna dla klienta. Analizuję i czyszczę dane, przygotowuję modele i sprawdzam, jak działają, a potem, już po ich zaimplementowaniu na produkcji, zajmuję się także ich utrzymaniem. – opowiada o swojej pracy.

Wiedzą, że o Data Science różnie się mówi. Zuza twierdzi, że nigdy nie chciałaby pracować w firmie, która używałaby danych użytkowników do nielegalnego wyciągania informacji i posługiwania się nimi np. przy dopasowywaniu reklam do ich profili. Jednak sprowadzanie Data Science do tego rodzaju zagrożeń to, według niej, nadużycie: – Jest to po prostu narzędzie, które służy do skalowania pracy zwykłych algorytmów. My też korzystamy z normalnych silników decyzyjnych, pisanych reguł “if… then…”, ale dzięki Data Science możemy umacniać te silniki, tak, jakby przy analizie informacji pracowały miliony ludzi.

Zuzanna Kunik

Basia widzi coraz większą świadomość tego u zewnętrznych klientów: – To są duże firmy, które obracają ogromnymi ilościami danych. Jeśli przechowują je w Excelu, często robi się przez to bałagan, tym bardziej, że każda z osób, która ma coś policzyć, stosuje własne, autorskie metody. W efekcie – co człowiek, to inny wynik. Dlatego coraz więcej klientów jest otwartych na analizę danych. Jednocześnie przyznaje, że poziom nieufności do modeli Data Science pozostaje wysoki: – Zwłaszcza, że często wcale nie jest nam łatwo wytłumaczyć, dlaczego model zwrócił taki, a nie inny wynik. Monika wie o tym i dlatego w rozmowach z firmami niekoniecznie używa terminu “sztuczna inteligencja”, tylko po prostu opisuje mechanizm jej działania i korzyści, jakie jej wykorzystanie może przynieść danemu podmiotowi: – W środowisku IT często słyszy się narzekania: “jaki ten biznes jest do tyłu”. A przecież to naszą rolą, jako osób mających wiedzę techniczną, jest dzielić się tą wiedzą i pokazywać jej praktyczne zastosowania. Skoro chcemy współpracować z biznesem i przekazywać mu nasze pomysły, musimy umieć o nich rozmawiać.

Edukacja to jeden z najważniejszych celów WiMLDS. Monika za cenne doświadczenie uważa uczenie innych: – Można po pierwsze utrwalić wiedzę, którą się ma. Po drugie, nauczyć się przekazywać ją tak, by i dla laika nasz przekaz był jasny. Kiedy przypomnę sobie swoje pierwsze wystąpienia na temat Machine Learning, widzę, jakie były “mądre”: nikt spoza branży nie miał szans tego zrozumieć. Teraz robię to całkiem inaczej. – przyznaje. Dla Basi istotne jest też to, że w kontakcie z drugim człowiekiem można, jej zdaniem, nauczyć się więcej: – Owszem, można klepać z książek, na pewno poznaje się w ten sposób narzędzia. Ale czy dużo się z tego pamięta? Pewne treści lepiej wchodzą do głowy, kiedy pochylamy się nad problemem z innymi osobami, możemy o coś dopytać, poprosić o przykłady.

Każda z nich, mając coś doradzić innym osobom, które chcą wejść do świata Machine Learning i Data Science, powtarza: liczy się pasja i wytrwałość. Monika nie ma wątpliwości, że prędzej czy później trzeba zadbać o swój matematyczny background, jeśli się go nie ma. A w trakcie nauki nie warto “skakać z kwiatka na kwiatek”, tylko skupić się na jednej ścieżce; inaczej zdobędzie się powierzchowną wiedzę o wszystkim i żadnych konkretów do zastosowania w nauce czy pracy. A “skakanie” kusi, bo przecież Data Science to programowanie, ekonomia, psychologia, językoznawstwo… – Nie bez powodu mówi się, że ta dziedzina jest jak jednorożec: wymaga umiejętności informatycznych, matematyczno-statystycznych i jeszcze miękkich, żeby wytłumaczyć sens naszej pracy choćby klientowi. – śmieje się Basia. – Teraz znajdź kogoś, kto to wszystko potrafi!  

 

 

Komentarze

Karolina Wasielewska

Pracuję w radiu i od czasu do czasu w prasie. Lubię: jesień, książki Lema, sporty przeróżne, koty, niespieszne pichcenie w wolne dni, czerwone wino, wesołe miasteczka, historie o superbohaterach, czasami Beastie Boys, a czasami Dianę Krall. Nie lubię: upałów, agresji, gotowania w pośpiechu i wielu innych rzeczy, których nie lubię, więc nie chcę nawet o nich pisać.