Cześć Mateusz, czy mógłbyś się przedstawić i powiedzieć czym na co dzień się zajmujesz?
Cześć, Witam Cię. Witam też wszystkich, którzy oglądają to wideo. Jestem Data Scientistem. Na co dzień pracuję w Allegro Pay i zajmuję się modelowaniem ryzyka kredytowego. Poza tym występuję też publicznie głównie tematyką związaną z Data Science. W sumie w skrócie, to jest to, czym się zajmuję.
Okej. Dzięki wielkie. Chciałabym trochę wrócić do Twojej przeszłości, bo swoją pierwszą pracę w branży IT zacząłeś jako Java Developer. W 2020 roku zająłeś stanowisko Data Analyst, a teraz pracujesz jako Data Scientist. No i czy mógłbyś opowiedzieć, dlaczego ostatecznie zdecydowałeś się pójść właśnie w tym kierunku Data?
To jest bardzo ciekawa historia. Ta pierwsza praca to był tak naprawdę staż, w którym zajmowałem się dość prostymi rzeczami. Pisałem w Javie aplikację dla niedużej fundacji. Ale jedną historię, którą pamiętam z tamtej firmy to było wdrożenie produktu i jeżeli ktoś uważa, że wdrożył coś w piątek wieczorem i jest hardkorem, to lepiej niech posłucha tego. Moje ostatnie wdrożenie w tej firmie, było ostatniego dnia pracy. Wyglądało to tak, że zgrałem program na pendrive’a, pojechałem z nim autobusem do firmy, w której to wdrażałem, zgrałem i zadzwoniłem do szefa, że my job here is done. No ale to był dość krótki okres. Potem zacząłem pisać inżynierkę, która była właśnie związana ze sztuczną inteligencją i też moją ogormną pasją – muzyką. I to w pewien sposób zmotywowało mnie do tego, żeby troszkę zmienić branżę i na magisterce poszedłem na kierunek związany z Data Science. Potem pierwsza praca. Tam byłem Data Analyst’em, ale bardziej wydaje mi się, że to co robiłem było związane z zawodem Business Analyst’a. Bardzo dużo pracowałem z biznesem, poznawałem ich zwyczaje, potrzeby i wykorzystując odrobinę analizę i te dane, które mieli, wskazywałem jakieś kierunki, które myślę, że warto było zbadać. No i po roku pracy w tamtej firmie. Postanowiłem, że chciałbym jednak zacząć pracę w Data Science tak na dobre i poznać aspekty tej pracy w firmie, która ma duże doświadczenie, ma zasoby, ma dane przede wszystkim i ma też zespół, który potrafi to robić dobrze. No i tak trafiłem do Allegro Pay. Pracuję tam już od roku, tak jak już gdzieś o tym rozmawialiśmy – niedawno była moja rocznica pracy w Allegro Pay. Bardzo się cieszę, bo przez ten czas nauczyłem się bardzo dużo, szczególnie w obszarach związanych z przetwarzaniem danych, w obszarze finansowym. Myślę, że to jest fajne miejsce, żeby się rozwinąć.
Super! To gratulujemy jeszcze raz. Już teraz na kamerach – tej rocznicy pracy. Brawo! Chciałam się podpytać, bo w obszarze data 3 najpopularniejsze stanowiska to Data Analyst, Data Engineer i Data Scientist. Czym one się od siebie różnią?
To jest bardzo ważne pytanie, ponieważ wiele osób nie do końca rozumie różnice, które kryją się pod tymi nazwami. A co ciekawe, wiele firm, które oferuje takie stanowiska również tego nie wie. Sprawa wygląda tak, że Data Analyst w większości przypadków z jakimi się spotkałem, to osoba, która bada przeszłość, analizuje teraźniejszość, żeby wspierać decyzje biznesowe. To jest stanowisko, które tak naprawdę istnieje od lat i nie jest niczym specjalnie nowym. Przedrostek data tutaj myślę, że niespecjalnie tutaj coś zmienia. Natomiast Data Scientist to jest takie stanowisko, które bardziej skupia się na próbie przewidzenia przyszłości. A jeśli chodzi o wartości biznesowe, to raczej buduje produkty. Niekoniecznie są to analizy, chociaż też taka analiza może być produktem dla biznesu i dostarcza wartość w postaci gotowego oprogramowania, które coś stara się przewidzieć do przyszłości. Natomiast Data Engineer to jest taka osoba, która sprawia, żeby tamta dwójka miała dobrą i wygodną pracę. Mam tutaj na myśli, że po prostu przygotowuje procesy przetwarzania danych, pomaga przy wdrażaniu modeli. Chociaż czasami wyróżniane jest też stanowisko MLOps, czyli osoby, która bezpośrednio przy modelach wspiera to wdrożenie. No i bez nich dużo się nie dowiezie. Nawet dobry zespół Data Scientist’ów bez Data Engineer’ów nie ma na czym pracować i wydaje mi się, że to jest podstawa, od której powinny firmy zaczynać, jeżeli próbują zbudować zespół data
Co można uznać za największe wyzwanie w Twojej obecnej pracy?
Z całą pewnością jest to obszar finansowy, który obejmuje całe spektrum zagadnień, które są bardzo trudne, wymagające. Nawet przepisy, które zmieniają się cały czas, wpływają w ogromny sposób na to, jak ten biznes funkcjonuje. Jak wygląda moja praca. Kolejny taki obszar. Myślę, że to jest obszar data, który też jest bardzo wymagający. Wymaga dużych umiejętności technicznych, zrozumienia całej architektury, całego systemu, który już funkcjonuje, takiego żywego organizmu, który już działa. I to jest, czasochłonne, wymagające zadanie. Natomiast jeśli chodzi o modelowanie, to tutaj też jest bardzo dużo nowych rzeczy się pojawia w tym obszarze. Każdego roku pojawiają się nowe papiery, nowe artykuły, nowe prace dotyczące tego obszaru finansowego i to jest z uwzględnieniem faktu, że większość takich rozwiązań raczej nie widzi światła dziennego, ponieważ jeżeli ktoś faktycznie znajdzie jakąś nową metodę, która w pewien sposób usprawnia ten biznes finansowy, raczej nie publikuje jej ot tak, tylko próbuje ją spieniężyć w swoim zakresie. Dlatego tutaj taki rozwój. Myślę, że też jest mega ważne, żeby stawiać na research, ponieważ każda firma, która prowadzi research i dochodzi do jakichś ciekawych rzeczy, zachowa to raczej dla siebie. Więc tutaj ważne jest, żeby nie tyle patrzeć na trendy tego, jak rozwija się ta branża na świecie, ale też żeby próbować postawić tam własny ślad.
To skoro już jesteśmy przy tym czym właśnie taka praca się cechuje, to w takim razie jakie predyspozycje i umiejętności tutaj mam na myśli te twarde, ale też i miękkie trzeba mieć do pracy jako Data Analyst i Data Scientist.
Wydaje mi się, że to, o czym mówiliśmy wcześniej, czyli taka umiejętność łączenia wielu wątków naraz, jest bardzo ważna, ponieważ często pracujemy nad szerokim spektrum zagadnień, zaczynając od zbierania wymagań biznesowych, przez utworzenie problemu analitycznego, następnie odpowiedni dobór danych architektury modelu, poprzez kolejną analizę, weryfikację tego modelu, aż przez wdrożenie i monitorowanie tego wszystkiego. Wydaje mi się, że to wymaga szeregu różnych umiejętności, które są bardzo ważne. Mam tu na myśli chociażby umiejętność komunikacji. I to komunikacji precyzyjnej komunikacji, która pozwala wyciągnąć informacje. Ponieważ zbieranie wymagań to nie jest tylko słuchanie. Zbieranie wymagań jest raczej procesem aktywnym, w którym trzeba wskazać na potencjalne problemy w przyszłości i potencjalne pola do rozwoju. Więc osoba, która chce zostać analitykiem danych bądź Data Scientist myślę, że raczej powinna mieć swobodę komunikacji, żeby swobodnie móc takie rozmowy prowadzić. Jeśli chodzi o umiejętności twarde, wydaje mi się, że oczywiście matematyka, logika, rozumienie tego typu zagadnień, jak również jakieś narzędzia w ręku, czyli jakiś język programowania, czy to Python, czy R, czy SQL. Z czymś takim na pewno jest zdecydowanie prościej, bo jakimś narzędziem trzeba się posłużyć, a takie właśnie narzędzia mamy w tej chwili dostępne.
Co w takim razie doradziłbyś osobom, które chciałyby rozpocząć swoją karierę w obszarze data? Od czego powinny zacząć? Skąd powinny czerpać wiedzę? I ile czasu potrzeba na znalezienie tej pierwszej pracy?
Wydaje mi się, że jeżeli taka osoba już wie, że to obszar data to trochę poczyta i z pewnością wie, że występują tam różne obszary, różne stanowiska, o których już troszkę mówiliśmy, czyli Data Scientist, Data Analyst czy Data Engineer. Myślę, że niekoniecznie to jest ważne, żeby taką decyzję podejmować: „Chcę zostać Data Scientist’em.” ,”Chcę zostać Data Engineerem”, bo to się zmieni w czasie, jeżeli poznamy szczegóły tego, jak to wygląda w praktyce. Myślę, że warto zrobić sobie projekt, który pokaże Ci, jak wygląda to w praktyce. Zapisać się do koła naukowego. Być może wziąć udział w jakimś konkursie. Są platformy, na których takie konkursy są organizowane, żeby upewnić się, czy to jest to, co naprawdę chcemy robić. W moim przypadku była to inżynierka i magisterka, które pokazały mi, że to jest rzecz, która pozwala mi się rozwijać. Lubię to. Mam do tego pewne predyspozycje i później praca. Pierwsza praca w tym, to okazało się, że właśnie to jest to. Natomiast osoby, które poszukują tej pierwszej pracy.. No bo wiadomo, żeby ją dostać, to też swoją drogę przejść. Własny projekt. Myślę, że to jest super rzecz. Tylko często ciężko wybrać to, co powinno się zrobić, jaki ten projekt ma być, skąd pozyskać dane… Jak właściwie się do tego zabrać? Na pewno prawdą jest, że w internecie jest miliony materiałów na ten temat. Tylko które są odpowiednie? Które, w której kolejności? Kiedy? Które są ważniejsze? To nie jest pytanie, na które łatwo sobie dać odpowiedź samemu, więc warto wtedy sięgnąć po trochę bardziej usystematyzowane materiały jak książki. Wydawnictwo O’Reilly ma wiele takich fajnych podsumowań. Są takie klasyki jak elementy statystyki. Można również sięgnąć po… Oczywiście po twardszą literaturę, ale nie wiem, czy to może kogoś nie zniechęcić czasem. Więc wydaje mi się, że odpowiedzią na to pytanie dla niektórych osób może być Bootcamp czy też kurs. Oczywiście Bootcamp to nie są to studia i ciężko oczekiwać od osoby na Bootcampie tych samych umiejętności co od osoby, która ukończyła studia w tym kierunku bądź pokrewnym. Ale jeżeli ktoś chce się przebranżowić, chce zacząć pracę to myślę, że jest to pewne rozwiązanie. Istnieją też takie krótkie kursy. Sam jestem autorem jednego z nich, które pozwalają na rozeznanie się w temacie, dowiedzenie się, które rzeczy są najważniejsze, od jakich zacząć. Więc myślę, że warto zastanowić się ile czasu, ile energii jesteśmy w stanie zainwestować w nasz rozwój i spróbować którąś z tych opcji.
Super! Ja tak jeszcze powiem, że link do kursu Mateusza będzie na pewno w opisie tego filmu. Także gorąco zachęcamy wszystkich oglądających do tego, żeby zerknąć i zapoznać się z tymi materiałami, które Mateusz przygotował i zapisać się na kurs.
Dzięki wielkie, zachęcam.
Załóżmy, że już wiemy, że chcemy wejść w ten obszar Data, no właśnie byliśmy na kursie – nawet może Twoim. Mamy tą wiedzę i szukamy tej pierwszej pracy. Jakich przykładowych pytań w trakcie rozmowy o pracę można się spodziewać np. aplikując na rolę Data Scientist’a?
Myślę, że z pewnością pytania dotyczące naszego doświadczenia. Czy jest ono komercyjne, czy dopiero amatorskie? Najlepiej przygotować jakiś projekt, nad którym pracowaliśmy w poprzedniej pracy, czy może na jakimś kursie, czy może jakieś projekty ktoś robił na studiach? Często studenci mają problem z tą pierwszą pracą – jak przygotować się na rozmowę? Więc tutaj warto sobie przygotować od razu odpowiedzi na pytania, które mogą się pojawić typu: Jakie problemy napotkałaś? Jak zdefiniowałaś sobie problem? Jak zebrałaś dane, jak przygotowałaś model? Jakie wnioski wyciągnąłeś? Co zrobiłabyś lepiej? To jest bardzo ważne pytanie. Warto sobie o tym troszkę pomyśleć? Być może nawet spróbować zrobić z kimś taką rozmowę. Z jakimś znajomym, z kimś kto ma pracę. Kimś kto te pierwsze doświadczenia w rozmowach rekrutacyjnych ma za sobą. Wtedy jest na pewno zdecydowanie łatwiej. Takim innym pytaniem może być też case study, czyli jak rozwiązałbyś/rozwiązałabyś problem, który mamy w naszej firmie, to czy jest jakiś opis mniej lub bardziej dokładny. Wtedy też należy się zastanowić, czy nie należy dopytać o jakieś szczegóły, które są istotne. I tak naprawdę w tym pytaniu nie jest ważne to, żeby te rozwiązanie było idealne, żeby było kosztowo zoptymalizowane, żeby było w pełni wdrażane. Oczywiście to są aspekty, których trzeba myśleć dając odpowiedź, ale tutaj liczy się sposób myślenia, te najważniejsze, kluczowe rzeczy, o które ktoś zadba. To jest trudne, żeby to przećwiczyć. Myślę, że tutaj ciężko ciężko to ćwiczyć samemu, a nawet jeżeli jest jakaś osoba, która by nam mogła pomóc, to też musisz się troszkę na tym znać. Więc nasuwa się taka odpowiedź, że na rozmowę po prostu trzeba chodzić i należy próbować. Być może na pierwszej się nie uda, ale wtedy warto zebrać feedback. Warto się zastanowić, szczególnie od tej osoby technicznej i co poszło nie tak, bo to są rzeczy, które mogą stanowić problem, ale wydaje mi się, że nie są nie do przejścia. Wystarczy po prostu… Spróbować w terenie. Spróbować w akcji.
Ok, czyli trening czyni mistrza można powiedzieć?
Dokładnie. Są jeszcze pytania, które ja bardzo lubię na tego typu rozmowach tzw. pytania special. Przykładem takiego pytania może być jedno z moich ulubionych w ostatnim czasie. Lubię zadawać moim znajomym i zadaje również Tobie. Mianowicie czy jabłka są mądrzejsze od gruszek?
To takie pytanie dosyć oryginalne.
Z pewnością. Chciałbym, żebyś odpowiedziała, przy czym zaznaczę, że nie jest to ani zagadka, ani nic podchwytliwego. Zastanawiam się, co odpowiesz mi na takie pytania?
Czy jabłka są bardziej inteligentne od gruszek?
Można to tak sformułować.
Wydaje mi się, że gruszki są bardziej inteligentne, a wynika to z tego, jaki mają kształt. Jabłko jest jednak okrągłe, a gruszka jest taka bardziej nieproporcjonalna. Nie jest symetryczna. Więc wydaje mi się, że potrzebuje więcej inteligencji mieć w sobie, żeby ta gruszka się narodziła.
No to jest ciekawa odpowiedź. Przyznam, że jeszcze takiej nie dostałem. Teraz może chciałbym powiedzieć jakie odpowiedzi jeszcze usłyszałem z pewnością ciekawe.Mianowice to, że jabłka są bardziej kwaśne od gruszek, przez co mają mniej cukru, który jak wiadomo psuje mózg. Słyszałem też odpowiedzi, że nasiona, które znajdują się w owocach gromadzą tą inteligencję i jabłka mają takie nasiona, które bardziej wskazują na większą mądrość. Otrzymałem takie odpowiedzi od osób tak zwanych nietechnicznych, ale nie lubię tego określenia. Od osób, które bardziej kreatywnie podchodzą do pracy bardziej w szerokim spektrum. Natomiast jeżeli zadałem to pytanie znajomym programistom, bardziej otrzymywałem odpowiedzi typu, że definicja mądrości jest nie zdefiniowana dla owoca. Lub też bardziej taką filozoficzną, że mądrość jest to cecha ludzi i warzywa i owoce nie mają takiej właściwości, więc ciężko porównać. No i tu pytanie jak pewnie wszyscy dobrze teraz rozumieją w tej chwili, nie służy do tego, aby faktycznie odpowiedzieć na nie merytoryczne, tylko zastanowić się jaki jest czyiś sposób myślenia. W jaki sposób ktoś analizuje ten temat, w jaki sposób argumentuje swoją wypowiedź niezależnie od tego jaka by była. Myślę, że to bardzo dużo mówi o ludziach, więc bądźmy przygotowani na takie pytania. Nie bójmy się powiedzieć czegoś, co może nie jest do końca poprawną odpowiedzią, ale nie bójmy się uargumentować tego, żeby pokazać w jaki sposób rozumiemy świat, który nas otacza.
Jako kandydat jaki sposób weryfikacji kompetencji technicznych uważasz za najbardziej optymalny, który najbardziej Tobie odpowiada.
Myślę, że ważne jest to, aby taka rozmowa faktycznie zweryfikowała nasze umiejętności. Ważne jest też to, żeby podczas takiej rozmowy dowiedzieć się jakie będą nasze obowiązki. Ponieważ tak jak już mówiłem wcześniej, istnieje wiele firm, które zajmują się tym obszarem, rekrutują na takie stanowiska, ale tak naprawdę nie do końca wiedzą, na czym to wszystko polega. I jeżeli ktoś naprawdę chce mieć stanowisko Data Scientist’a i robić rzeczy związane z tym, rozwijać się w tym obszarze, to myślę, że jego wybór też nie powinien paść na firmę, która tylko wpisała taki tytuł w tytule ogłoszenia. Więc myślę, że na takiej rozmowie też można się wiele dowiedzieć. Ale trzeba oczywiście zapytać. Jakie są te obowiązki? Jaki jest zakres obowiązków zespołu? Czym ten zespół się zajmuje? Czy jest infrastruktura, która w ogóle wspiera takie zespoły analityczne? No i oczywiście jak jest biznes firmy, ponieważ będąc data scientist’em to jest trochę inna sprawa jeżeli trafimy do firmy sprzedażowej, marketingowej. Inna jest jeżeli trafimy do banku. To też zmienia w pewien sposób wymogi, które firma powinna oczekiwać od potencjalnego pracownika. Więc wydaje mi się, że. Rozmowa powinna wyglądać tak, żeby zarówno jedna, jak i druga strona dowiedziały się o sobie jak najwięcej i mówię o tych istotnych rzeczach.
OK, czyli raczej w trakcie tej rozmowy będzie też ta weryfikacja kompetencji. Raczej jakieś zadania typu hometaski, tak? Czyli te prace domowe to niekoniecznie jest to coś, co Tobie leży? Tak?
Jeśli chodzi o zadania do domu. Myślę, że można je podzielić na takie duże dwie kategorie. Takie duże zadania, jak duże zadania otwarte, w których musimy rozwiązać jakiś problem analityczny. Dostajemy powiedzmy jakiś zbiór danych, lub dane musimy pobrać samemu i mamy przygotować jakiś raport, jakąś analize. To jest jedna rzecz. Druga rzecz to są zadania zamknięte. Często jest ich więcej i zazwyczaj są mniejsze, zebrane w formie takiego quizu, testu. Wydaje mi się, że firmy trochę odchodzą od tego pierwszego podejścia, że coraz częściej gdzieś na tych rozmowach raczej się słyszy o quizach/testach, które później są oceniane i następnie jest rozmowa, która weryfikuje troszkę bardziej te pytania, na które odpowiedzieliśmy źle, ale też niekoniecznie. Może osoba, rekruter czy też osoba techniczna biorąca udział w procesie dopytać o te pytania, na które udzieliliśmy poprawnej odpowiedzi – jak je uzasadniamy? Natomiast te duże zadania – ich zaletą jest to, że można troszkę głębiej spojrzeć na to, jak ktoś organizuje swoją pracę, jak pobiera dane, przetwarza je, jak dostarcza i prezentuje raport z czegoś takiego, to będzie bardziej przypominało jego codzienną pracę. Natomiast takie procesy są bardziej czasochłonne i w przypadku firm, które mają dużą konkurencję i potrzebują szybko zebrać zespół na nowo powstający projekt to niekoniecznie jest dobre rozwiązanie, bo przez to kandydaci będą mniej chętni do rozwiązywania tak dużych zadań. Być może zajmie ten proces troszkę dłużej, przez co sama rekrutacja będzie mniej efektywna. Więc to już pytanie do rekruterów, czy mogą sobie na to pozwolić?
A co Twoim zdaniem powinna zawierać oferta pracy, żeby zachęciła Cię do wzięcia udziału w procesie rekrutacyjnym? Jakie powinna mieć w sobie te elementy? Te haczyki, które zadecydują o tym, że klikniesz ten przycisk „Aplikuj”?
Wydaje mi się, że na pewno marka firmy, jeżeli jest to firma, o której gdzieś słyszałem. Tak było w przypadku Allegro, to na pewno to zachęca. Natomiast jeśli chodzi o treść, to wydaje mi się, że tutaj oczekuję konkretów. Oczekuję obowiązków, które przede mną stoją. Wyzwań, jakim będę musiał sprostać. Konkretnych zadań, nad którymi będę pracował. Fajnie, jeżeli jest też opis zespołu, opis zespołów, z którymi współpracuję, no i oczywiście biznes. Duże firmy, o których każdy słyszał wcześniej, no to do tego akurat może niekoniecznie jest potrzebne. Chociaż jeżeli jest to jakiś dział, który zajmuje się bardzo konkretnymi rzeczami, to też warto może trochę spacyfikować. Natomiast myślę, że to są ważne rzeczy, na które z pewnością patrzę, bo to trochę określa to, jak będzie wyglądała moja praca. Bo przyznajmy szczerze, nie jest istotne, że będę musiał się zajmować analizami, dostarczać raporty, budować modele. Na tym polega ta praca. Natomiast to, co wyróżnia pracę w danej firmie? Myślę, że to jest kluczowe.
Coraz więcej osób i firm pracujących z danymi decyduje się na przejście z R na Pythona. Jakie inne trendy Ty widzisz w tym obszarze?
Z pewnością jest to to, że firmy zaczynają rozróżniać różne stanowiska, różne obszary, które są związane z Data. I że ta struktura, która w nich się buduje, też pewien sposób na to odpowiada. Narzędzia. Myślę, że jeśli chodzi o narzędzia, to to nie jest jakieś najbardziej kluczowe w tych wszystkich trendach, ponieważ one się same zawsze zmieniają. W przypadku R i Pythona myślę, że skala jest odpowiedzią na pytanie „dlaczego Python?” Ponieważ wspiera on wiele procesów, które są w stanie wesprzeć infrastrukturę danych, a nie tylko pozwolić na analitykę i wizualizację i przetwarzanie danych w niskiej skali.
Istnieje również takie pojęcie jak Big Data i mówi się, że to duże zbiory danych. Ale w którym momencie według Ciebie możemy używać tego określenia? Jakie wyzwania i zarówno możliwości niesie ze sobą big data w firmie, czy może ogólnie nawet w biznesie?
Jeśli chodzi o Big Data to jest taka fajna zasada 3 V i mówi ona o Velocity, Volume, Variety. Czyli rozmiar, szybkość danych powiedzmy jak one szybko napływają, jakie jest ich natężenie oraz variety czyli różnorodność. Jeżeli te trzy aspekty występują w takim zbiorze danych, możemy mówić o Big Data. Chociaż tutaj definicji pewnie znajdziemy całe multum, ale skupiłbym się na tej drugiej części pytania, czyli możliwości jakie niesie, bo to jest kluczowe. Firma, która ma w swoich zasobach taki zbiór Big Data może go wykorzystać, ale żeby to zrobić, potrzebny jest cały szereg narzędzi, cały szereg działań, które te dane w odpowiedni sposób przetwarzą. Ja pracując jako freelancer, często spotykałem się z takimi projektami, gdzie przychodziła do mnie osoba i mówiła, że ma dane, chce coś z nimi zrobić. Ja pytam „ale jakie dane?”. Dużo. No to nie jest Big Data jeszcze. To nie jest odpowiednie podejście. To, że danych jest dużo to nic, jeszcze dobrego o nich nie świadczy. Jeżeli jest ich dużo są ustrukturyzowane, jeżeli są w odpowiedni sposób przetwarzane. Jeżeli jest wysoka dbałość o to, żeby ich jakość była wysoka. Wtedy można się zastanowić, co z nimi dalej, a pewne okresy analizy tego, co należy zrobić jest potrzebne. Później można budować na ich podstawie produkty czy też wspierać decyzje biznesowe. Ale zanim to nastąpi, to trzeba się dobrze przyjrzeć, co te dane ze sobą niosą.
Wydaje się, że przyszłość pracy. Jest ściśle powiązana z machine learning. Badanie wykazało, że 73% firm na całym świecie w jakimś zakresie zastosuje uczenie maszynowe do końca tego, czyli 2022 roku. Czy mógłbyś podać może kilka przykładów w jakich sytuacjach już dzisiaj powszechnie używamy machine learningu?
Myślę, że jest takich zastosowań cała masa. Oczywiście pierwsze co przychodzi mi na myśl, to są silniki rekomendacyjne. To, że wchodzimy na naszą ulubioną stronę z filmami i wyświetla nam się nowy film, który dziwnym trafem strasznie nam się podoba i od razu w niego klikamy. To, że na stronach z ubraniami pojawiają się ciuchy, które nam się podobają, że jakieś zakupy, które robiłem w internecie to wszystko bardzo często dzieje się za sprawą silników rekomendacji, które badają zależności między naszymi preferencjami a preferencjami innych podobnych użytkowników. Medycyna, w której też ten wpływ analityki jest mega ważny… Rozmawiałem ze znajomymi, którzy są na medycynie, bądź niedawno skończyli. Mówią, że nie chcą iść na radiologię, ponieważ czują, że tam komputery zaczną przejmować prym w tym jak ten obszar medyczny działa. Ponieważ ta analityka się mega rozwija i często czyta się o kolejnych osiągnięciach, więc wydaje mi się, że tych obszarów, które nas na co dzień dotykają jest coraz więcej, nawet w obszarze rekrutacji. Przecież szukanie kandydatów… Wyobraźmy sobie, że aktywnie szukamy kandydata na stanowisko dyrektora. Przeszukiwanie całego internetu jest jest strasznie trudnym zadaniem. Dopasowanie jednego z tysięcy kandydatów na te 1 stanowisko. Myślę, że tutaj również jest pole dla uczenia maszynowego, żeby wprowadzić coś nowego. Więc be ready.
Mam nadzieję, że machine learning nie wygryzie rekruterów, bo to byłby dla nas dosyć duży ból.
Z całą pewnością! Myślę, że tutaj Wasza rola jest nieoceniona. Natomiast uważam, że te obowiązki, które macie, te zadania, które robicie, mogą się w pewien sposób zmienić. I tak jak w przypadku wielu innych dziedzin, uczenie maszynowe stanie się pomocnym narzędziem, które te procesy usprawni, a nie wygryzie też osoby, które nad tym pracują.
Okej. Czyli raczej nie powinniśmy się tego obawiać, a bardziej po prostu z ekscytacją patrzeć w przyszłość tak?
Przygotować się i śledzić najnowsze trendy. Zobaczyć, czy nie pojawiają się jakieś narzędzia, które wspierają te procesy.
No i na sam koniec chciałabym się Ciebie podpytać, do czego w przyszłości będą bardziej wykorzystywane dane. Słyszeliśmy już o takich akcjach, chociażby na Facebooku usłyszało się o tym, że kampanie polityczne są skierowane na konkretne grupy odbiorców. Więc zastanawiam się, czy te nasze dane są bardziej narażone na jakieś podobne sytuacje w przyszłości. Jak myślisz?
To jest świetny przykład podałaś. Z tym, że jesteśmy bardzo mocno targetowani różnego rodzaju informacjami i myślę, że to ten przykład, o którym mówisz. To jest wykorzystanie takich ludzkich słabości. To, że jesteśmy bardzo podatni na różnego rodzaju bias’y. I teraz te nowe pokolenie, które jest na świecie, wydaje mi się, że w pewien sposób rozumie trochę bardziej te procesy. Natomiast problem jest w przypadku starszych osób, które niekoniecznie są świadome tego, że nasza percepcja lubi nas oszukać. Żyjemy w takich czasach, gdzie ten natłok informacji potrafi nami miotać na lewo i na prawo. W zależności od tego, co przeczytamy na jakiejś grupce na Facebooku od tego, co pojawi się gdzieś tam w jakimś filmiku, który nam się wyświetli na telefonie. Zmieniamy nasze pojmowanie świata diametralnie. Wydaje mi się, że tutaj jest duża odpowiedzialność po naszej stronie, żeby niezależnie od tego co przeczytamy, zobaczymy mieć jakieś ustalone zasady, reguły, którymi się kierujemy w życiu. Bo to nie jest problem z danymi czy z algorytmami. To jest problem tego, bardziej taki socjologiczny, że kierowanie tym społeczeństwem, takie procesy odbywały się zawsze. Teraz po prostu są narzędzia, które pozwalają robić to szybciej i na większą skalę. Jeśli chodzi natomiast o bezpieczeństwo, które również jest istotnym aspektem, tutaj tak samo wydaje mi się, że nie problemem są algorytmy, tylko problemem są ludzie, którzy starają się je w zły sposób wykorzystać. Więc aktualizujcie swoje hasła regularnie. Nie używajcie prostych haseł z serii „Lista Top 100 najpopularniejszych haseł w internecie.” Nie udostępniajcie informacji o sobie na stronach, które wydają Wam się podejrzane. Nie klikajcie dziwnych linków. To są takie podstawy, o których się mówi, ale wiadomo każdemu się zdarzy zapomnieć, więc należy sobie raz na jakiś czas o tym przypomnieć. Natomiast jeśli chodzi o to, czy ktoś preferuje profilowanie czy nie, często rozmawiam o tym ze znajomymi i różne są podejścia. Może to zależeć nawet od produktu, bo ktoś może z chęcią posłuchać rekomendowanych utworów na serwisie muzycznym, ale niekoniecznie chce, żeby jakaś strona rekomendowała mu dom, w okolicy w której chce zamieszkać, albo produkty w sklepie, w którym sobie coś kupuje. Więc tutaj należy czytać też zgody, na które się zgadzamy. I w przypadku, gdy nie odpowiada nam takie profilowanie, zawsze możemy zrezygnować. Te polityki myślę, że w Polsce są na lepszym poziomie niż w innych krajach. Jest to pilnowane, więc jeżeli coś nam nie odpowiada, to zawsze możemy się od tego odwołać i taką decyzję po prostu anulować.
Czyli w skrócie można powiedzieć bądźmy uważni i bądźmy ostrożni tak?
Tak, jak zawsze w Internecie.
I tym pozytywnym akcentem myślę, że możemy zakończyć. Ja Ci bardzo dziękuję Mateusz za rozmowę. Jeszcze raz gorąco zachęcamy wszystkich do tego, żeby zobaczyli kurs, który Mateusz przygotował i życzymy Wam miłego wchodzenia w ten świat Data.
Dzięki wielkie za rozmowę.