article-spots
article-carousel-spots
programs
Матеріали
Data Science: матеріали для самопідготовки
4 трав 2021

Сфера Data Science останні кілька років приваблює все більше і більше розробників-початківців, й недаремно. Праця Data Science фахівців впливає на всі сфери життя людей, починаючи з реклами й закінчуючи медициною, а це, в свою чергу, забезпечує розробнику постійний потік захоплюючих завдань. Щоб з легкістю опанувати базис Data Science, можна скористатися добіркою матеріалів, яку склали наші спеціалісти. 

Книги та портали  

  • Python Machine Learning, S. Raschka and V. Mirjalili 

Ця книга користується величезною популярністю серед розробників-початківців завдяки тому, що складні концепції в ній пояснюють простою мовою, а між теорією та практикою збережено грамотний баланс. Це чудова відправна точка для тих, хто тільки починає занурення у Machine Learning і Data Science та хоче навчитися розбиратися в їх базових поняттях. 

  • Глубокое обучение, Николенко С., Кадурин А. 

Максимум інформації, мінімум коду — саме так можна описати цю книгу з Deep Learning. Вона торкається математичних аспектів навчання нейронних мереж, тому не варто очікувати легкого розважального читання. Втім, не дивлячись на складність матеріалу, книга не «впадає» в академізм і намагається докладно пояснити найскладніші ідеї.  

  • Deep Learning for Computer Vision with Python, Dr. Adrian Rosebrock 

Якщо вас цікавить царина Computer Vision, варто звернути увагу на цю книгу. У ній розглядаються як ази навчання комп’ютерному зору, так і побудова нейронних мереж, глубоке навчання й навіть свертові нейронні мережі (Convolutional Neural Networks). Книга призначена для спеціалістів-початківців, хоча має ще два томи для тих, хто хоче глибше зануритися в дану сферу.  

  • Pattern Recognition and Machine Learning, C. M. Bishop 

На перший погляд, ця книга з теорії розпізнавання образів (Pattern Recognition) може видатися складною, проте ще в анотації вона заспокоює майбутніх читачів — для її опанування не потрібні глибокі знання в ML або PR, достатньо добре знати лінійну алгебру, багатовимірний аналіз та дещицю теорії ймовірностей. Ідеальний посібник для студентів технічних спеціальностей або ж просто шанувальників математики.  

  • Deep Learning, I. Goodfellow, Y. Bengio and A. Courville 

Одну з найсвіжіших й водночас глибоких книг про Deep Learning написано простою мовою і тому вона підійде читачам з будь-яким рівнем підготовки. Її вважають «настільною книгою» будь-якого Data Science спеціаліста завдяки структурності викладення інформації, чималій порції математики, та що вже там — захопленому відгуку Ілона Маска, де він називає її «єдиним вичерпним матеріалом» в сфері DS. 

Дошка на Medium, присвячена Data Science та всім її аспектам, де постійно публікуються корисні практичні матеріали для розробників. Настійно рекомендуємо слідкувати за виходом нових статей і сміливо звертатися туди за надійною інформацією від фахівців зі сфери DS. 

Практика  

Платформа від Google, яка функціонує як майданчик для спілкування і система проведення змагань для розробників. Тут можна приймати участь у публічних конкурсах від великих компаній, щоб отримати досвід роботи над практичними завданнями — від аналізу поведінки користувачів (anti-fraud систем) до розпізнавання deep fake-ів. 

Ще один продукт від Google — середовище запуску коду на Python безпосередньо у браузері. Зручне хмарне рішення, до того ж безкоштовне, яке позиціонують як продукт для дослідників у галузі штучного інтелекту.  

Відкрита платформа для спеціалістів з DS з усього світу, де є як безплатні курси з Machine Learning, Neural Learning та Deep Learning, які вважаються базовими (і найкращими) для старту, так і класичні змагання з розпізнавання мови, орієнтування за фото, трекінгу фігур у режимі реального часу і т.д.  

Платформа для проведення змагань, серед організаторів яких — найбільші російські компанії. Формат проведення змагань стандартний: за призовий фонд можуть боротися всі учасники платформи, а серед завдань — передбачення поведінки користувачів у додатку, аналіз характеру людини і навіть прогнозування сейсмічної активності.  

Курси 

Формат онлайн навчання прекрасно підходить для молодих фахівців, який шукають структурованості знань та доступності викладення. З усього розмаїття безкоштовних або недорогих курсів дуже складно обрати матеріали дійсно варті уваги — тому ми зібрали, на наш погляд, найбільш якісні онлайн заняття на популярних платформах. Теми, яким присвячені багато з цих курсів, перетинаються, але це лише привід повторити пройдену інформацію, поглянути на неї під іншим кутом і довідатися щось нове для себе. 

Величезний плюс онлайн курсів — більшість з них надають учням сертифікати про проходження, які потім можна показати рекрутеру на підтвердження своїх знань. Тим не менше, ми не радимо захоплюватися їх колекціонуванням, оскільки найважливішим аспектом при прийомі на роботу є реальний досвід розробки: pet проєкти, участь у хакатонах або призове місце в одному з DS\ML змагань на перелічених вище порталах справлять на рекрутера набагато більше враження.  

Coursera  

ODS  

EPAM University Programs  

Ідеальним поєднанням теорії та практики є програми від EPAM University, де під час першої частини навчання формується теоретична база, а потім у Pre-Production Лабораторії, ці знання застосовуються на практиці. Ми вітаємо самостійну освіту, однак без крутого наставника прогрес у Data Science буде повільним і хаотичним — ми ж пропонуємо повне занурення у нову професію під керівництвом досвідчених спеціалістів компанії. Щоб приєднатися до нас, не потрібно напам’ять вивчати всі наведені матеріали: достатньо впевненно володіти Python, а також знати, що таке алгоритми і структури даних (пошук, сортування, списки, черги, стеки, і т.п.), добре розуміти лінійну алгебру, оптимізацію, теорію ймовірностей і математичну статистику.