Благодаря Data Science мы можем контролировать взлёты и посадки в самых больших аэропортах, можем анализировать и прогнозировать появление эпидемий без врачей. Благодаря не только современной технике, но и тем обученным программам, которые в ней установлены, доктора могут практически безошибочно ставить сложные диагнозы в некоторых отраслях медицины. Более того, у нас даже есть беспилотный транспорт и с каждым годом он лучше и умнее! Предлагаем вам не оставаться в стороне от такой интересной и перспективной науки и стать на сторону её развития.

 

 

Ядро науки о данных

Программа дополнительного образования от Udacity «DataAnalyst» (платно и на английском).

Если у вас есть желание подстроить программу образования под себя, то это будет бесплатно. Предлагаем следующую последовательность бесплатных курсов, входящих в программу выше:

  • Введение в инференциальную статистику;
  • Введение в описательную статистику;
  • Введение в аналитическую обработку данных (с применением NumPy и Pandas);
  • Введение в первичную обработку данных;
  • SQL для аналитической обработки данных;
  • MongoDB для аналитической обработки данных (при возможности и желании можно изучить аналитическую обработку данных с помощью языка R.);
  • Введение в Машинное обучение;
  • Визуализация данных и работа с D3.js;
  • A/B тестирование.
  •  

    Дополнительные курсы на русском языке

    • Введение в базы данных (при возможности и желании можно изучить анализ данных в R [первая и вторая части]);
    • СУБД;
    • Алгоритмы и структуры данных;
    • Методы обработки больших данных.

     

    Машинное обучение

  • Введение в машинное обучение;
  • Обучение работе с TensorFlow с применением в реальных приложениях;
  • Машинное обучение и масштабирование;
  • Нейронные сети и машинное обучение.
  •  

    Разработка программного обеспечения

    Python

  • Тестирование и отладка;
  • Использование Git и GitHub для контроля версий;
  • Создание реактивных аналитических веб-приложений на Python (статья).
  •  

    R

    Разработка программного обеспечения на R (ниже перечислены отдельные курсы, входящие в состав программы по обучению разработке программного обеспечения на языке R).

  • Программное окружение и R;
  • Продвинутый уровень написания программ на R;
  • Сборка пакетов на R;
  • Сборка инструментов визуализации данных.
  •  

    Дополнительные материалы

  • Введенние в Hadoop и MapReduce;
  • Python как инструмент доступа к веб-данным.
  • Dataquest

    Для кого этот курс: для новичков в Data Science — включая тех, кому большие данные необходимы для работы над бизнес-проектами. При выборе программы студент должен определить, насколько ему знаком Python.

  • «Введение в машинное обучение» от «Яндекса» и ВШЭ на Coursera.

    Для кого этот курс: для тех, кого не пугают слова «матрица», «вектор» и «производная». Для выполнения практических заданий потребуются базовые навыки программирования. Очень желательно знать Python. Задания рассчитаны на использование этого языка и его библиотек numpy, pandas и scikit-learn.

    Чтобы успешно завершить курс, нужно набрать проходную сумму баллов за тесты и практические задания, а также выполнить финальный проект, посвящённый решению прикладной задачи анализа данных.

  • Не обязательно пытаться освоить всё и сразу. Есть мнение, что для Data Scientist’a достаточно знать только Python, а без R можно обойтись. Другие считают наоборот. В любом случае, пробуйте, выбирайте то, что вам ближе и у вас несомненно всё получится.

     

    Источники tproger.ru и rb.ru

     

    Вступай в сообщества ITmentor Вконтакте, Facebook и Telegram