Программа DataMining: итоги в цифрах

16.11.2015 00:00

"Миром правят цифры!"

А цифрами управляют только действительно одарённые ребята. Сегодня о них и поговорим.

6 ноября состоялся финальный конкурс решений студентов программы DataMining. И как полагается у математиков, будем изъясняться цифрами:

15 студентов приняли участие в программе.

Изначально они обладали теоретическими знаниями и навыками использования прикладных математических методов. В Noosphere Engineering School они смогли применить свои умения на реальных примерах технически и экономически значимых задач.

10 недель понадобилось студентам для того, чтобы более глубоко изучить области применения DataMining, основные задачи и методы анализа, освоить принципы работы с необходимым программным обеспечением и реализовать собственные идеи.

- Студенты разбились на 5 команд.

В начале практической части программы они получили техзадание, на выполнение которого было отведено 2,5 недели. Всем командам была дана одна и та же задача. Они получили результаты работы грабера профилей пользователей социальной сети LinkedIn. На основании этих данных студенты спрогнозировали готовность определённого пользователя сменить работу. Таким образом определили, имеет ли смысл информировать его о предложениях рекрутинговых компаний.

3 члена жюри оценивали презентации команд - Дмитрий Майданюк, COO Databrain, Антон Ящук, Analyst Databrain, Юрий Лецер, COO Maxima Labs.

- Оценка решений базировалась на 5 критериях:

  1. подготовка данных
  2. разработанная модель
  3. точность модели
  4. прикладная значимость результатов
  5. презентация

На основе этих критериев члены жюри определили команду-победителя:

Станислав Драгун, Тарас Совгиренко и Феликс Чесноков.

Своими впечатлениями от первого выпуска программы DataMining поделился Александр Кузенков, ментор программы DataMining:

"Мне понравился подход ребят - они обстоятельно подошли к вопросу подготовки данных. Практически все команды решили использовать модель логистической регрессии. При этом, проводя анализ, студенты применили широкий спектр математических подходов, изученных в процессе программы.

Решение предложенной задачи дает студентам понимание подходов и методов работы с большими массивами данных в условиях неопределенности, недостоверности, неполноты и избыточности. Подобные задачи возникают в большинстве кейсов анализа WEB-контента. Разработанные решения дают возможность в автоматизированном виде выделить целевую аудиторию, агрегировать информацию и получить достоверные статистические данные для проведения различных исследований."

Следите за нашими новостями и узнавайте первыми о запуске новых наборов в Noosphere Engineering School.