Програма DataMining: підсумки в цифрах

16.11.2015 00:00

"Світом правлять цифри!"

А цифрами керують тільки дійсно обдаровані хлопці. Сьогодні про них і поговоримо.

6 листопада відбувся фінальний конкурс рішень студентів програми DataMining. І як годиться у математиків, будемо висловлюватися цифрами:

- 15 студентів взяли участь в програмі.

Спочатку вони мали теоретичними знаннями і навичками використання прикладних математичних методів. У Noosphere Engineering School вони змогли застосувати свої вміння на реальних прикладах технічно і економічно значущих завдань.

- 10 тижнів знадобилося студентам для того, щоб більш глибоко вивчити області застосування DataMining, основні завдання і методи аналізу, освоїти принципи роботи з необхідним програмним забезпеченням і реалізувати власні ідеї.

- Студенти розбилися на 5 команд.

На початку практичної частини програми вони отримали техзавдання, на виконання якого було відведено 2,5 тижні. Всім командам була дане одне і те ж завдання. Вони отримали результати роботи грабер профілів користувачів соціальної мережі LinkedIn. На підставі цих даних студенти спрогнозували готовність певного користувача змінити роботу. Таким чином визначили, чи має сенс інформувати його про пропозиції рекрутингових компаній.

- 3 члени журі оцінювали презентації команд - Дмитро Майданюк, COO Databrain, Антон Ящук, Analyst Databrain, Юрій Лецер, COO Maxima Labs.

- Оцінка рішень базувалася на 5 критеріях:

підготовка данних
розроблена модель
точність моделі
прикладна значимість результатів
презентація

На основі цих критеріїв члени журі визначили команду-переможця:

Станіслав Драгун, Тарас Совгіренко і Фелікс Чесноков.

Своїми враженнями від першого випуску програми DataMining поділився Олександр Кузенков, ментор програми DataMining:

"Мені сподобався підхід хлопців - вони докладно підійшли до питання підготовки даних. Практично всі команди вирішили використовувати модель логістичної регресії. При цьому, проводячи аналіз, студенти застосували широкий спектр математичних підходів, вивчених в процесі програми.

Рішення запропонованого завдання дає студентам розуміння підходів і методів роботи з великими масивами даних в умовах невизначеності, недостовірності, неповноти і надмірності. Подібні завдання виникають в більшості кейсів аналізу WEB-контенту. Розроблені рішення дають можливість в автоматизованому вигляді виділити цільову аудиторію, агрегувати інформацію і отримати достовірні статистичні дані для проведення різних досліджень."

Слідкуйте за нашими новинами і дізнавайтеся першими про запуск нових наборів в Noosphere Engineering School.