Нормалізація краудсорсингових даних за допомогою Python та Pandas

27 січня 2026 року в межах програми розвитку персоналу Факультету української філології, культури і мистецтва Університету Грінченка відбувся майстер-клас «Нормалізація краудсорсингових даних за допомогою Python та Pandas», який провів кандидат філософських наук, доцент кафедри інформаційних комунікацій Ворожейкін Євген.

Майстер-клас було присвячено роботі з краудсорсинговими даними як специфічним типом емпіричного матеріалу, що широко використовується в сучасних гуманітарних і міждисциплінарних дослідженнях. Теоретична частина майстер-класу була присвячена поняттю краудсорсингу, його ролі в сучасних гуманітарних дослідженнях та етичним і методологічним викликам роботи з такими даними. Практична частина ґрунтувалася на використанні бібліотеки Pandas у середовищі Python та аналізі реального набору даних із платформи Kaggle. У центрі уваги були проблеми якості даних, зокрема наявність дублікатів, пропусків і неоднорідних форматів дат.

Учасники майстер-класу опанували базові підходи до нормалізації краудсорсингових даних перед подальшим аналізом. Зокрема, вони навчилися імпортувати та попередньо досліджувати великі набори даних, видаляти непотрібні стовпці, знаходити й усувати дублікати, а також працювати з відсутніми значеннями. Окрему увагу було приділено складнощам роботи з датами та перетворенню текстових значень у стандартизований формат дати й часу. Під час майстер-класу учасники ознайомилися з відмінностями між «очищенням» і «нормалізацією» даних, що має особливе значення для гуманітарних досліджень. У результаті учасники отримали практичні навички, які можуть застосовувати у власних наукових і освітніх проєктах, пов’язаних із аналізом цифрових і краудсорсингових даних.