Я Data Scientist / ML-инженер из Санкт-Петербурга. В своих проектах решаю реальные бизнес-задачи с помощью машинного обучения и анализа данных.
Языки: Python, SQL
Анализ данных: Pandas, NumPy, SciPy, Matplotlib, Seaborn
Машинное обучение: Scikit-learn, CatBoost, LightGBM, XGBoost
Deep Learning / NLP: PyTorch, Transformers (BERT), ResNet, Computer Vision
Работа с данными: PostgreSQL, Feature Engineering, EDA, A/B тестирование
Инструменты: Git, Jupyter
Здесь собраны проекты, демонстрирующие мои навыки в разных областях Data Science:
- retail_image_classification — классификация товаров для ритейла (Fashion-MNIST и Fruits). Точность 99.95% на Fruits с fine-tuned ResNet50.
- age_detection_retail — определение возраста покупателей по фото для персонализации и проверки возраста. MAE 6.37.
- classification_of_toxic_comments — бинарная классификация комментариев с BERT и логистической регрессией. F1 = 0.947.
- car_price_prediction — предсказание рыночной стоимости авто. Сравнение моделей, CatBoost (RMSE 1697).
- steel_temperature_prediction — прогноз температуры стали для металлургии. CatBoost (MAE 6.1°C).
- taxi_order_forecasting — почасовой прогноз заказов такси. CatBoost (RMSE 37.30).
- oil_well_location_selection — выбор региона для бурения скважин. Линейная регрессия + Bootstrap. Прибыль 491M RUB.
- milk_yield_and_taste_prediction — прогноз удоя и качества молока для отбора коров.
- real_estate_eda — исследовательский анализ объявлений о недвижимости в СПб.
- gofast_scooter_analysis — анализ поведения пользователей кикшеринга и проверка гипотез.
- borrower_reliability_research — анализ влияния факторов на возврат кредитов.
- strimchik_game_sales_analysis — анализ продаж видеоигр для рекламных кампаний.
- music_of_big_cities — сравнение музыкальных предпочтений Москвы и СПб.
- investment_analysis_sql — портфолио SQL-запросов для анализа инвестиций (JOIN, оконные функции).
- ecommerce_customer_personalization — RFM-анализ и сегментация покупателей для персонализации.
- hr_analytics_care_prediction — прогноз удовлетворенности работой и риска увольнения с SHAP-интерпретацией.
- GitHub: @arseniybartenev
- Email: [email protected]
- Telegram: @arseniybartenev
- Люблю решать задачи, которые приносят реальную бизнес-ценность.
- Постоянно учусь новому: сейчас углубляюсь в MLOps и большие языковые модели.