Skip to content
View arseniybartenev's full-sized avatar

Block or report arseniybartenev

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
arseniybartenev/README.md

Привет, я Арсений Бартенев 👋

Я Data Scientist / ML-инженер из Санкт-Петербурга. В своих проектах решаю реальные бизнес-задачи с помощью машинного обучения и анализа данных.

🛠 Мой стек технологий

Языки: Python, SQL
Анализ данных: Pandas, NumPy, SciPy, Matplotlib, Seaborn
Машинное обучение: Scikit-learn, CatBoost, LightGBM, XGBoost
Deep Learning / NLP: PyTorch, Transformers (BERT), ResNet, Computer Vision
Работа с данными: PostgreSQL, Feature Engineering, EDA, A/B тестирование
Инструменты: Git, Jupyter

🔭 Мои проекты

Здесь собраны проекты, демонстрирующие мои навыки в разных областях Data Science:

🤖 Computer Vision & Deep Learning

  • retail_image_classification — классификация товаров для ритейла (Fashion-MNIST и Fruits). Точность 99.95% на Fruits с fine-tuned ResNet50.
  • age_detection_retail — определение возраста покупателей по фото для персонализации и проверки возраста. MAE 6.37.
  • classification_of_toxic_comments — бинарная классификация комментариев с BERT и логистической регрессией. F1 = 0.947.

📈 Прогнозирование (табличные данные, временные ряды)

  • car_price_prediction — предсказание рыночной стоимости авто. Сравнение моделей, CatBoost (RMSE 1697).
  • steel_temperature_prediction — прогноз температуры стали для металлургии. CatBoost (MAE 6.1°C).
  • taxi_order_forecasting — почасовой прогноз заказов такси. CatBoost (RMSE 37.30).
  • oil_well_location_selection — выбор региона для бурения скважин. Линейная регрессия + Bootstrap. Прибыль 491M RUB.
  • milk_yield_and_taste_prediction — прогноз удоя и качества молока для отбора коров.

📊 Анализ данных, EDA, статистика

  • real_estate_eda — исследовательский анализ объявлений о недвижимости в СПб.
  • gofast_scooter_analysis — анализ поведения пользователей кикшеринга и проверка гипотез.
  • borrower_reliability_research — анализ влияния факторов на возврат кредитов.
  • strimchik_game_sales_analysis — анализ продаж видеоигр для рекламных кампаний.
  • music_of_big_cities — сравнение музыкальных предпочтений Москвы и СПб.

🛠 Специализированные проекты

  • investment_analysis_sql — портфолио SQL-запросов для анализа инвестиций (JOIN, оконные функции).
  • ecommerce_customer_personalization — RFM-анализ и сегментация покупателей для персонализации.
  • hr_analytics_care_prediction — прогноз удовлетворенности работой и риска увольнения с SHAP-интерпретацией.

📫 Как со мной связаться

⚡ Интересные факты

  • Люблю решать задачи, которые приносят реальную бизнес-ценность.
  • Постоянно учусь новому: сейчас углубляюсь в MLOps и большие языковые модели.

Pinned Loading

  1. steel_temperature_prediction steel_temperature_prediction Public

    ML project predicting final steel temperature in metallurgy. Achieved MAE 6.1°C with CatBoost after feature engineering and EDA. Includes model comparison, hyperparameter tuning, and business recom…

    Jupyter Notebook 1

  2. age_detection_retail age_detection_retail Public

    Computer vision model to estimate customer age from photos. Uses fine-tuned ResNet50, achieves MAE 6.37 (<8 target). Enables personalized offers and age verification for alcohol sales.

    Jupyter Notebook

  3. classification_of_toxic_comments classification_of_toxic_comments Public

    Binary classification of toxic comments for Wikishop's wiki system. Achieved F1=0.947 on test set using BERT embeddings + SMOTE + logistic regression, exceeding target 0.75. Includes preprocessing,…

    Jupyter Notebook

  4. hr_analytics_care_prediction hr_analytics_care_prediction Public

    Dual-task HR analytics project: predicting employee job satisfaction and turnover risk using Decision Tree (SMAPE 13.74) and Random Forest (ROC-AUC 0.87) with SHAP interpretation. Helps reduce unex…

    Jupyter Notebook

  5. investment_analysis_sql investment_analysis_sql Public

    SQL Portfolio: investment data analysis (funds, startups, acquisitions). Demonstrating skills: basic queries, aggregation, JOINs, subqueries, window functions, CASE. All queries are well-structured…

  6. taxi_order_forecasting taxi_order_forecasting Public

    This project forecasts hourly taxi orders at airports using ML on time-series data. After resampling and feature engineering (lags up to 168h, rolling means), CatBoost achieves best RMSE of 37.30, …

    Jupyter Notebook