week_22

FNB DATAFEST CHALLENGE

Personalized Solutions Recommender System

Welcome to our solution for the Personalized Solutions Dataquest Challenge, where we built a predictive and recommendation system to enhance user engagement on a financial services platform.

Problem Statement

The challenge was to:

Predict meaningful customer interactions (CLICK, CHECKOUT) from raw behavioral data.
Recommend relevant financial products to users based on their activity and profile.

Dataset Description

Column	Type	Description
`idcol`	User ID	Unique customer identifier
`interaction`	Categorical	DISPLAY, CLICK, CHECKOUT
`int_date`	Date	Date of interaction
`item`	Categorical	Item code
`item_type`	Category	TRANSACT, LEND, INVEST, etc.
`item_descrip`	Text	Description of the item
`page`, `tod`	Context	Time of Day, App Page
`segment`, `beh_segment`	User Features	Broad and detailed segmentation
`active_ind`	Activity	Cold Start, Semi Active, Active

Data Preparation

Date conversion and missing value handling
Created rating: DISPLAY = 0, CLICK = 1, CHECKOUT = 2
Train/Test Split using time-based logic
Categorical encoding and feature scaling

Exploratory Data Analysis (EDA)

Weekly interaction trends visualized for DISPLAY, CLICK, CHECKOUT
Feature correlation heatmap showing influence of segment, item_type, active_ind

Modeling Approaches

Classification Models

Logistic Regression (baseline)
Random Forest
Bagging Classifier
Gradient Boosting

Ensemble Learning

Improved performance using Bagging and Boosting to reduce variance and bias.

Evaluation Metrics

We evaluated models using:

Accuracy
Precision
Recall
F1 Score
AUC-ROC
Log Loss
Precision@10 (for top-N relevance)

Recommendation System

Content-Based Filtering

TF-IDF + Cosine Similarity on item descriptions
Recommended similar items per product

Collaborative Filtering

SVD-based user-item matrix factorization
Suggested items based on similar users’ behaviors

Feature Importance

Key influencing features:

segment
active_ind
item_type

Visualized using:

Random Forest Feature Importance
Permutation Importance

Wow Moments

Transformed interaction into numerical ratings for modeling
Hybrid Recommender System combining content & collaborative filtering
Ensemble visualizations with trend lines
Segment-based insights revealed behavioral drivers
Time-aware test split to simulate real-world predictions
Precision@K focused on top-N quality

Conclusion & Next Steps

Achievements:

Accurate interaction prediction with ensemble methods
Personalized recommendations using hybrid approach

Next Steps:

Add time-series aware modeling
Improve recommendations for cold-start users
Automate pipeline for retraining and monitoring

Authors

Simanga Mchunu
Contact: simacoder@hotmail.com

📁 Project Structure

├── data/
│   └── data.csv
├── notebooks/
│   └── model_training.ipynb
├── src/
│   ├── preprocessing.py
│   ├── modeling.py
│   ├── recommender.py
├── Recommender Presentation.pdf
├── README.md

Name		Name	Last commit message	Last commit date
parent directory ..
data		data
2025 FNB DATAQUEST TOOLKIT_2025.pdf		2025 FNB DATAQUEST TOOLKIT_2025.pdf
Data Challenge FNB.mp4		Data Challenge FNB.mp4
DataQuest 2025-RecommenderSystems_Challenge.pdf		DataQuest 2025-RecommenderSystems_Challenge.pdf
Dataquest_Challenge_RecSys_2025_v1.pdf		Dataquest_Challenge_RecSys_2025_v1.pdf
Figure_1 ML.png		Figure_1 ML.png
Figure_1 feature.png		Figure_1 feature.png
Figure_1 important.png		Figure_1 important.png
Figure_1 modelRand.png		Figure_1 modelRand.png
Figure_1 modela.png		Figure_1 modela.png
Figure_1 recommender.png		Figure_1 recommender.png
Figure_1a.png		Figure_1a.png
Figure_1b.png		Figure_1b.png
Figure_1c.png		Figure_1c.png
Figure_1cor.png		Figure_1cor.png
Figure_1cora.png		Figure_1cora.png
Figure_1h.png		Figure_1h.png
Figure_1model.png		Figure_1model.png
Figure_1now.png		Figure_1now.png
Figure_1per.png		Figure_1per.png
Figure_1precision.png		Figure_1precision.png
Figure_2.png		Figure_2.png
README.md		README.md
Screenshot 2025-05-03 154057.png		Screenshot 2025-05-03 154057.png
Screenshot 2025-05-03 221538.png		Screenshot 2025-05-03 221538.png
Screenshot 2025-05-03 221626.png		Screenshot 2025-05-03 221626.png
Screenshot 2025-05-06 210302.png		Screenshot 2025-05-06 210302.png
Screenshot 2025-05-08 191421.png		Screenshot 2025-05-08 191421.png
Screenshot 2025-05-10 042602.png		Screenshot 2025-05-10 042602.png
Screenshot 2025-05-13 095131.png		Screenshot 2025-05-13 095131.png
Screenshot 2025-05-28 202120.png		Screenshot 2025-05-28 202120.png
Screenshot 2025-05-28 202410.png		Screenshot 2025-05-28 202410.png
Screenshot 2025-05-28 205225.png		Screenshot 2025-05-28 205225.png
Screenshot 2025-05-28 205233.png		Screenshot 2025-05-28 205233.png
Screenshot 2025-05-28 205815.png		Screenshot 2025-05-28 205815.png
Screenshot 2025-05-30 212409.png		Screenshot 2025-05-30 212409.png
Screenshot 2025-05-30 213325.png		Screenshot 2025-05-30 213325.png
Screenshot 2025-05-30 214319.png		Screenshot 2025-05-30 214319.png
Screenshot 2025-05-30 215305.png		Screenshot 2025-05-30 215305.png
Screenshot 2025-05-30 234535.png		Screenshot 2025-05-30 234535.png
dash.py		dash.py
data_dictionary_dataquest_RecSys_2025.pdf		data_dictionary_dataquest_RecSys_2025.pdf
lightweight_reco.py		lightweight_reco.py
local.py		local.py
reco_system.py		reco_system.py
recommender.py		recommender.py
recommender_analysis.py		recommender_analysis.py
recommender_guide.md		recommender_guide.md
recommender_system.py		recommender_system.py
system_rec.py		system_rec.py
system_rec1.py		system_rec1.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

FNB DATAFEST CHALLENGE

Personalized Solutions Recommender System

Problem Statement

Table of Contents

Dataset Description

Data Preparation

Exploratory Data Analysis (EDA)

Modeling Approaches

Classification Models

Ensemble Learning

Evaluation Metrics

Recommendation System

Content-Based Filtering

Collaborative Filtering

Feature Importance

Wow Moments

Conclusion & Next Steps

Achievements:

Next Steps:

Authors

📁 Project Structure

FilesExpand file tree

week_22

Directory actions

More options

Directory actions

More options

Latest commit

History

week_22

Folders and files

parent directory

README.md

FNB DATAFEST CHALLENGE

Personalized Solutions Recommender System

Problem Statement

Table of Contents

Dataset Description

Data Preparation

Exploratory Data Analysis (EDA)

Modeling Approaches

Classification Models

Ensemble Learning

Evaluation Metrics

Recommendation System

Content-Based Filtering

Collaborative Filtering

Feature Importance

Wow Moments

Conclusion & Next Steps

Achievements:

Next Steps:

Authors

📁 Project Structure