SEGMENTING WITH BIG DATA ANALYTICS AND PYTHON: A QUANTITATIVE EXPLORATORY ANALYSIS OF HOUSEHOLD SAVINGS

Condividiamo l’abstract di un articolo scientifico redatto da Cinzia Genovino – Docente di Marketing management e comunicazione d’impresa presso l’Università Giustino Fortunato

Secondo i bilanci nazionali delle economie più avanzate, nonostante un recente forte calo della ricchezza netta pro capite, le famiglie italiane presentano un tasso più elevato tra le più ricche e meno indebitate d’Europa.

Recentemente, l’epidemia di COVID-19 ha causato un nuovo balzo in avanti nei risparmi delle famiglie in tutto il mondo, in particolare nelle economie avanzate e in Italia.

Questo studio sottolinea che l’utilizzo di strumenti di analisi avanzati, informazioni sul comportamento di risparmio delle famiglie e analisi dei big data può supportare approcci decisionali basati sui dati che affrontano la gestione di relazioni complesse nell’arena finanziaria. In particolare, utilizzando analisi esplorative e predittive basate su big data analytics e machine learning, questo studio mira a fornire un’ampia profilazione dei clienti nel settore del risparmio domestico in Italia, supportando un approccio decisionale basato sui dati. Una profilazione del risparmio delle famiglie è stata definita utilizzando le informazioni fornite dall’analisi dei big data. Per procedere in questa direzione, nella prima fase dello studio sono stati considerati i requisiti hardware e software necessari per eseguire l’elaborazione dei dati.

La raccolta dei dati è stata eseguita secondo il cosiddetto processo di estrazione, trasformazione, caricamento (ETL). Il contributo di questo studio risiede nei risultati ottenuti in termini di analisi dei dati su un dataset che tiene conto del comportamento d’acquisto di quasi 20 milioni di risparmiatori postali. L’algoritmo di clustering è altamente efficiente e si adatta perfettamente a set di dati di grandi dimensioni. Il clustering K-means può essere implementato all’interno del framework computazionale MapReduce. Pertanto, la procedura complessiva qui proposta può essere facilmente estesa ai big data utilizzando il calcolo parallelo e software che implementano MapReduce, come Hadoop e Spark.

Cuomo M.T.; Tortora D.; Colosimo I; Ricciardi Celsi L.; Genovino C; Festa G.; La Rocca M.; (2023)Segmenting with big data analytics and python. A quantitative exploratory analysis of household savings Journal: Technological Forecasting & Social Change  – Elsevier 0040-1625 ( Fascia  A Anvur)

According to the national balance sheets of the most advanced economies, despite a recent sharp decline in per capita net wealth, Italian private households present a higher rate among the wealthiest and least indebted in Europe. Recently, the COVID-19 outbreak caused a new leap in households’ savings worldwide, particularly in advanced economies and Italy. This study underlines that using advanced analytics tools, household saving behaviour information, and big data analytics may support data-driven decision approaches addressing the management of complex relationships in the financial arena. More specifically, using exploratory and predictive analyses based on big data analytics and machine learning, this study aims to provide extensive customer profiling in the household saving sector in Italy, supporting a data-driven decision-making approach. A profiling of household savings has been defined using the information provided by big data analysis. To proceed in this direction, the hardware and software requirements necessary to perform data processing were considered in the first phase of the study. Data collection was performed according to the so-called extract, transform, load (ETL) process. The contribution of this study lies in the results obtained in terms of data analytics over a dataset that accounts for the purchasing behaviour of almost 20 million postal savers. The clustering algorithm is highly efficient and scales well for large datasets. K-means clustering can be implemented within the MapReduce computational framework. Therefore, the overall procedure proposed here can be easily extended to big data using parallel computing and software implementing MapReduce, such as Hadoop and Spark.

 

Diventa uno studente
Unifortunato!

Social

Valutiamo i tuoi crediti formativi e costruiamo insieme il  tuo piano di studi personalizzato

Diventa uno studente
Unifortunato!

Social

Valutiamo i tuoi crediti formativi e costruiamo insieme il  tuo piano di studi personalizzato

PHP Code Snippets Powered By : XYZScripts.com