dc.contributor |
Pérez Marín, Ana María |
|
dc.contributor |
Bolancé Losilla, Catalina |
|
dc.creator |
Orgaz Expósito, Álvaro |
|
dc.date |
2018-09-05T10:07:41Z |
|
dc.date |
2018-09-05T10:07:41Z |
|
dc.date |
2018-07 |
|
dc.date.accessioned |
2024-12-16T10:26:37Z |
|
dc.date.available |
2024-12-16T10:26:37Z |
|
dc.identifier |
http://hdl.handle.net/2445/124307 |
|
dc.identifier.uri |
http://fima-docencia.ub.edu:8080/xmlui/handle/123456789/21366 |
|
dc.description |
Treballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2017-2018, Tutors: Ana María Pérez Marín; Catalina Bolancé Losilla |
|
dc.description |
(eng) This bachelor’s degree thesis aims to develop a predictive analytics guide for credit fraud
detection using the Big Data tool Spark. Thus, the essence of this project is structured in three
main linked sections which combine theory and practice.
The first part is a description of the problem and concepts about credit risk as well as its
historical context. The second section contains a theoretical research in predictive algorithms,
frequently known as machine learning1 or artificial intelligence2 models. The third part is a
real case practical application of the studied models for predicting the probability of default
for a given dataset.
However, nowadays one of the most common problems in predictive analytics is the huge
amount of available data, and it gives meaning to the concept of Big Data. Thus, this project
will use the tool Spark, which is an engine for processing Big Data. |
|
dc.description |
(cat) Aquest projecte final de grau pretén desenvolupar una guia sobre algoritmes predictius aplicats
a la detecció del frau creditici utilitzant una eina de Big Data anomenada Spark. Així doncs,
l'essència d'aquest projecte s'estructura en tres seccions enllaçades les quals combinen teoria i
pràctica.
La primera part és una descripció del problema i conceptes sobre el risc creditici així com el
seu context històric. La segona secció conté una investigació teòrica en algoritmes predictius,
freqüentment vinculats als conceptes d’aprenentatge automàtic o models d’intel·ligència
artificial. La tercera part és una aplicació pràctica dels models estudiats a un cas real per
predir la probabilitat d’impagament per a un determinat conjunt de dades.
Malgrat això, actualment un dels problemes més comuns en els projectes d’algoritmes
predictius és la gran quantitat de dades disponibles, la qual cosa dóna sentit al concepte del
Big Data. Així doncs, aquest projecte utilitzarà l'eina Spark, la qual és un motor de
processament de grans quantitats de dades.
En conclusió, aquesta tesi final de grau serà un manual per aquells usuaris que vulguin aprendre
sobre: la detecció i gestió del risc creditici amb algoritmes predictius; la teoria que hi ha darrere
els principals algoritmes en l’àrea de l’aprenentatge automàtic i la intel·ligència artificial; i
l’aplicació d’aquests a un cas real des del plantejament del problema fins a la presa de decisions
(incloent-hi el codi de programació necessari). |
|
dc.format |
70 p. |
|
dc.format |
application/pdf |
|
dc.language |
eng |
|
dc.rights |
cc-by-nc-nd (c) Álvaro Orgaz Expósito, 2018 |
|
dc.rights |
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
|
dc.rights |
info:eu-repo/semantics/openAccess |
|
dc.source |
Treballs Finals de Grau (TFG) - Estadística UB-UPC |
|
dc.subject |
Estadística |
|
dc.subject |
Aprenentatge automàtic |
|
dc.subject |
Risc de crèdit |
|
dc.subject |
Treballs de fi de grau |
|
dc.subject |
Statistics |
|
dc.subject |
Machine learning |
|
dc.subject |
Credit risk |
|
dc.subject |
Bachelor's theses |
|
dc.title |
Guide to Spark Machine Learning for credit scoring |
|
dc.type |
info:eu-repo/semantics/bachelorThesis |
|