Repositorio Dspace

Guide to Spark Machine Learning for credit scoring

Mostrar el registro sencillo del ítem

dc.contributor Pérez Marín, Ana María
dc.contributor Bolancé Losilla, Catalina
dc.creator Orgaz Expósito, Álvaro
dc.date 2018-09-05T10:07:41Z
dc.date 2018-09-05T10:07:41Z
dc.date 2018-07
dc.date.accessioned 2024-12-16T10:26:37Z
dc.date.available 2024-12-16T10:26:37Z
dc.identifier http://hdl.handle.net/2445/124307
dc.identifier.uri http://fima-docencia.ub.edu:8080/xmlui/handle/123456789/21366
dc.description Treballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2017-2018, Tutors: Ana María Pérez Marín; Catalina Bolancé Losilla
dc.description (eng) This bachelor’s degree thesis aims to develop a predictive analytics guide for credit fraud detection using the Big Data tool Spark. Thus, the essence of this project is structured in three main linked sections which combine theory and practice. The first part is a description of the problem and concepts about credit risk as well as its historical context. The second section contains a theoretical research in predictive algorithms, frequently known as machine learning1 or artificial intelligence2 models. The third part is a real case practical application of the studied models for predicting the probability of default for a given dataset. However, nowadays one of the most common problems in predictive analytics is the huge amount of available data, and it gives meaning to the concept of Big Data. Thus, this project will use the tool Spark, which is an engine for processing Big Data.
dc.description (cat) Aquest projecte final de grau pretén desenvolupar una guia sobre algoritmes predictius aplicats a la detecció del frau creditici utilitzant una eina de Big Data anomenada Spark. Així doncs, l'essència d'aquest projecte s'estructura en tres seccions enllaçades les quals combinen teoria i pràctica. La primera part és una descripció del problema i conceptes sobre el risc creditici així com el seu context històric. La segona secció conté una investigació teòrica en algoritmes predictius, freqüentment vinculats als conceptes d’aprenentatge automàtic o models d’intel·ligència artificial. La tercera part és una aplicació pràctica dels models estudiats a un cas real per predir la probabilitat d’impagament per a un determinat conjunt de dades. Malgrat això, actualment un dels problemes més comuns en els projectes d’algoritmes predictius és la gran quantitat de dades disponibles, la qual cosa dóna sentit al concepte del Big Data. Així doncs, aquest projecte utilitzarà l'eina Spark, la qual és un motor de processament de grans quantitats de dades. En conclusió, aquesta tesi final de grau serà un manual per aquells usuaris que vulguin aprendre sobre: la detecció i gestió del risc creditici amb algoritmes predictius; la teoria que hi ha darrere els principals algoritmes en l’àrea de l’aprenentatge automàtic i la intel·ligència artificial; i l’aplicació d’aquests a un cas real des del plantejament del problema fins a la presa de decisions (incloent-hi el codi de programació necessari).
dc.format 70 p.
dc.format application/pdf
dc.language eng
dc.rights cc-by-nc-nd (c) Álvaro Orgaz Expósito, 2018
dc.rights http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.rights info:eu-repo/semantics/openAccess
dc.source Treballs Finals de Grau (TFG) - Estadística UB-UPC
dc.subject Estadística
dc.subject Aprenentatge automàtic
dc.subject Risc de crèdit
dc.subject Treballs de fi de grau
dc.subject Statistics
dc.subject Machine learning
dc.subject Credit risk
dc.subject Bachelor's theses
dc.title Guide to Spark Machine Learning for credit scoring
dc.type info:eu-repo/semantics/bachelorThesis


Ficheros en el ítem

Ficheros Tamaño Formato Ver

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta