Treballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2017-2018, Tutor: Josep Anton Sánchez Espigares
(cat) L'objectiu principal d'aquest treball consisteix a intentar predir el resultat final de la cursa de
la Formula 1 del Gran Premi de Catalunya, realitzada al circuit de Montmeló a l'any 2017. Per
tal de poder complir aquest objectiu, s'ha fet un anàlisi de les sessions de pràctiques prèvies
a la cursa. La base de dades utilitzada s'ha construït a partir de dos documents diferents: un
document que mostra els temps de les voltes realitzades i un altre que indica els tipus de
pneumàtics emprats a cada sessió de pràctiques.
La part més important d'aquest l'estudi recau sobre una exhaustiva depuració de les dades
per tal de poder detectar les simulacions de classificació i de cursa, amb la posterior
construcció d'un model predictiu que pugui ajudar a saber el resultat final a partir de les
variables explicatives de la base de dades. Finalment, també s'ha necessitat utilitzar una
base de dades amb un llistat de les voltes de les pràctiques del Gran Premi de Catalunya de
l'any 2016, i així poder comprovar que els criteris escollits per a la identificació de la
simulació de cursa són vàlids per a dades semblants.
D'aquesta manera, el punt més important és comprovar que les conclusions finals tenen un
sentit coherent i presenten certa concordança amb el resultat real.
(eng) The main objective is to try to predict the final result of the Formula 1 race of the Grand Prix
of Catalonia, at the Montmeló circuit in 2017. In order to be able to carry out this objective,
an analysis has been made of the pre-race practice sessions. The database has been
constructed from two different documents: a document that shows the times of the laps and
another that indicates the types of tires used in each practice session.
The most important part of this study is based on an exhaustive depuration of the data and
to be able to identify the classification and race simulations, with a later construction of a
predictive model that can help to know the final result from the explanatory variables of the
database. Finally, it was also necessary to use another database with a list of the laps of the
practices of the Grand Prix of Catalonia in 2016, and thus to be able to verify that the criteria
chosen for the identification of the race simulation are valid for similar data.
What interests us, then, is to see if the final conclusions make sense and agree with the
actual result.