Programming in R for Data Science, learning by doing

Datum
23-03-2020
Locatie
Johan de Witt huis (Utrecht)
Omschrijving

Data: 23 en 30 maart 2020 | Tijd: 23 maart 09.00 - 18.00 uur, 30 maart 09.00 - 17.00 uur | Geaccrediteerd voor 14 PE-punten | Prijs: Euro 1599



Informatie
Inleiding

Wereldwijd wordt het softwarepakket R door verzekeraars en pensioenfondsen ingezet bij data analyse. De training vormt het fundament onder uw kennis over en vaardigheid met R.

 

Doelgroep

Actuarieel professionals, beginnend data scientists en studenten die gaan starten met de opleiding tot actuaris (EMAS en AEMAS).

 

Doel

Tijdens de cursus ga je, onder leiding van dr. Katrien Antonio, zelf aan de slag met R én verken je de mogelijkheden van pricing analytics in R. Actuele casuïstiek maakt deze tweedaagse training interessant vanwege de directe toepasbaarheid in je eigen werkgebied.

 

Programma maandag 23 maart 2020

 

08.30 uur               

Ontvangst

 

09.00 – 13.00 uur   

Verkenning van de R-omgeving; CRAN en R packages; RStudio editor; documentatie voor R; het gebruik van R in het actuariële werk; een overzicht van handige rapportage tools (R markdown en bookdown)

                             

Crash course R syntax

                             

Objecten en data structures (bijv. vector, data.frame) en het werken met verschillende data types (bijv. numeric, character, factor, dates, times).

                             

Data sets in R: import, export, beheer, manipulaties (subsetting, adding/removing variables, recoding, rbind, cbind, aggregating and reshaping), cleaning. Data wrangling aan de hand van pipes en de tidyverse in R.

 

13.30 – 18.00 uur

Grafische mogelijkheden van R: basis functionaliteiten (bijv. histogram, barcharts, grafische parameters) en het gebruik van ggplot2, exploratory data analysis.

 

Functies schrijven in R: syntax en argumenten, conditionals en control flow, logische operatoren, loops en vectorized thinking.

 

Programma maandag 30 maart 2020

 

08.30 uur               

Ontvangst

 

09.00 – 13.00 uur 

Basis statistiek in R (bijv. mean, variance, correlation, densities).

 

Werken met kansverdelingen in R (bijv. simuleren, pdf, cdf, kwantielen, momenten).

 

Maximum Likelihood Estimation: het schatten van verdelingsparameters.

 

Putting it all together: het opzetten van simulaties.

 

13.30 – 17.00 uur   

Lineaire regressiemodellen (LMs).

 

Veralgemeende lineaire regressiemodellen (GLMs).

 

Pricing analytics in R adhv GLMs en GAMs voor frequency en severity data.

 

Werken met regression trees in R.

                           

Eigen laptop

Je wordt verzocht een eigen laptop mee te nemen met daarop de software R geïnstalleerd. Software R kan je gratis downloaden via de website www.r-project.org.  Rstudio kan je downloaden via de website www.rstudio.com. 

 

Docent

Dr. Katrien Antonio is hoogleraar actuariaat aan KU Leuven en associate professor aan de Universiteit van Amsterdam. Haar onderzoek richt zich op insurance analytics met bijzondere interesse in pricing, reserving en sterftemodellering.

 

Algemene informatie

Inschrijfprocedure

Accreditatie

Annuleren

Facturatie