Hoofdstuk 14 APPENDIX 2: FORMULARIUM
0. Help functie:
In geval van nood, type help(naam functie) en niet vergeten, R is CASE SENSITIVE!
1. Inlezen van gegevens:
Manueel: a<-c(1,2.3,4,…)
Via tab-delimited txt-bestand: a<-read.table(‘naam.txt’,header=T) (niet vergeten juiste directory te selecteren); gebruik niet dezelfde naam voor zowel de dataset als voor een kolom in de dataset; attach(a) om algemeen beschikbaar te maken; names(a) om de namen van de variabelen te zien.
2. Kwantielen en percentielen:
Voor kwantielen (voor welke waarde op de x-as ligt er p procent van de oppervlakte links onder de curve): de letter q, dan de naam van de verdeling en dan de proportie van de oppervlakte die in de linkerstaart van de verdeling moet liggen. Afhankelijk van de gebruikte verdeling moeten bijkomende parameter waarden en evt vrijheidsgraden gegeven worden: binomiaal: qbinom(p,N,pi); normaal: qnorm(p,mean,sd); t-verdeling: qt(p,df); F-verdeling: qf(p,df1,df2); chi-kwadraat: qchisq(p,df).
Voor percentielen (oppervlakte onder de curve links van de waarde q): zelfde syntax als voor kwantielen, maar q vervangen door p, en geen proportie maar waarde op x-as geven: binomiaal: pbinom(q,N,pi); normaal: pnorm(q,mean,sd); t-verdeling: pt(q,df); F-verdeling: pf(q,df1,df2); chi-kwadraat: pchisq(q,df).
3. Basis functies:
Gemiddelde: mean(x); variantie: var(x); standaarddeviatie: sd(x); aantal observaties: length(x); mediaan: median(x); five number summary: fivenum(x); logaritme: log(x); vierkantswortel: sqrt(x); functies toepassen op verschillende groepen: tapply(x,groep,functie) (bvb tapply(gewicht,geslacht,mean) berekent het gemiddelde gewicht voor beide geslachten).
4. Figuren:
scatterplot: plot(x,y); stem and leaf plot: stem(x); boxplot: boxplot(x) of opgesplitst per groep boxplot(x~groep); normal probability plot: qqnorm(x) en qqline(x); toevoegen regressielijn aan scatterplot: abline(lm(y~x)).
5. Het one-sample probleem:
t.test(x,alternative=”richting”) wilcox.test(x,alternative=”richting”) Opm: vervang richting door greater, less of two.sided afhankelijk van de hypothese.
6. Het two-sample probleem:
t.test(x,y,alternative=”richting”,var.equal=T,paired=T) OF t.test(z~groep,alternative=”richting”, var.equal=T,paired=T) wilcox.test(x,y,alternative=”richting”,paired=T) OF wilcox.test(z~groep,alternative=”richting”,paired=T) Opm: vervang richting door greater, less of two.sided afhankelijk van de hypothese EN zet var.equal=T OF F afhankelijk van het al dan niet gelijk zijn van de varianties [homoscedasticity, zie var.test(x,y) OF var.test(z~groep)] EN zet paired=T OF F afhankelijk van of het al dan niet om gepaarde data gaat. Bij gepaarde data kan je ook eerst het verschil berekenen en het dan als een one-sample probleem beschouwen.
7. ANOVA:
Niet vergeten het formaat van de factoren evt. om te vormen met de functie A<-as.factor(A)! One-way ANOVA: lm1<-lm(yA) anova(lm1) TukeyHSD(aov(yA)) [OF evt.: pairwise.t.test(y,A,p.adj=’bonferroni’)] bartlett.test(y~A) shapiro.test(lm1$residuals) In geval van random effects ANOVA: zelfde syntax, berekening variantie: