## Funkcije i podsetnik za vektori # Zadatak 1: # Napraviti funkciju koja za dati prirodan broj n izracunava zbir svih neparnih # kubova, zakljucno sa n. # Zadatak 2: # Napraviti funkciju koja za dati vektor parne duzine vraca sve vrednosti # koje su deljive sa 3 i koje se nalaze u prvoj polovini elemenata vektora. # Zadatak 3: # Napraviti funkciju koja uporedjuje dva vektora - i vraca 1 ako su svi elementi # redom isti, a 0 ako postoji neka razlika. # Zadatak 4: # Napraviti funkciju koja za dva vektora vraca vrednost prve koordinate koja # je ista za oba. ## Baze podataka (dataframeovi) i matrice # Matrice: M = matrix(c(2, 4, 3, 1, 5, 7), nrow = 2) M # Pristup elementima: M[1,1] M[2,3] # Pristup vektorima vrsta/kolona: M[1,] # prva vrsta M[,2] # druga kolona # Pristup podmatrici prve dve kolone: M[, c(1,2)] # Dataframe: # Dataframe je baza podataka u kojoj su podaci predstavljeni tabelarno, tj. # matricno. Svaka vrsta predstavlja jednu opservaciju (element populacije), a # svaka kolona jedno obelezje (promenljivu). # Pravljenje dataframe-a: df = data.frame(Ime = c('Pera','Mika','Laza'), Ocena = c(4, 3, 5), BrojPoena = c(75, 60, 100)) # Pregled: df View(df) # pregled u novom prozoru - preporucen za velike baze podataka # Pristup moze da se radi isto kao za matrice, ali moze i preko naziva kolona, # tj. obelezja: df$Ime df['Ime'] # Ugradjene baze podataka: # Primer: baza mtcars data(mtcars) #ucitava bazu u okruzenje ?mtcars #informacije o bazi ## Graficko prikazivanje, deskriptivne statistike # Zadatak 1: # U vektoru marke_automobila su date marke svih automobila koji su se pojavili # u americkom casopisu 'Motor Trend' 1974. godine. data(mtcars) marke_automobila = sapply(strsplit(rownames(mtcars), ' '), function(x) x[1]) #a) Odrediti koliko ukupno ima automobila i koliko ima razlicitih marki #b) Prikazati tabelu frekvencija automobila i sacuvati frekvencije #v) Na osnovu frekvencija, prikazati piechart za udeo razlicitih marki #g) Dijagram iz prethodnog dela i nije bas citljiv. Sve marke koje se pojavljuju # samo jednom svrstati u kategoriju 'Other' i ponovo prikazati dijagram. #d) Prikazati trakasti dijagram na osnovu podataka iz prethodnog dela # Zadatak 2 (Histogram): # U bazi mtcars se nalaze podaci o automobilima iz casopisa 'Motor Trend'. # a) Odrediti vektor vrednosti konjske snage svih automobila # b) Nacrtati histogram apsolutnih frekvencija konjske snage automobila # v) Da li je raspodela konjske snage automobila u obliku zvona? # g) Da li je raspodela simetricna. Ako nije, u koju stranu je pomerena? # d) Koliko ima automobila sa konjskom snagom manjom od 150? # dj) Da li mozemo da tvrdimo da vecina automobila ima konjsku snagu vecu od # 300? # e) Nacrtati histogram za broj cilindara - Zasto on nije odgovarajuci za prikaz # podataka u ovom slucaju? Koji dijagram bi bio bolji? # Zadatak 3 (Boxplot) # Proucavana su dva leka, amantadin i rimantadin, koja se koriste u borbi protiv # virusa gripa. Doza od 100mg je data zdravim osobama i izmereno je vreme, # u minutima, koje je potrebno da se dostigne maksimalna koncentracija plazme. # Dobijeni su podaci: amantadin = c(105, 126, 120, 119, 133, 145, 200, 123, 108, 112, 132, 136, 156, 12.4, 134, 130, 130, 142, 170) rimantadin = c(221, 261, 250, 230, 253, 256, 227, 264, 236, 246, 273, 271, 280, 238, 240, 283, 516) #a) Konstruisati boxplot koji prikazuje obe grupe podataka, kao i individualne # boxplotove. Za koji lek je potrebno duze vreme da bi se postigla maksimalna # koncentracija? #b) Odrediti uzoracku sredinu i medijanu za podatke A. #v) Da li postoje autlajeri u skupu A? Ako pretpostavimo da je podatak 12.4 # pogresno zapisan i izbrisemo decimalnu tacku, kako se menjaju prethodni # rezultati? #g) Da li postoje autlajeri u skupu R? Ako ih ima, da li je razumno izbrisati # ih? # Zadatak 4 (dupli histogram) # U bazi podataka iris su date duzina i sirine casicnih i krunicnih listica # za razlicite vrste perunike. #a) Ucitati bazu. Kolika razlicitih vrsta postoji u bazi? #b) Nacrtati histogram duzine casicnih listica za vrste 'setosa' i 'virginica'. #v) Nacrtati histograme jedan preko drugog. Koja vrsta ima duze casicne listice # u proseku? # Zadatak 5 # Gradska opstina je zainteresovana za otvaranje vecernje skole. Da bi utvrdili # da li je to potrebno, uzet je uzorak od 20 zena i 15 muskaraca i zapisane su # njihove godine skolovanja: zene = c(8, 10, 16, 12, 7, 8, 18, 18, 12, 12, 12, 12, 14, 16, 16, 14, 7, 8, 12, 20) muskarci = c(8, 12, 12, 14, 14, 16, 16, 16, 16, 12, 7, 9, 20, 20, 12) #a) Da li godine skolovanja muskarca imaju raspodelu u obliku zvona? Zakljuciti # preko histograma. #b) Odrediti uzoracke sredine oba uzorka. #v) Odrediti prosek obe sredine, da li je on jednak uzorackoj sredini za # objedinjen uzorak? #g) Odrediti medijanu i modu za oba uzorka.