Skip to content

Vzorčni repozitorij za projekt pri predmetu Analiza podatkov s programom R v študijskem letu 2020/21

License

Notifications You must be signed in to change notification settings

ian-spiller/APPR-2020-21

 
 

Repository files navigation

Analiza podatkov s programom R, 2020/21

Repozitorij z gradivi pri predmetu APPR v študijskem letu 2020/21

  • Shiny Shiny
  • RStudio RStudio

Analiza podjetja Apple v primerjavi s S&P500

Osnovna ideja

Za projektno nalogo bom analiziral podatke podjetja Apple in jih primerjal s borznim indeksom S&P 500. Pogledal bom rast prodaje,neto dobička,knjigovodske vrednosti in dividend od S$P 500 in podjetja Appla v zadnjih 10tih letih, ter primerjal rasti med seboj. Nato bom primerjal še koeficenta P/E (cena/dobiček na delnico),P/B (cena/knjigovodska vrednost na delnico) in profitno maržo od podjetja Appla in S&P500 za zadnjih 10 let. Na zemljevidu sveta bom tudi prikazal prodajo podjetja Apple po svetu.

Potek dela

  • Na podlagi dobljenih podatkov bom naredil analizo parametrov, ki sem jih navedel zgoraj.
  • V grafih bom prikazal rezultate analize.
  • Nato bom z vgrajeno metodo loess in s metodo linearne regresije poskušal napovedati prihodnje dobičke. Poiskal bom povezavo med dobičkom in ceno delnice s pomočjo linearne regresije po metodi najmanjših kvadratov. Iz napovedanega dobička bom tako poskušal napovedati ceno delnice v prihodnje.
  • Nakoncu bom naredil še aplikacijo shiny, kjer bo lahko uporabnik sam določil za katero leto želi napovedati dobičke ter po kakšni metodi.

Tabele

  1. podatki_prodaja_svet- podatki o prodaji in dobičku podjetja Apple po svetu
  • Podatki - spremenljivka: vrsta meritve (Prodaja, dobiček pred davkom)
  • Regija - spremenljivka: kontinent
  • Leto - spremenljivka: leto meritve (število: 2017-2019)
  • Vrednost - meritev: vrednost prodaje in dobička pred obračunanim davkom v miljonih USD (število)
  1. morningstar
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • Podatki - ime meritve (znaki)
  • Vrednost - meritev: vrednosti v USD ali % (število)
  1. yahoo - za uvoz podatkov sem uporabil knjižnico quantmod
  • Najvisja_cena - meritev: najvišja cena Applove delnice decembra vsako leto v USD (število)
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  1. podatki_quandl_pe - za uvoz sem uporabil knjižnico Quandl
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • P.E_SP500 - meritev: P/E koeficient indeksa S&P 500 (število)
  1. podatki_quandl_pb - za uvoz sem uporabil knjižnico Quandl
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • P.B_SP500 - meritev: P/B koeficient indeksa S&P 500 (število)
  1. podatki_quandl_prodaja - za uvoz sem uporabil knjižnico Quandl
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • Prodaja_SP500 - meritev: prodaja vseh podjetji v S&P 500 v milijardah USD (število)
  1. podatki_quandl_earning - za uvoz sem uporabil knjižnico Quandl
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • Earning_SP500 - meritev: dobiček po davkih vseh podjetji v S&P 500 v milijardah USD (število)
  1. podatki_quandl_bv - za uvoz sem uporabil knjižnico Quandl
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • BV_SP500 - meritev: knjigovodska vrednost "delnice" indeksa S&P 500 v USD (vsota vseh knjigovodskih vrednosti na delnico podjetji v S&P 500) (število)
  1. podatki_quandl_dividenda - za uvoz sem uporabil knjižnico Quandl
  • Leto - spremenljivka: leto meritve (število: 2011-2020)
  • Dividenda_SP500 - meritev: vsota vseh dividend v S&P 500 (število)
  1. kontinenti
  • Continent_Name - spremenljivka: ime kontinenta (znaki)
  • Country_Name - spremenljivka: ime države (znaki)
  • GU_A3 - spremenljivka: kratica države (znaki)

Program

Glavni program in poročilo se nahajata v datoteki projekt.Rmd. Ko ga prevedemo, se izvedejo programi, ki ustrezajo drugi, tretji in četrti fazi projekta:

  • obdelava, uvoz in čiščenje podatkov: uvoz/uvoz.r
  • analiza in vizualizacija podatkov: vizualizacija/vizualizacija.r
  • napredna analiza podatkov: analiza/analiza.r

Vnaprej pripravljene funkcije se nahajajo v datotekah v mapi lib/. Podatkovni viri so v mapi podatki/. Zemljevidi v obliki SHP, ki jih program pobere, se shranijo v mapo ../zemljevidi/ (torej izven mape projekta).

Potrebni paketi za R

Za zagon tega vzorca je potrebno namestiti sledeče pakete za R:

  • knitr - za izdelovanje poročila
  • rmarkdown - za prevajanje poročila v obliki RMarkdown
  • shiny - za prikaz spletnega vmesnika
  • DT - za prikaz interaktivne tabele
  • rgdal - za uvoz zemljevidov
  • rgeos - za podporo zemljevidom
  • digest - za zgoščevalne funkcije (uporabljajo se za shranjevanje zemljevidov)
  • readr - za branje podatkov
  • rvest - za pobiranje spletnih strani
  • tidyr - za preoblikovanje podatkov v obliko tidy data
  • dplyr - za delo s podatki
  • gsubfn - za delo z nizi (čiščenje podatkov)
  • ggplot2 - za izrisovanje grafov
  • mosaic - za pretvorbo zemljevidov v obliko za risanje z ggplot2
  • maptools - za delo z zemljevidi
  • tmap - za izrisovanje zemljevidov
  • extrafont - za pravilen prikaz šumnikov (neobvezno)
  • shinythemes - za obliko shiny aplikacije
  • Quandl - za podatke iz qandle
  • quantmod - za podatke iz yahoo-finance

Binder

Zgornje povezave omogočajo poganjanje projekta na spletu z orodjem Binder. V ta namen je bila pripravljena slika za Docker, ki vsebuje večino paketov, ki jih boste potrebovali za svoj projekt.

Če se izkaže, da katerega od paketov, ki ji potrebujete, ni v sliki, lahko za sprotno namestitev poskrbite tako, da jih v datoteki install.R namestite z ukazom install.packages. Te datoteke (ali ukaza install.packages) ne vključujte v svoj program - gre samo za navodilo za Binder, katere pakete naj namesti pred poganjanjem vašega projekta.

Tako nameščanje paketov se bo izvedlo pred vsakim poganjanjem v Binderju. Če se izkaže, da je to preveč zamudno, lahko pripravite lastno sliko z želenimi paketi.

Če želite v Binderju delati z git, v datoteki gitconfig nastavite svoje ime in priimek ter e-poštni naslov (odkomentirajte vzorec in zamenjajte s svojimi podatki) - ob naslednjem zagonu bo mogoče delati commite. Te podatke lahko nastavite tudi z git config --global v konzoli (vendar bodo veljale le v trenutni seji).

About

Vzorčni repozitorij za projekt pri predmetu Analiza podatkov s programom R v študijskem letu 2020/21

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • R 96.7%
  • Dockerfile 3.1%
  • TeX 0.2%