In [1]:
library(tidyverse)
library(readxl)

-- [1mAttaching packages[22m --------------------------------------- tidyverse 1.3.0 --

[32m<U+221A>[39m [34mggplot2[39m 3.2.1     [32m<U+221A>[39m [34mpurrr  [39m 0.3.3
[32m<U+221A>[39m [34mtibble [39m 2.1.3     [32m<U+221A>[39m [34mdplyr  [39m 0.8.3
[32m<U+221A>[39m [34mtidyr  [39m 1.0.0     [32m<U+221A>[39m [34mstringr[39m 1.4.0
[32m<U+221A>[39m [34mreadr  [39m 1.3.1     [32m<U+221A>[39m [34mforcats[39m 0.4.0

-- [1mConflicts[22m ------------------------------------------ tidyverse_conflicts() --
[31mx[39m [34mdplyr[39m::[32mfilter()[39m masks [34mstats[39m::filter()
[31mx[39m [34mdplyr[39m::[32mlag()[39m    masks [34mstats[39m::lag()



# Data Preparation
## Rice Export

In [7]:
path <- "../data/trade/export_1006_th.xls"

export_1006 <- read_excel(path, skip=1, na = c("-","",0)) %>%
    gather("type_year", "amount", -(1:7)) %>%
    na.omit(cols="amount")

head(export_1006)

hscode,name,country_code,country_name_th,country_name_en,month,month_th,type_year,amount
<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<dbl>
1006100102,ข้าวเปลือกเจ้า,BD,บังกลาเทศ,Bangladesh,10,ต.ค.,vol2541,11950
1006200104,ข้าวกล้องอื่นๆ 100 %,BE,เบลเยียม,Belgium,1,ม.ค.,vol2541,1763000
1006200104,ข้าวกล้องอื่นๆ 100 %,BE,เบลเยียม,Belgium,2,ก.พ.,vol2541,1634000
1006200104,ข้าวกล้องอื่นๆ 100 %,BE,เบลเยียม,Belgium,3,มี.ค.,vol2541,1268500
1006200104,ข้าวกล้องอื่นๆ 100 %,BE,เบลเยียม,Belgium,4,เม.ย.,vol2541,1655500
1006200104,ข้าวกล้องอื่นๆ 100 %,BE,เบลเยียม,Belgium,5,พ.ค.,vol2541,2832000


## Countries

In [10]:
path <- "../data/_meta/countries.xlsx"

tbl_countries <- read_excel(path, skip=0, na = c("-",""))

head(tbl_countries)

iso2,iso3,m49_code,usda_code,country_name_en_full,country_name_short,country_name_th_full,country_name_th_short,country_name_others,country_name_oae,region,subregion,region_code,subregion_code,currency_code,currency_name,start,end
<chr>,<chr>,<dbl>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<dbl>,<dbl>,<chr>,<chr>,<dbl>,<dbl>
AF,AFG,4,AF,Islamic Republic of Afghanistan,Afghanistan,สาธารณรัฐอิสลามอัฟกานิสถาน,อัฟกานิสถาน,,อัฟกานิสถาน,Asia,Southern Asia,142,34,AFA,Afghanistan Afghani,0,0
AX,ALA,248,,Aland Islands,Aland Islands,หมู่เกาะโอลันด์,หมู่เกาะโอลันด์,,,Europe,Northern Europe,150,154,EUR,Euro,0,0
AL,ALB,8,AL,Republic of Albania,Albania,สาธารณรัฐแอลเบเนีย,แอลเบเนีย,,แอลเบเนีย,Europe,Southern Europe,150,39,ALL,Albanian Lek,0,0
DZ,DZA,12,AG,People’s Democratic Republic of Algeria,Algeria,สาธารณรัฐประชาธิปไตยประชาชนแอลจีเรีย,แอลจีเรีย,,แอลจีเรีย,Africa,Northern Africa,2,15,DZD,Algerian Dinar,0,0
AS,ASM,16,,American Samoa,American Samoa,อเมริกันซามัว,อเมริกันซามัว,,อเมริกันแซมโม,Oceania,Polynesia,9,61,USD,US Dollar,0,0
AD,AND,20,,Principality of Andorra,Andorra,ราชรัฐอันดอร์รา,อันดอร์รา,,,Europe,Southern Europe,150,39,"ESP, FRF, ADP","Spanish Peseta, French Franc, Andorran Peseta",0,0


## HS1006

In [14]:
path <- "../data/_meta/hs1006_th.xlsx"

tbl_hs1006 <- read_excel(path, sheet='hs_rice', skip=0)
tbl_hs1006_group <- read_excel(path, sheet='rice_group', skip=0)

head(tbl_hs1006)
head(tbl_hs1006_group)

hscode,rice_name,organic,varities,milled,parboiled,grade
<chr>,<chr>,<chr>,<chr>,<chr>,<dbl>,<chr>
10061000001,ข้าวเปลือกเจ้า,non-organic,white,paddy,0,others
10061000002,ข้าวเปลือกเหนียว,non-organic,glutinous,paddy,0,others
10061010001,ข้าวเปลือกเจ้า,non-organic,white,paddy,0,others
10061010002,ข้าวเปลือกเหนียว,non-organic,glutinous,paddy,0,others
10061090001,ข้าวเปลือกเจ้า,non-organic,white,paddy,0,others
10061090002,ข้าวเปลือกเหนียว,non-organic,glutinous,paddy,0,others


organic,varities,milled,parboiled,grade,gr1,gr1code
<chr>,<chr>,<chr>,<dbl>,<chr>,<chr>,<dbl>
non-organic,hommali,brown,0,100,hommali,1
non-organic,hommali,brown,0,5,hommali,1
non-organic,hommali,brown,0,10,hommali,1
non-organic,hommali,brown,0,others,hommali,1
non-organic,hommali,brown,0,broken,hommali,1
non-organic,hommali,milled,0,100,hommali,1
