Lokakarya Dasar-dasar Pengolahan Data menggunakan MS Excel dan R - Penelitian Unggulan Program Studi (PUPS)
Instruktur: Gede Primahadi Wijaya Rajeg (26 - 29 Juli 2021)
- Lisensi materi lokakarya
- Pendahuluan
- Pokok bahasan
- Instalasi peranti untuk lokakarya
- Cara mengunduh materi lokakarya
- Daftar pustaka
Materi
lokakarya dalam repositori GitHub ini diberikan lisensi
Creative
Commons Attribution-NonCommercial-ShareAlike 4.0 International
License.
Harap memberikan kutipan berikut jika materi (data dan kode pemrograman R) pada repositori ini (Rajeg 2021) digunakan untuk aktivitas akademik lebih lanjut:
Rajeg, Gede Primahadi Wijaya. (2021, July 24). Lokakarya pengolahan data mendasar dengan MS Excel dan R (Version 1.0). Zenodo. http://doi.org/10.5281/zenodo.5131785
Lokakarya daring ini ditujukan untuk dua orang anggota peneliti mahasiswa (Putu Dea Indah Kartini dan I Gede Semara Dharma Putra) yang menjadi bagian dari Penelitian Unggulan Program Studi (PUPS) berjudul MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA pada Program Studi Sastra Inggris, Fakultas Ilmu Budaya, Universitas Udayana, Bali. Untuk mendapatkan latar belakang lebih rinci terkait topik penelitian, berikut ini rekaman presentasi proposal dan seminar untuk sebagian hasil penelitian (Rajeg, Rajeg, Putra, et al. 2021a). Hasil utuh penelitian tersebut dapat diakses secara terbuka melalui arikel jurnal (Rajeg and Rajeg 2022), makalah prosiding (Rajeg, Rajeg, Kartini, et al. 2021), dan laporan penelitian (Rajeg, Rajeg, Putra, et al. 2021b).
Dalam lokakarya ini, anggota peneliti mahasiswa mendapat pelatihan dan pemahaman dasar dalam pengelolaan dan analisis data kuantitatif menggunakan Microsoft Excel dan bahasa pemrograman R (R Core Team 2021). Data yang digunakan dalam lokakarya ini berasal dari sebagian data penelitian tersebut.
Tujuan diadakannya lokakarya ini adalah untuk membekali mahasiswa bidang humaniora keterampilan dasar dalam pengolahan data dan analisis kuantitatif mendasar menggunakan peranti komputasional mutakhir untuk penelitian mereka nantinya (mis. dalam penulisan tugas akhir). Hal ini penting karena penelitian-penelitian dalam bidang ilmu humaniora, khususnya bahasa/linguistik, setakat ini mulai memanfaatkan data kebahasaan berukuran besar (yaitu korpus bahasa), serta menggabungkan pendekatan kuantitatif dan kualitatif.
Berikut ini adalah pokok-pokok bahasan dalam lokakarya kali ini:
- Hari Pertama
- Pemahaman tentang keteraturan pengorganisasian data (tidy data) (Wickham 2014; Broman and Woo 2018).
- Penyimpanan data kebahasaan dan analisis kualitatif terkait variabel-variabel linguistik yang dikaji (coding/annotation) dalam MS Excel (Broman and Woo 2018).
- Menyarikan secara kuantitatif hasil analisis kualitatif dalam MS Excel menggunakan pivot table.
- Mengekspor data dalam format MS Excel ke dalam format Tab-separated Plain Text untuk nantinya diolah menggunakan R.
- Hari Kedua - Hari Keempat
- Pengenalan dasar R, mengunggah data tabel ke R, dan eksplorasi dasar. (H2)
- Menyarikan secara kuantitatif (mis. menghitung hasil observasi dari) analisis kualitatif dengan R. (H3)
- Visualisasi dasar (mis. diagram batang) untuk variabel nominal/kategorikal/kualitatif. (H4)
Peranti yang diperlukan untuk lokakarya ini adalah MS Excel, R, dan juga RStudio. R dan RStudio dapat diunduh secara gratis.
Setelah mengunduh R dan RStudio, silakan install packages dari
tidyverse
(Wickham et al.
2019) melalui console R. Package tidyverse
adalah suatu ekosistem mutakhir dan populer saat ini di R untuk
pengolahan data (data science) (Wickham and Grolemund
2017). Ketik kode berikut lalu tekan ENTER untuk
menginstal tidyverse
(instalasi memerlukan internet):
install.packages("tidyverse")
atau install satu persatu package tersebut (disarankan menggunakan cara sebelumnya):
install.packages(c("dplyr", "tidyr", "ggplot2", "readr", "stringr", "purrr", "tibble", "forcats"))
Gambar-gambar berikut menunjukkan proses instalasi tidyverse
yang
sedang berjalan melalui konsol aplikasi R (untuk Windows) – Kontribusi
tangkapan layar berikut berasal dari Ketut Santi Indriani, S.S., M.Hum
(Prodi Sastra Inggris, Fakultas Ilmu Budaya, Universitas Udayana).
-
Proses instalasi sedang berjalan (1)
-
Proses instalasi sedang berjalan (2)
-
Proses instalasi completed (ditandai dengan keterangan “the downloaded binary packages are in ….”)
Untuk memastikan package tidyverse
telah terinstal, jalankan kode
library(tidyverse)
pada konsol R. Gambar berikut akan muncul:
-
Kunjungi laman: https://github.com/gederajeg/pups-english-dept-workshop
-
Kemudian, perhatikan kotak hijau bertuliskan
Code
. Klik tanda panah putih kecil pada kotak hijau tersebut, lalu pada kotak dialog yang keluar, pilihDownload ZIP
. Perhatikan gambar berikut: -
Selanjutnya silakan ekstraksi (unzip) berkas ZIP tersebut jika, setelah mengunduh, tidak secara otomatis diekstraksi/di-unzip.
-
Kemudian, materi lokakarya akan terdapat dalam direktori (folder) dengan nama
pups-english-dept-workshop-main
. Perhatikan gambar berikut:Data utama untuk lokakarya ditunjukkan oleh berkas bernama
ROB_sample_conc_main.xlsx
(format MS Excel) danROB_sample_conc_main.tsv
(format Tab-separated plain text). Berkas dengan awalan angka 1 - 3 dan diakhiri dengan.R
adalah kode pemrograman R yang berisi langkah-langkah pengolahan data, dan analisis kuantitatif dan visualisasi dasar yang menjadi topik bahasan lokakarya. -
Selanjutnya, klik dua kali berkas dengan nama
2021-05-25-PUPS-ds-workshop.Rproj
untuk membuka peranti RStudio yang berkaitan dengan bahan-bahan lokakarya dalam direktori tersebut. Gambar berikut memperlihatkan tampilan RStudio yang terbuka setelah meng-klik2021-05-25-PUPS-ds-workshop.Rproj
:Panel di pojok kanan bawah menampilkan isi direktori/folder dari
pups-english-dept-workshop-main
.
Broman, Karl W., and Kara H. Woo. 2018. “Data Organization in Spreadsheets.” The American Statistician 72 (1): 2–10. https://doi.org/10.1080/00031305.2017.1375989.
R Core Team. 2021. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.
Rajeg, Gede Primahadi Wijaya. 2021. Lokakarya Pengolahan Data Mendasar Dengan MS Excel Dan R (version v1.0). Zenodo. https://doi.org/10.5281/ZENODO.5131785.
Rajeg, Gede Primahadi Wijaya, and I Made Rajeg. 2022. “A Corpus Linguistic Study of Constructional Equivalence for the Indonesian Translation of ROB and STEAL Based on the OpenSubtitles Parallel Corpus.” PAROLE: Journal of Linguistics and Education 12 (2): 28–48. https://ejournal.undip.ac.id/index.php/parole/article/view/43717.
Rajeg, Gede Primahadi Wijaya, I Made Rajeg, Putu Dea Indah Kartini, and I Gede Semara Dharma Putra. 2021. “Pemanfaatan Bank-Data Digital Dwibahasa Dalam Kajian Terjemahan: Studi Kasus Padanan Bahasa Indonesia Untuk Verba Sinonim Bahasa Inggris ROB & STEAL.” In Prosiding Seminar Nasional Sains Dan Teknologi (SENASTEK) 2021, 0831–35. Bali, Indonesia: Lembaga Penelitian dan Pengabdian kepada Masyarakat (LPPM) Universitas Udayana. https://doi.org/10.6084/m9.figshare.17078369.
Rajeg, Gede Primahadi Wijaya, I Made Rajeg, I Gede Semara Dharma Putra, and Putu Dea Indah Kartini. 2021a. “Derajat Kesepadanan Konstruksional Terjemahan Verba Bahasa Inggris ROB Dalam Bahasa Indonesia.” Paper presented at the Seminar Nasional Bahasa Ibu (SNBI) 2021. https://youtu.be/xQ3YKag8yPw.
———. 2021b. “Model Kajian Terjemahan Berbasis Bank Data Terjemahan Digital Inggris-Indonesia Dan Implikasi Pedagogisnya.” Laporan Penelitian. Denpasar, Bali, Indonesia: Universitas Udayana. https://doi.org/10.31219/osf.io/eaj57.
Wickham, Hadley. 2014. “Tidy Data.” Journal of Statistical Software 59 (1, 1): 1–23. https://doi.org/10.18637/jss.v059.i10.
Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy McGowan, Romain François, Garrett Grolemund, et al. 2019. “Welcome to the Tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.
Wickham, Hadley, and Garrett Grolemund. 2017. R for Data Science. Canada: O’Reilly. http://r4ds.had.co.nz/.