Bahasa Pemrograman R Dijelaskan

R adalah bahasa pemrograman sumber terbuka dan lingkungan perangkat lunak untuk komputasi statistik dan grafik. Ini adalah salah satu bahasa utama yang digunakan oleh ilmuwan data dan ahli statistik. Ini didukung oleh R Foundation for Statistics Computing dan komunitas besar pengembang open source. Karena R menggunakan antarmuka baris perintah, mungkin ada kurva pembelajaran yang curam bagi beberapa individu yang terbiasa menggunakan program yang berfokus pada GUI seperti SPSS dan SAS sehingga ekstensi ke R seperti RStudio bisa sangat bermanfaat. Karena R adalah program open source dan tersedia secara gratis, terdapat daya tarik besar bagi akademisi yang aksesnya ke program statistik diatur melalui asosiasi mereka ke berbagai perguruan tinggi atau universitas.

Instalasi

Hal pertama yang Anda perlukan untuk memulai dengan R adalah mengunduhnya dari situs resminya sesuai dengan sistem operasi Anda.

Alat dan Paket R Populer

  • RStudio adalah lingkungan pengembangan terintegrasi (IDE) untuk R. Ini mencakup konsol, editor penyorotan sintaks yang mendukung eksekusi kode langsung, serta alat untuk merencanakan, riwayat, debugging, dan manajemen ruang kerja.
  • Jaringan Arsip R Komprehensif (CRAN) adalah sumber terkemuka untuk alat dan sumber daya R.
  • Tidyverse adalah kumpulan paket R yang dirancang untuk ilmu data seperti ggplot2, dplyr, readr, tidyr, purr, tibble.
  • data.table adalah implementasi basis yang data.frameberfokus pada peningkatan kinerja dan sintaks yang ringkas dan fleksibel.
  • Kerangka kerja mengkilap untuk membangun aplikasi web bergaya dasbor di R.

Tipe Data di R

Vektor

Ini adalah urutan elemen data dengan tipe dasar yang sama. Sebagai contoh:

> o  p  q  o;p;q [1] 1.0 2.0 5.3 6.0 -2.0 4.0 [1] "one" "two" "three" "four" "five" "six" [1] TRUE TRUE FALSE TRUE FALSE

Matriks

Ini adalah kumpulan data persegi dua dimensi. Komponen dalam matriks juga harus memiliki tipe dasar yang sama seperti vektor. Sebagai contoh:

> m = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE) > m >[,1] [,2] [,3] [1,] "a" "a" "b" [2,] "c" "b" "a"

Bingkai Data

Ini lebih umum daripada matriks, di mana kolom yang berbeda dapat memiliki tipe data dasar yang berbeda. Sebagai contoh:

> d  e  f  mydata  names(mydata)  mydata

Daftar

Ini adalah objek-R yang dapat berisi berbagai jenis elemen di dalamnya seperti vektor, fungsi, dan bahkan daftar lain di dalamnya. Sebagai contoh:

> list1  list1 [[1]] [1] 2 5 3 [[2]] [1] 21.3 [[3]] function (x) .Primitive("sin")

Fungsi di R

Sebuah fungsi memungkinkan Anda untuk menentukan blok kode yang dapat digunakan kembali yang dapat dieksekusi berkali-kali dalam program Anda.

Fungsi dapat diberi nama dan dipanggil berulang kali atau dapat dijalankan secara anonim di tempat (mirip dengan fungsi lambda di python).

Mengembangkan pemahaman penuh tentang fungsi R membutuhkan pemahaman tentang lingkungan. Lingkungan hanyalah cara untuk mengelola objek. Contoh penerapan lingkungan adalah Anda dapat menggunakan nama variabel yang berlebihan dalam suatu fungsi, yang tidak akan terpengaruh jika waktu proses yang lebih besar sudah memiliki variabel yang sama. Selain itu, jika suatu fungsi memanggil variabel yang tidak ditentukan dalam fungsi itu akan memeriksa lingkungan tingkat yang lebih tinggi untuk variabel itu.

Sintaksis

Di R, definisi fungsi memiliki beberapa fitur berikut:

  1. Kata kunci function
  2. nama fungsi
  3. parameter masukan (opsional)
  4. beberapa blok kode untuk dieksekusi
  5. pernyataan pengembalian (opsional)
# a function with no parameters or returned values sayHello() = function(){ "Hello!" } sayHello() # calls the function, 'Hello!' is printed to the console # a function with a parameter helloWithName = function(name){ paste0("Hello, ", name, "!") } helloWithName("Ada") # calls the function, 'Hello, Ada!' is printed to the console # a function with multiple parameters with a return statement multiply = function(val1, val2){ val1 * val2 } multiply(3, 5) # prints 15 to the console

Fungsi adalah blok kode yang dapat digunakan kembali hanya dengan memanggil fungsi tersebut. Hal ini memungkinkan penggunaan kembali kode yang sederhana dan elegan tanpa menulis ulang bagian kode secara eksplisit. Ini membuat kode lebih mudah dibaca, mempermudah debugging, dan membatasi kesalahan pengetikan.

Fungsi di R dibuat menggunakan functionkata kunci, bersama dengan nama fungsi dan parameter fungsi di dalam tanda kurung.

The return()fungsi dapat digunakan oleh fungsi untuk mengembalikan nilai, dan biasanya digunakan untuk memaksa terminasi dini dari suatu fungsi dengan nilai yang dikembalikan. Atau, fungsi ini akan mengembalikan nilai cetak akhir.

# return a value explicitly or simply by printing sum = function(a, b){ c = a + b return(c) } sum = function(a, b){ a + b } result = sum(1, 2) # result = 3

Anda juga dapat menentukan nilai default untuk parameter, yang akan digunakan R ketika variabel tidak ditentukan selama pemanggilan fungsi.

sum = function(a, b = 3){ a + b } result = sum(a = 1) # result = 4

Anda juga dapat mengirimkan parameter dalam urutan yang Anda inginkan, menggunakan nama parameter.

result = sum(b=2, a=2) # result = 4

R juga dapat menerima tambahan, parameter opsional dengan '…'

sum = function(a, b, ...){ a + b + ... } sum(1, 2, 3) #returns 6

Fungsi juga dapat dijalankan secara anonim. Ini sangat berguna dalam kombinasi dengan keluarga fungsi 'terapkan'.

# loop through 1, 2, 3 - add 1 to each sapply(1:3, function(i){ i + 1 })

Catatan

Jika definisi fungsi menyertakan argumen tanpa nilai default ditentukan, nilai untuk nilai tersebut harus disertakan.

sum = function(a, b = 3){ a + b } sum(b = 2) # Error in sum(b = 2) : argument "a" is missing, with no default

Variabel yang ditentukan dalam suatu fungsi hanya ada dalam cakupan fungsi itu, tetapi akan memeriksa lingkungan yang lebih besar jika variabel tidak ditentukan

double = function(a){ a * 2 } double(x) # Error in double(x) : object 'x' not found double = function(){ a * 2 } a = 3 double() # 6

Fungsi bawaan di R

  • R hadir dengan banyak fungsi yang dapat Anda gunakan untuk melakukan tugas-tugas canggih seperti pengambilan sampel acak.
  • Misalnya, Anda dapat membulatkan angka dengan round(), atau menghitung faktorialnya dengan factorial().
> round(4.147) [1] 4 > factorial(3) [1] 6 > round(mean(1:6)) [1] 4
  • Data yang Anda berikan ke fungsi disebut argumen fungsi.
  • You can simulate a roll of the die with R’s sample()function. The sample() function takes two arguments:a vector named x and a number named size. For example:
> sample(x = 1:4, size = 2) [] 4 2 > sample(x = die, size = 1) [] 3 >dice dice [1] 2 4 >sum(dice) [1] 6
  • If you’re not sure which names to use with a function, you can look up the function’s arguments with args.
> args(round) [1] function(x, digits=0)

Objects in R

R allows to save the data by storing it inside an R object.

What’s an object?

It is just a name that you can use to call up stored data. For example, you can save data into an object like a or b.

> a  a [1] 5

How to create an Object in R?

  1. To create an R object, choose a name and then use the less-than symbol, <, followed by a minus sign, -, to save data into it. This combination looks like an arrow, <-. R will make an object, give it your name, and store in it whatever follows the arrow.
  2. When you ask R what’s in a, it tells you on the next line. For example:
> die  die [1] 1 2 3 4 5 6
  1. You can name an object in R almost anything you want, but there are a few rules. First, a name cannot start with a number. Second, a name cannot use some special symbols, like ^, !, $, @, +, -, /, or *:
  2. R also understands capitalization (or is case-sensitive), so name and Name will refer to different objects.
  3. You can see which object names you have already used with the function ls().

More Information:

  • Learn R programming language basics in just 2 hours with this free course on statistical programming
  • An introduction to web scraping using R
  • An introduction to aggregates in R: a powerful tool for playing with data