Senin, 15 April 2019

Manipulasi Date SQL Server

CAST(CAST(year(golivedate) AS varchar) + '-' + CAST(month(golivedate) AS varchar) + '-' + CAST(1 AS varchar) AS DATETIME) as period

Selasa, 09 April 2019

Hubungan Jenis Kelamin dengan Total Belanja dengan t.test


Berdasarkan kasus diatas kita akan melihat hubungan antara data kategorik dan numerik, yaitu variabel jenis kelamin dan total belanja. Sebelum menguji hubungannya, sebaiknya dilihat perbedaan rata-rata total belanja untuk laki-laki dan perempuan dengan visualisasi yaitu menggunakan boxplot. Boxplot grafik statistik dari data dengan komponen lima ukuran statistik yaitu Min, Q1,Q2, Q3, dan Max. Untuk lebih jelasnya mengenai boxplot dapat dilihat gambar dibawah ini
Selanjutnya analisis inferensia yaitu untuk mengetahui apakah ada perbedaan rata-rata total belanja pada laki-laki dan perempuan maka digunakan statistik uji t-test.
Untuk melakukan visualisasi boxplot dan uji statistik t-test pada R tahapannya sebagai berikut
boxplot(Total~Jenis.Kelamin,data = data_intro)
t.test(Total~Jenis.Kelamin,data = data_intro)
Function boxplot digunakan untuk melihat secara grafik rata-rata total belanja pada laki-laki dan perempuan, sedangkan perintah t.test digunakan untuk melihat hubungan secara statistik. Penggunaan kedua fungsi diatas yaitu variabel pertama yang bertipe numerik, sedangkan variabel kedua variabel kategorik. Hipotesis t-test sebagai berikut :
  • Null hipotesis : tidak ada perbedaan rata-rata total belanja antara laki-laki dan perempuan
  • Hipotesis alternatif : ada perbedaan rata-rata total belanja antara laki-laki dan perempuan

Hubungan Produk dengan Tingkat Kepuasan dengan chisq.test


Berdasarkan kasus diatas kita akan melihat hubungan antara data kategorik dan kategorik, yaitu variabel jenis produk dan tingkat kepuasan. Sebelum menguji hubungannya, sebaiknya dilakukan tabulasi silang sebagai analisis deskriptif. Selanjutnya analisis inferensia yaitu menguji apakah ada hubungan maka dapat digunakan chi-square test.
Untuk melakukan tabulasi dan uji statistik chi-square test pada R tahapannya sebagai berikut
table(data_intro$Produk,data_intro$Tingkat.Kepuasan)
chisq.test(table(data_intro$Produk,data_intro$Tingkat.Kepuasan))
Perintah table untuk melihat tabulasi antar variabel kategorik, sedangkan perintah chisq.test digunakan untuk melihat hubungan secara statistik.

Hubungan Pendapatan dengan Total Belanja dengan cor.test


Setelah melihat hubungan variabel pendapatan dengan total belanja menggunakan scatter plot diatas maka kita akan mengujinya, apakah benar-benar pendapatan memiliki pengaruh positif terhadap total belanja
Untuk melakukan uji korelasi pada R menggunakan perintah
cor.test(data_intro$Pendapatan,data_intro$Total)
Berikut penjelasan function diatas:
  • Function cor.test digunakan untuk melihat hubungan secara statistik.
  • Pada korelasi test untuk mengujinya kita memakai t-test. Dengan hipotesis sebagai berikut:
    • H0 : tidak ada hubungan antara pendapatan dan total belanja.
    • Ha : terdapat hubungan antara pendapatan dan total belanja
Tugas Praktek
Lengkapi bagian [...1...] pada code editor untuk seperti yang ada pada bagian Lesson.
Jika berhasil maka keluaran akan sebagai berikut.
> cor.test(data_intro$Pendapatan,data_intro$Total)

 Pearson's product-moment correlation

data:  data_intro$Pendapatan and data_intro$Total
t = 3.1168, df = 18, p-value = 0.005957
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.2026033 0.8197871
sample estimates:
      cor 
0.5920437 

Refresh Dasar Statistik

Hipotesis : https://www.slideshare.net/rhandyprasetyo/statistikauji-hipotesis
Korelasi : https://dsmlmdblog.blogspot.com/2016/03/pengertian-dan-perhitungan-korelasi.html

Pengertian dan Perhitungan Korelasi Pearson Product Moment

Dalam penelitian tertentu, terkadang kita perlu mengetahui bagaimana hubungan antara objek yang kita amati dengan objek yang lainnya. Untuk mengetahui hubungan tersebut, dapat dilakukan analisis korelasi. Dalam postingan saya kali ini, saya akan membahas mengenai pengertian, cara, dan analisis perhitungan korelasi. Bagian kali ini yang akan saya bahas yaitu mengenai analisis korelasi linear sederhana atau biasa disebut dengan simple linear correlation atau Pearson product moment correlation.

Pada umumnya, korelasi berasal dari dua kata, yaitu "Co-" dan "Relation". Kata "Co-" menunjukkan bersama, bergabung, sepasang, atau derajat/tingkat yang sama. Dan "relation" menunjukkan relasi, dampak atau hubungan. Jadi secara umum, definisi korelasi menurut penggunaan statistika merupakan metode untuk mengetahui hubungan antara faktor-faktor atau variabel-variabel yang diamati. Penggunaan korelasi sering sekali dikenal sebagai metode untuk melihat adanya kekuatan, bentuk arah, dan besarnya hubungan antar variabel, serta mengetahui erat atau tidaknya hubungan antar variabel. Dalam matematika, korelasi disimbolkan dengan ρ (rho) sebagai populasi atau r sebagai sampel.

Metode yang paling dasar digunakan untuk mengetahui hubungan antar variabel yaitu korelasi linear sederhana atau korelasi Pearson product moment. Korelasi linear sederhana merupakan metode korelasi yang digunakan untuk mengukur arah dan kekuatan hubungan 2 variabel. Rumus umum korelasi linear sederhana atau korelasi pearson product moment didefinisikan sebagai berikut:



dengan n merupakan banyaknya sampel atau observasi pada data,  dan  merupakan jumlah nilai dari faktor/variabel X dan Y dari observasi/sampel ke-1 hingga ke-n.

Koefisien korelasi berada diantara -1 hingga 1. Koefisien korelasi menandakan arah serta kekuatan hubungan antar variabel. Arah korelasi antar variabel ditunjukkan dari tanda pada hasil koefisien korelasi. Apabila koefisien korelasi bertanda positif (+), maka:
-Apabila nilai variabel ditingkatkan, maka akan meningkatkan nilai variabel yang lain
-Apabila nilai variabel diturunkan, maka akan menurunkan nilai variabel yang lain

Apabila koefisien korelasi bertanda negatif (-), maka:
-Apabila nilai variabel ditingkatkan, maka akan menurunkan nilai variabel yang lain
-Apabila nilai variabel diturunkan, maka akan meningkatkan nilai variabel yang lain

Koefisien korelasi bertanda positif (+) menunjukkan arah hubungan yang searah, sementara koefisien korelasi bertanda negatif (-) menunjukkan arah hubungan yang berlawanan. Selain itu kekuatan korelasi antara variabel ditunjukkan dari rentang nilai pada hasil koefisien korelasi, baik positif maupun negatif. Berikut ini merupakan kekuatan korelasi antar variabel dari selang-selang tertentu menurut Walpole (2004):

NoSelang Koefisien KorelasiKekuatan Hubungan
10.0 ≤ r < 0.2Sangat Lemah
Tidak ada hubungan (|r| = 0) 2 0.2 ≤ r < 0.4 Lemah 3 0.4 ≤ r < 0.6 Sedang/Biasa 4 0.6 ≤ r < 0.8 Kuat 5 0.8 ≤ r < 1.0 Sangat Kuat
Sempurna (|r| = 1)
Dalam scatter plot, arah dan kekuatan hubungan antar variabel dapat digambarkan sebagai berikut:
Arah dan Kekuatan Korelasi Berdasarkan Scatter Plot
Gambaran umum arah dan kekuatan korelasi berdasarkan Scatter Plot
Berdasarkan hasil diatas menunjukkan arah korelasi (kiri) dan kekuatan korelasi (kanan) berdasarkan scatter plot (plot pencaran). Arah korelasi yang positif (positive correlation) ditunjukkan dengan kumpulan titik-titik yang membentuk pola linear naik ke atas kanan. Arah korelasi yang negatif (negative correlation) ditunjukkan dengan kumpulan titik-titik yang membentuk pola linear turun ke ke bawah kanan. Sementara tidak ada korelasi (no correlation) ditunjukkan dengan korelasi yang membentuk selain dua pola linear tersebut, seperti pola vertikal, pola horizontal, maupun pola yang lainnya. Kekuatan korelasi yang kuat (strong correlation) ditunjukkan dengan sekumpulan titik-titik yang saling berdekatan satu sama lain, sementara kekuatan korelasi yang lemah (weak correlation) ditunjukkan dengan sekumpulan titik-titik yang saling berjauhan satu sama lainnya.

Agar paham bagaimana cara menghitung korelasi antar variabel, berikut ini merupakan data mengenai permintaan suatu komoditi (satuan) dan harga rata-rata komoditi (satuan). Permintaan suatu komoditi didefinisikan sebagai variabel X dan harga rata-rata komoditi didefinisikan sebagai variabel Y. Data berikut sudah dihitung nilai X2, Y2, dan XY serta jumlah dari semua variabelnya.


NoX
(Permintaan Suatu Komoditi)
Y
(Rata-Rata Harga Komoditi)
X^2Y^2XY
1178105316841102518690
2224105501761102523520
3160130256001690020800
4315130992251690040950
5229130524411690029770
6250150625002250037500
7181150327612250027150
8306170936362890052020
9257170660492890043690
10300180900003240054000
Jumlah24001420604072207950348090

Berdasarkan hasil tabel diatas diperoleh nilai:







Nilai-nilai tersebut dimasukkan ke formula korelasi Pearson product moment (korelasi linear sederhana) sebagai berikut:




Berdasarkan hasil perhitungan korelasi Pearson product moment diatas menunjukkan bahwa koefisien Korelasi antara permintaan suatu komoditi (X) dengan harga rata-rata komoditi (Y) sebesar 0.5477 dengan hubungan antara permintaan suatu komoditi dengan harga rata-rata komoditi memiliki tingkat hubungan yang menengah sehingga apabila ditambahkan permintaan suatu komoditi maka akan mempengaruhi peningkatan harga rata-rata suatu komoditi. Sebaliknya, apabila dikurangkan permintaan suatu komoditi maka akan mempengaruhi penurunan harga rata-rata suatu komoditi.

Ilustrasi lain dengan kasus yang sama (Kasus hubungan antara permintaan suatu komoditi (X) dengan harga rata-rata komoditi (Y) dengan nilai data yang berbeda, setelah dilakukan perhitungan hasil koefisien korelasinya menunjukkan nilai -0.8096, bagaimana interpretasinya? Hubungan antara permintaan suatu komoditi dengan harga rata-rata komoditi memiliki tingkat hubungan yang sangat kuat sehingga apabila ditambahkan permintaan suatu komoditi maka akan mempengaruhi penurunan harga rata-rata suatu komoditi. Sebaliknya, apabila dikurangkan permintaan suatu komoditi maka akan mempengaruhi peningkatan harga rata-rata suatu komoditi.

Demikian pengertian dan perhitungan korelasi Pearson product moment atau korelasi linear sederhana yang bisa saya sampaikan dalam blog ini. Semoga bermanfaat.