Minggu, 25 Juli 2021

Pengumpulan Data dalam Statistika

 


Pengumpulan Data(Data Collection)

Census

 Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan

Sampling

Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi yang diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik. Di sini sample yang baik adalah sample yang dapat merepresentasikan populasinya. Dibutuhkan teknik sampling yang tepat untuk mendapatkan sample yang representatif terhadap populasinya.

Sampling Error

Karena sample merupakan sub bagian dari populasi, maka selisih atau perbedaan nilai antara data sample dan data populasi akan selalu ada.

Perbedaan atau selisih nilai ini dikenal dengan istilah sampling error.

Bahkan dengan teknik sampling sebaik apapun, sampling error ini tidak dapat dihindarkan.

Sampling: with/without Replacement

Sampling with replacement: Memungkinkan satu anggota populasi untuk terpilih lebih dari satu kali sebagai anggota sample.

Sampling without replacement: Menjamin satu anggota populasi hanya dapat terpilih satu kali saja sebagai anggota sample.

Teknik Sampling (Sampling Techniques)

Teknik sampling dalam bidang statistika:

- Simple Ramdom Sampling
- Stratified Sampling
- Cluster Sampling
- Systematic Sampling
- Convenience Sampling

Sampling Technique: Simple Random Sampling

Simple random sampling merupakan teknik pengumpulan data yang dilakukan secara acak di mana setiap anggota populasi memiliki peluang yang sama untuk dapat terpilih sebagai anggota sample.

Contoh: Terdapat 400 siswa terdaftar di kelas statistika dan kita diminta untuk melakukan sampling secara acak terhadap 10 orang siswa untuk dilibatkan dalam survey. Salah satu cara yang dapat ditempuh adalah dengan memberikan sebuah nomor pada tiap siswa, mulai dari nomor 1 sampai dengan 400. Lalu gunakan random number generator untuk melakukan pemilihan acak sebanyak 10 kali dengan rentang nilai pengacakan mulai dari 1 sampai dengan 400.

Sampling Technique: Stratified Sampling



- Stratified sampling merupakan teknik pengumpulan data secara acak yang dilakukan dengan         
  terlebih dahulu membagi anggota populasi ke dalam beberapa kelompok berdasarkan kesamaan
  karakteristik tertentu (e.g., rentang usia, jenis kelamin, tingkat pendapatan, etc).

- Kelompok yang terbentuk ini biasa dikenal dengan istilah strata.

- Selanjutnya anggota dari tiap strata tersebut akan dipilih secara acak untuk dijadikan anggota
   sample.

- Perlu diingat agar sampling yang dilakukan di tiap strata haruslah proporsional dengan proporsinya    dalam populasi.



Contoh : Dilakukan survey terhadap 100 orang mahasiswa baru terkait preferensi mereka dalam memilih menu makan siang. Dari populasi mahasiswa baru ini, dihasilkan dua buah strata berdasarkan jenis kelamin (pria dan wanita). Mengacu pada data penerimaan mahasiswa, didapati 3500 mahasiswa baru yang terdaftar dengan persentase jumlah mahasiswa pria dan wanita adalah 55%-45%. Oleh karenanya survey ini akan melibatkan 55 mahasiswa pria dan 45 mahasiswa wanita yang dipilih secara acak.

Sampling Technique: Cluster Sampling



1. Cluster sampling merupakan teknik pengumpulan data secara acak yang dilakukan dengan
    membagi anggota populasi ke dalam beberapa kelompok berdasarkan pengelompokkan yang
    sudah terbentuk (e.g., area geografis, kecamatan, kelurahan, etc).

2. Kelompok yang terbentuk ini biasa dikenal dengan istilah cluster.

3. Selanjutnya anggota dari tiap cluster tersebut akan dipilih secara acak untuk dijadikan anggota
    sample.

4.Perlu diingat agar sampling yang dilakukan di tiap cluster haruslah proporsional dengan
   proporsinya dalam populasi.

Contoh : Dilakukan pendataan jenis dan jumlah kendaraan bermotor yang dimiliki oleh tiap keluarga di wilayah Kecamatan Suka Jaya. Karena wilayah kecamatan ini terbagi ke dalam 7 kelurahan; maka pendataan dilakukan secara acak di tiap kelurahan dengan jumlah sample yang proporsional sesuai dengan persentase jumlah warga di tiap kelurahannya.

Sampling Technique: Systematic Sampling



Systematic sampling merupakan teknik pengumpulan data berdasarkan interval tertentu. Teknik sampling ini terbilang cukup mudah untuk diterapkan. Hanya saja teknik ini tidak dapat diterapkan bila ditemui adanya pola yang sifatnya konsisten dan sistematis pada data kita.

Contoh: Survey terkait kepuasan pelanggan mini market yang dilakukan terhadap setiap pengunjung dengan interval kedatangan 10. Dengan kata lain, bila pengunjung yang sedang dilibatkan dalam survey saat ini adalah pengunjung ke 5, maka pengunjung berikutnya yang akan dilibatkan dalam survey adalah pengunjung ke 15.

Sampling Technique: Convenience Sampling



Convenience sampling merupakan teknik pengumpulan data yang bisa dibilang asal atau sembrono dan hanya berorientasi pada kemudahan. Ini merupakan teknik pengumpulan data yang buruk dan sangat rentan terhadap bias.

Contoh: Suatu survey dilakukan untuk mendata opini warga Kecamatan Suka Pintar (yang terbagi dalam 7 kelurahan) terkait layanan masyarakat yang disediakan oleh aparat kecamatan. Dikarenakan alasan kemudahan, maka satu kelurahan ditunjuk sebagai perwakilan dan survey dilakukan terhadap warga kelurahan tersebut yang dipilih secara acak.

Minggu, 18 Juli 2021

Desain Eksperimen dalam Statistika

Desain Eksperimen dalam Statistika



 

Studi Statistik (Statistical Study)

Studi Observasi (Observational Study)

Seorang peneliti hanya melakukan pengamatan terhadap subjek (e.g., pengukuran karakteristik) tanpa melakukan tindakan apapun yang dapat mempengharuhi hasil pengamatan.

Contoh:

Sebuah penelitian dilakukan untuk mengamati laju kecepatan kendaraan yang melintas di Jalan Merdeka pada pukul 10 sampai dengan 12 malam.

Pengukuran kecepatan kendaraan dilakukan dengan bantuan speed gun selama 90 hari.

Studi Eksperimen (Experimental Study)

Seorang peneliti menerapkan suatu treatment tertentu terhadap subjek sebelum melakukan pengamatan untuk memahami efek dari treatment yang diberikan.

Contoh:

Sebuah penelitian dilakukan untuk mengamati efek dari pemberian suplemen vitamin D3 terhadap 140 pasien dengan tingkat anti-body rendah.

Sebanyak 70 pasien menerima 4000 IU vitamin D3 perhari selama 1 tahun dan 70 pasien sisanya menerima placebo.

Hasil pengamatan terhadap dua kelompok pasien ini lalu dibandingkan.

Desain Eksperimen (Experimental Design)

1. Kendali (Control)
2. Pengacakan (Randomisation)
3. Replikasi (Replication)

Experimental Design: Control (kendali)


1. Kendali (control) dapat dilakukan dengan menerapkan:
   
A. Bliding
B. Double Blinding

2. Blinding

A. Subjek eksperimen tidak mengetahui apakah dirinya menerima treatment atau placebo.

3. Double Blinding

A. Baik peneliti maupun subjek eksperimen tidak mengetahui apakah seorang subjek menerima treatment atau placebo.

B. Dibutuhkan pihak ketiga untuk mendistribusikan treatment dan placebo kepada subjek eksperimen.

Experimental Design: Randomisation (pengacakan)
Penentuan subjek eksperimen ke dalam treatment group dan control group dilakukan secara acak (random).

Randomised Blocked Design:

1. Keseluruhan subjek eksperimen akan dikelompokkan berdasarkan kesamaan karakteristik

   tertentu (e.g., rentang usia, jenis kelamin).

2. Subjek di tiap kelompok lalu dipilih secara acak untuk dimasukkan dalam treatment

   group dan control group.


Experimental Design: Replication (replikasi)
Untuk meningkatkan validitas dari hasil eksperimen, dibutuhkan replikasi atau pengulangan eksperimen dengan kondisi serupa atau mirip.

Replikasi melibatkan subjek eksperimen yang berbeda, dengan demikian replikasi juga akan memperbesar ukuran dari subjek eksperimen (sample size) yang juga dapat menunjang validitas dari hasil eksperimen.

Contoh:
Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu produk permen karet yang dikembangkan untuk membantu seseorang yang ingin berhenti merokok.

Sepuluh orang perokok berat dilibatkan sebagai subjek eksperimen. Lima orang di antaranya diberikan permen karet dan lima sisanya diberikan placebo. Setelah dua bulan berjalan, kesepuluh subjek eksperimen ini dievaluasi dan didapati kelima subjek penerima permen karet telah berhenti merokok.

Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan apa yang terdapat pada desain eksperimen ini?

Tantangan dalam Experimental Study

1. Confounding/Lurking variable

Faktor eksternal (dan tidak diperhitungkan sebelumnya) yang berpotensi memberikan pengaruh terhadap hasil eksperimen.

2. Placebo effect

Subjek eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo (treatment palsu).

3. Hawthorne effect

Perubahan perilaku dari subjek eksperimen setelah mengetahui bahwa dirinya terlibat dalam eksperimen.

Klasifikasi Data dalam Statistika

 Klasifikasi Data dalam Statistika





Ada 2 Macam Tipe Data yaitu :

1. Data Kualitatif (Qualitative)

Data non numerik:
1. Atribut
2. Label

2. Data Kuantitatif (Quantitative)

Data numerik yang dihasilkan melalui:
1. Penghitungan
2.Pengukuran

Tipe Data: Contoh

Menu (kualitatif)

Harga (kuantitatif)

Ayam Goreng

Rp 12,000

Ayam Goreng + Kentang

Rp 20,000

Ayam Goreng + Kentang + Minuman

Rp 25,000

Skala Pengukuran (Level of Measurements)

Ada 4 Skala Pengukuran (Level of Measurements) dalam bidang statistika yaitu:

1.Nominal
2.Ordinal
3.Interval
4.Rasio (Ratio)

Skala Pengukuran Nominal

1.Berasosiasi dengan tipe data kualitatif

2.Berfokus pada pengelompokkan atau pengkategorian data berdasarkan nama, label, atau kualitas


Tidak dapat dikenakan operasi matematika

   Contoh:

   1. merk kendaraan bermotor
   2. kota kelahiran
   3. nama siswa, nama bulan, nama hari
   4. nomor kendaraan bermotor, nomor induk siswa

 

Berasosiasi dengan tipe data kualitatif

Data dapat dikelompokkan

  Data dapat disusun berdasarkan urutan, peringkat, atau ranking

-  Tidak dapat dikenakan operasi matematika

Contoh:

1. tingkat kepuasan pelanggan: sangat puas, puas, cukup, kecewa, sangat kecewa
2. temperatur udara: panas, sejuk, dingin
3. peringkat siswa di kelas

Skala Pengukuran Interval 

Berasosiasi dengan tipe data kuantitatif
- Data dapat dikelompokkan
- Data dapat disusun berdasarkan urutan, peringkat, atau ranking
Dapat dikenakan operasi matematika untuk menghitung selisih nilai
-
 Nilai numerik merepresentasikan posisi pada suatu skala ukur tertentu
Tidak memiliki nilai nol yang absolut (no inherent zero)
Tidak dapat dikenakan operasi matematika terkait perkalian

   
Contoh:

   
1. Temperatur udara 32 derajat celsius
   
2. Tahun 2020

Skala Pengukuran Rasio (Ratio)

Berasosiasi dengan tipe data kuantitatif

Data dapat dikelompokkan

Data dapat disusun berdasarkan urutan, peringkat, atau ranking

Dapat dikenakan operasi matematika untuk menghitung selisih nilai

Memiliki nilai nol yang absolut (inherent zero)

Dapat dikenakan operasi matematika terkait perkalian

   Contoh:

    1. usia anak 7 tahun

    2. berat badan 65 Kg

    3. harga ayam goreng Rp 12,000

 

Skala Pengukuran: ringkasan

Pengelompokan Data

Pengurutan Data

Selisih Data

Pengkalian Data

Nominal

Ordinal

Interval

Ratio

 

 

 

 

 

 


Statistika Dasar

 Kenapa  Kita Perlu Belajar Stastiska Dasar ?





Pada saat kita memasuki era digital yang sudah masuk pada fase industri 4.0 jumlah dan ukuran dari data yang kita miliki akan terus membesar ukurannya,

Ada berbagai jenisnya yaitu :

1. Data Warehouse
2. Data Mining
3. Big Data Analytics
4. Machine Learning
5. Data Sience

Yang disebutkan diatas adalah semua bidang keilmuan dan keahlian dalam bidang teknologi informasi yang memang muncul dan berkembang karena didorong pertumbuhan data digital. Dari sekumpulan bidang keahlian ini terdapat kesamaan yaitu Statistika.

Statistika  juga adalah inti utama dari bidang-bidang keahlian tersebut.

Statistika mencakup cabang keilmuan yaitu:

1. Pengumpulan sebuah data
2. Pengelolaan
3. Analyzing
4. Interpretasi data

Data dalam Statistika bisa diperoleh dengan :

1. Pengamatan
2. Penghitungan
3. Pengukuran
4. Responsi


Data set dalam Statistika dibagi menjadi dua yaitu

1. Populasi

Populasi adalah kumpulan dari pengamatan, penghitungan, pengukuran, responsi dari sebuah topik yang akan diuji


2. Sampel

Sampel merupakan bagian dari populasi

Sampel yang baik adalah sampel yang representatif terhadap populasi, sehingga dapat ditarik              kesimpulan dari populasi itu sendiri.
Oleh karena itu data sampel harus dikumpulkan dengan metode yang tepat (e.g, random                     sampling).

Contoh Populasi :

Dalam pelaksanaan vaksinasi di Universitas Teknokrat Indonesia, Tercatat dari seluruh mahasiswa yang ikut vaksinasi sekitar 70%

Contoh Sampel :

Universitas Teknokrat Indonesia mengadakan acara mackarida untuk mahasiswa IBATEK (Ikatan Beasiswa Teknokrat) yang dilaksanakan tanggal 27 Maret 2021

Ada dua istilah atau terminologi lain dalam statistika yaitu :

1.Statistika Deskriptif (Descriptive Statistics)

Cabang ilmu statistika yang bercabang pada

A. Pengelolaan data (Organization)
B. Peringkasan data (Sumarsitation)
C. Visualisasi data(display/visualisation)

2. Statistik Inferensi(Inferential Statistic)

Cabang ilmu statistika yang berfokus pada pemanfaatan sampel untuk menarik kesimpulan pada        populasi

Contoh dari Statistika Inferensi :

Sejumlah pria dewasa berusia 48 tahun dilibatkan dalam satu program penelitian selama 18 tahun, berdasarkan data pengamatan diprediksi bahwa 70% dari pria yang tidak menikah akan bertahan hidup pada usia 65 tahun, dan 90% pria yang menikah akan hidup pada usia 65 tahun.

Contoh Statistika Deskriptif :

Berdasarkan data sampel yang diperoleh dari Wall Street, didapati kesalahan yang dilakukan oleh analisis dalam melakukan prediksi dalam perusahaan IT pada tahun ini mencapai 44%

Distributions & Standard Normal Distributions

  Geometric Distribution Geometric Distribution merupakan suatu discrete probability distribution yang memenuhi kriteria berikut: - Percobaa...