Pengertian SGP (Statistical Graphics Procedures): Landasan
Sebelum mendalami tip dan trik ahli, penting untuk memahami prinsip dasar SGP. SGP, terutama digunakan dalam SAS, adalah serangkaian prosedur canggih yang dirancang untuk membuat grafik berkualitas publikasi. Tidak seperti prosedur pembuatan plot dasar, SGP menawarkan kontrol menyeluruh atas setiap aspek visualisasi, mulai dari pemetaan data dan penyesuaian sumbu hingga anotasi dan tata letak. Menguasai SGP memerlukan pemahaman komponen intinya: SGPLOT, SGSCATTER, SGPANEL, dan SGRENDER.
- SGPLOT: Pekerja keras untuk membuat plot tunggal. Prosedur ini menangani beragam tipe plot, termasuk plot sebar, plot garis, diagram batang, histogram, plot kotak, dan banyak lagi. Ini memungkinkan overlay beberapa pernyataan plot dalam satu grafik.
- SGSCATTER: Dirancang untuk menghasilkan matriks plot sebar dan visualisasi berbasis plot sebar lainnya, memungkinkan eksplorasi hubungan antara beberapa variabel secara efisien. Ia unggul dalam memvisualisasikan korelasi dan mengidentifikasi pola dalam kumpulan data.
- pemindaian: Ideal untuk membuat plot teralis, juga dikenal sebagai plot panel atau kelipatan kecil. SGPANEL memungkinkan Anda membagi data berdasarkan satu atau lebih variabel pengelompokan dan kemudian menghasilkan plot terpisah untuk setiap kelompok, memfasilitasi perbandingan di berbagai kategori.
- GRANDERS: Prosedur paling canggih, memungkinkan grafik yang sangat disesuaikan dengan menggabungkan data dengan templat. Ini sangat berguna untuk membuat visualisasi kompleks yang melampaui kemampuan SGPLOT, SGSCATTER, dan SGPANEL. SGRENDER sering kali melibatkan penggunaan Graph Template Language (GTL) untuk mendefinisikan struktur grafik.
Persiapan Data: Landasan Visualisasi yang Efektif
Terlepas dari prosedur SGP yang digunakan, persiapan data yang tepat adalah yang terpenting. Sampah masuk, sampah keluar sangat diterapkan pada visualisasi data. Pertimbangkan aspek-aspek ini:
- Pembersihan Data: Atasi nilai yang hilang, outlier, dan inkonsistensi dalam data Anda. Nilai yang hilang dapat menyebabkan plot tidak lengkap atau menyesatkan. Pencilan dapat merusak visualisasi dan pola yang tidak jelas. Inkonsistensi, seperti format tanggal yang berbeda atau nilai kategori yang tidak konsisten, perlu distandarisasi. Gunakan prosedur SAS seperti
PROC MEANS,PROC UNIVARIATEDanPROC FREQuntuk mengidentifikasi dan mengatasi permasalahan ini. - Transformasi Data: Ubah data Anda untuk meningkatkan visualisasi. Hal ini mungkin melibatkan pembuatan variabel baru, pengkodean ulang variabel yang ada, atau penerapan transformasi matematika. Misalnya, mengambil logaritma suatu variabel dapat mempermudah memvisualisasikan data yang miring. Pertimbangkan untuk menggunakan
DATAlangkah atauPROC SQLuntuk transformasi data. - Agregasi Data: Gabungkan data Anda untuk merangkum tren dan pola utama. Hal ini sangat berguna ketika berhadapan dengan kumpulan data yang besar. Misalnya, Anda dapat menghitung rata-rata penjualan per wilayah atau jumlah total pelanggan per bulan. Menggunakan
PROC MEANS,PROC SUMMARYatauPROC SQLuntuk agregasi data. - Penyortiran Data: Urutkan data Anda untuk mengontrol urutan titik data yang diplot. Ini berguna untuk menyoroti tren atau membandingkan berbagai kategori. Menggunakan
PROC SORTuntuk mengurutkan data Anda.
Menguasai SGPLOT: Melepaskan Keserbagunaannya
SGPLOT adalah prosedur masuk untuk sebagian besar tugas pembuatan plot. Berikut cara memaksimalkan potensinya:
- Pernyataan Plot yang Melapisi: Gabungkan beberapa pernyataan plot untuk menciptakan visualisasi yang lebih kaya. Misalnya, overlay plot sebar dengan garis regresi atau diagram batang dengan plot garis yang mewakili rata-rata pergerakan. Gunakan
PLOTpernyataan di dalamPROC SGPLOTmemblokir beberapa kali. - Menyesuaikan Sumbu: Sempurnakan sumbu Anda untuk meningkatkan keterbacaan dan kejelasan. Kontrol label sumbu, tanda centang, dan rentang. Gunakan
XAXISDanYAXISpernyataan untuk menyesuaikan sumbu. Misalnya, gunakanXAXIS LABEL="Sales (Millions)"untuk mengubah label sumbu x. - Mengontrol Warna dan Penanda: Gunakan warna dan spidol secara efektif untuk membedakan kelompok yang berbeda atau menyorot titik data tertentu. Gunakan
COLORDanMARKERATTRSopsi dalam pernyataan plot untuk mengontrol tampilan elemen plot. Misalnya,SCATTER X=Sales Y=Profit / COLOR=Region MARKERATTRS=(SYMBOL=CIRCLE SIZE=8);akan membuat plot sebar dimana warna setiap titik mewakili wilayah. - Menambahkan Legenda: Buat legenda informatif untuk menjelaskan arti berbagai warna, spidol, atau gaya garis. Gunakan
KEYLEGENDpernyataan untuk menyesuaikan legenda. Misalnya,KEYLEGEND / POSITION=BOTTOM RIGHT;akan menempatkan legenda di sudut kanan bawah grafik. - Anotasi: Tambahkan anotasi ke plot Anda untuk menyorot titik data tertentu atau memberikan konteks tambahan. Gunakan
DRAWpernyataan untuk menambahkan teks, garis, atau bentuk ke plot Anda. Hal ini memerlukan pemahaman koordinat data dan posisi relatif dalam grafik.
Memanfaatkan SGSCATTER: Menjelajahi Hubungan Multivariat
SGSCATTER adalah sekutu Anda saat memvisualisasikan hubungan antara beberapa variabel:
- Matriks Plot Sebar: Hasilkan matriks plot sebar untuk memvisualisasikan hubungan berpasangan antara beberapa variabel dengan cepat. Gunakan
MATRIXpernyataan untuk membuat matriks plot sebar. Misalnya,MATRIX Sales Profit Expenses;akan membuat matriks plot sebar yang menunjukkan hubungan antara Penjualan, Laba, dan Pengeluaran. - Plot Sebar yang Dikelompokkan: Buat plot sebar di mana titik data dikelompokkan berdasarkan variabel kategori. Gunakan
GROUPpilihan untuk mengelompokkan titik data. Misalnya,PLOT Sales * Profit / GROUP=Region;akan membuat plot sebar Penjualan versus Laba, dengan titik data yang dikelompokkan berdasarkan Wilayah. - Elips: Tambahkan elips ke plot sebar Anda untuk memvisualisasikan interval kepercayaan data. Gunakan
ELLIPSEopsi untuk menambahkan elips. Misalnya,PLOT Sales * Profit / ELLIPSE;akan menambahkan elips ke plot pencar. - Histogram: Sertakan histogram di sepanjang diagonal matriks plot sebar untuk memvisualisasikan distribusi setiap variabel.
Memanfaatkan SGPANEL: Mengungkap Tren di Seluruh Grup
SGPANEL unggul dalam membuat plot teralis untuk membandingkan data antar kelompok yang berbeda:
- OLEH Pernyataan: Gunakan
BYpernyataan untuk membagi data Anda ke dalam kelompok berdasarkan satu atau lebih variabel kategori. Misalnya,BY Region;akan membuat plot terpisah untuk setiap wilayah. - Tata Letak Panel: Kontrol tata letak panel untuk mengoptimalkan visualisasi. Gunakan
COLUMNSDanROWSopsi untuk menentukan jumlah kolom dan baris di panel. - Sumbu Bersama: Gunakan sumbu bersama untuk memfasilitasi perbandingan antar panel yang berbeda. Hal ini memastikan bahwa semua panel menggunakan skala yang sama untuk sumbunya. Gunakan
NOAUTOLEGENDdan pengaturan sumbu yang sesuai untuk menjaga konsistensi. - Pemformatan Bersyarat: Terapkan pemformatan bersyarat untuk menyorot pola atau tren tertentu dalam setiap panel. Hal ini dapat melibatkan perubahan warna, penanda, atau gaya garis berdasarkan nilai data.
Teknik Tingkat Lanjut: GTL dan SGRENDER untuk Kustomisasi Tertinggi
Untuk visualisasi kompleks yang melampaui kemampuan SGPLOT, SGSCATTER, dan SGPANEL, GTL dan SGRENDER adalah alat pilihan Anda.
- Bahasa Templat Grafik (GTL): Pelajari sintaks GTL untuk menentukan struktur grafik Anda. GTL memungkinkan Anda menentukan tata letak, sumbu, dan pernyataan plot dengan cara yang sangat disesuaikan.
- Prosedur SGRENDER: Gunakan SGRENDER untuk menggabungkan data Anda dengan template GTL untuk membuat visualisasi akhir.
- Menyesuaikan Tata Letak: Buat tata letak khusus untuk mengatur elemen plot yang berbeda dengan cara tertentu. Hal ini dapat melibatkan penggunaan beberapa tata letak dalam satu templat.
- Grafik Dinamis: Gunakan GTL untuk membuat grafik dinamis yang merespons interaksi pengguna. Hal ini dapat melibatkan pembuatan filter interaktif atau kemampuan menelusuri.
Optimasi dan Praktik Terbaik
- Pertunjukan: Optimalkan kode Anda untuk performa, terutama saat menangani kumpulan data besar. Gunakan teknik persiapan data yang efisien dan hindari perhitungan yang tidak perlu.
- Keterbacaan: Tulis kode yang jelas dan ringkas yang mudah dipahami dan dipelihara. Gunakan komentar untuk menjelaskan tujuan berbagai bagian kode Anda.
- Reproduksibilitas: Pastikan grafik Anda dapat direproduksi dengan menyertakan semua data dan kode yang diperlukan dalam analisis Anda.
- Aksesibilitas: Pertimbangkan aksesibilitas grafis Anda untuk pengguna penyandang disabilitas. Gunakan warna yang sesuai dan berikan deskripsi teks alternatif untuk gambar.
- Desain Iteratif: Gunakan proses desain berulang untuk menyempurnakan grafis Anda berdasarkan masukan dari pemangku kepentingan.
- Tetap Diperbarui: Ikuti terus fitur-fitur terkini dan update tata cara SGP. SAS secara rutin merilis fitur dan penyempurnaan baru yang dapat meningkatkan visualisasi Anda.
- Berlatih Secara Teratur: Kunci menguasai SGP adalah latihan. Bereksperimenlah dengan berbagai jenis plot, pilihan, dan teknik untuk mengembangkan keterampilan Anda.
- Konsultasikan Dokumentasi: Lihat dokumentasi SAS untuk informasi rinci tentang prosedur SGP dan GTL.
- Memanfaatkan Komunitas: Berpartisipasilah dalam forum dan komunitas online untuk belajar dari pengguna SAS lainnya dan berbagi pengetahuan Anda.

