The 7 Deadly Sins of Data Mining and How To Avoid Them

Oktober 28, 2010 Tinggalkan komentar

Our M2010 Data Mining Conference keynote speaker, Dick De Veaux from Williams College just finished his entertaining and informative presentation. He thoughtfully noted that our location (Las Vegas) is very appropriate for the subject of his presentation.

Are you guilty of any of these data mining sins? Luckily, Dick also presented the seven virtues of data mining to help absolve us of our sinful ways.

Seven Deadly Sins of Data Mining.
1. Not asking the right questions.
2. Not fully understanding the problem.
3. Underestimating data preparation.
4. Ignoring what’s not there.
5. Falling in love with your models.
6. Going it alone.
7. Using bad data.

Seven Virtues of Data Mining
1. Define the problem.
2. Prepare the data, use domain knowledge.
3. Be open to new methods and models. Keep the toolbox open.
4. Be aware of missing data, create dummy variables.
5. Work in teams.
6. Ensure data quality.
7. Use models, not just associations.

source : http://blogs.sas.com/sastraining/index.php?/archives/46-The-7-Deadly-Sins-of-Data-Mining-and-How-To-Avoid-Them.html

Kategori:StatisTIC

esia suka suka

November 23, 2009 Tinggalkan komentar

apalah artinya sebuah nama. ada pepatah bilang seperti itu. mungkin untuk beberapa hal itu tidak masalah, tapi untuk sesuatu yang menggambarkan dan menjadi ciri khas seseorang, maka nama itu sungguh berarti. unik karena memang sifat seseorang itu unik sejak lahir. termasuk dalam hal ini esia menyadari bahwa pelanggannya adalah unik, maka akhirlah muncul sebuah inovasi terbaru dari esia.  diberi nama esia suka suka produk keluaran terbaru Bakrie Telecom ini tidak diberi nomer pada kartu perdananya. namun jangan khawatir pelanggan yang membeli ini bisa mendapatkan nomernya setelah mendaftarkan diri dan menentukan nomer yang identik dengannya.

bagaimana cara untuk mendapatkan nomer-nya, silahkan baca lebih detail-nya pada halaman berikut :

1. esia suka suka @mybaim
2. esia suka suka @ichadimas

jadi apalagi yang kalian tunggu, pilih nomer esiamu, suka-suka kamu.

Kategori:Lain-lain

Inilah Calon Menteri/Pejabat Tinggi Versi SBY-Boediono

Oktober 21, 2009 Tinggalkan komentar

JAKARTA, KOMPAS.com – Berikut ini adalah perkiraan susunan 34 calon menteri dan dua pejabat tinggi setingkat menteri yang akan bekerja dalam Kabinet Indonesia Bersatu (KIB) jilid II.

Perkiraan ini didasarkan pada proses wawancara dan uji kepatutan dan kelayakan di kediaman Presiden SBY di Puri Cikeas Indah, Bogor.

Proses audisi berlangsung selama tiga hari, mulai dari Sabtu hingga Senin kemarin. Presiden SBY, kepada para wartawan beberapa hari lalu, mengatakan, para calon yang diuji telah memenuhi standar yang ditetapkannya.

Sebelumnya, Presiden SBY mengatakan, perubahan masih mungkin terjadi hingga beberapa jam sebelum pelantikan. Perubahan tersebut, misalnya, disebabkan calon menteri yang telah diumumkan kemudian dilaporkan masyarakat memiliki sandungan hukum.

Ke-34 calon menteri dan 2 pejabat tinggi tersebut adalah:
1. Menko Politik, Hukum, dan Keamanan: Jenderal TNI Purn Djoko Suyanto (Independen)

2. Menko Perekonomian: Hatta Rajasa (PAN)

3. Menko Kesra: Agung Laksono (Golkar)

4. Menteri Sekretariat Negara: Sudi Silalahi (Independen)

5. Menteri Dalam Negeri: Gamawan Fauzi (Independen)

6. Menteri Luar Negeri: Marty Natalegawa (Independen)

7. Menteri Pertahanan: Purnomo Yusgiantoro (Independen)

8. Menteri Hukum dan Hak Asasi Manusia: Patrialis Akbar (PAN)

9. Menteri Keuangan: Sri Mulyani (Independen)

10. Menteri Energi dan Sumber Daya Mineral: Darwin Zahedy Saleh (Partai Demokrat)

11. Menteri Perindustrian: MS Hidayat (Golkar)

12. Menteri Perdagangan: Mari Elka Pangestu (Independen)

13. Menteri Pertanian: Suswono (PKS)

14. Menteri Koperasi dan UKM: Syarif Hasan (Partai Demokrat)

15. Menteri Perhubungan: Freddy Numberi (Partai Demokrat)

16. Menteri Kelautan dan Perikanan: Fadel Muhammad (Partai Golkar)

17. Menteri Tenaga Kerja dan Transmigrasi: Muhaimin Iskandar (PKB)

18. Menteri Pekerjaan Umum: Djoko Kirmanto (Independen)

19. Menteri Kesehatan: Nila Afansa Moeloek (Independen)

20. Menteri Pendidikan: M Nuh (Independen)

21. Menteri Agama: Suryadharma Ali (PPP)

22. Menneg Kebudayaan dan Pariwisata: Jero Wacik (Partai Demokrat)

23. Menneg Riset dan Teknologi: Suharna Surapranata (PKS)

24. Menteri Sosial: Salim Segaf Al’jufrie (PKS)

25. Menneg Lingkungan Hidup: Gusti Moh Hatta (Independen)

26. Menteri Kehutanan: Zulkifli Hasan (PAN)

27. Menneg Pemberdayaan Perempuan dan Perlindungan Anak: Linda Agum Gumelar (Independen)

28. Menneg Pendayagunaan Aparatur Negara: EE Mangindaan (Partai Demokrat)

29. Menneg Percepatan Pembangunan Daerah Tertinggal: Helmy Faisal Zaini (PKB)

30. Menneg PPN/Kepala Bappenas: Armida Alisjahbana (Independen)

31. Menneg BUMN: Mustafa Abubakar (Partai Golkar)

32. Menneg Komunikasi dan Informasi: Tifatul Sembiring (PKS)

33. Menneg Perumahan Rakyat: Suharso Manoarfa (PPP)

34. Menneg Pemuda dan Olahraga: Andi Mallarangeng (Partai Demokrat)

35. Kepala BIN: Jenderal (Purn) Sutanto (Independen)

36. Kepala BKPM: Gita Wirjawan (Independen).

menanggapi berita ini, saya berinisiatip melakukan polling, bagi yang berminat silahkan klik Polling of the month yang ada di samping.

salam,

didik

Kategori:Lain-lain

perkenalan data mining

Oktober 20, 2009 3 komentar

-mau nulis yang agak serius dikit ahh-

berkenalan dengan data mining, sebelum saya menjabarkan tentang apa itu data mining, saya ingin bercerita tentang awal mula keterlibatan saya dalam data mining. sebelumnya sekitar 3 tahun yang lalu saya memasuki dunia telco, pada awalnya saya cukup dibuat kebingungan, apa yang harus saya kerjakan?? karena basic saya di bidang research dengan metode statistika yang saya pelajari di kampus. lalu memasuki dunia telco dan kebetulan ‘kecemplung’ di bagian CRM (Customer Relationship Management) .

awal mula saya bekerja diperkenalkan dengan yang namanya database, term yang sudah saya kenal namun kurang akrab. biasanya database itu sejalan dengan bahasa yang digunakannya untuk memperoleh data dari database yaitu SQL (Structured Query Language). emmhh,..jadi belajar hal baru and it’s so interesting. jadi yang pertama saya lakukan adalah mempelajari data yang ada. untung ketika kuliah dulu sempet ikutan mata kuliah basis data. jadi remind me again.

ini ada kaitannya lho dengan awal mula data mining, dimana semua data yang ada terkumpul dalam sebuah database, biasanya data transaksi perusahaan, data pelanggan, dll. lama-kelamaan data ini menjadi banyak namun unusefull. akhirnya munculnya data mining yang ‘seolah-olah’ jadi dewa penolong untuk mencari insight dari suatu database dengan melihat pattern dari data itu. selain itu saya juga menemukan term datawarehouse, datawarehouse ini merupakan kumpulan dari seluruh database yang ada di perusahaan. dengan adanya datawarehouse, data mining akan lebih mudah dalam mengolah data karena data yang digunakan telah disediakan semua oleh datawarehouse.

akhirnya, alhamdulillah bisa masuk ke dunia baru penerapan statistika yaitu data mining yang merupakan gabungan beberpa disiplin ilmu seperti statistika, artificial intelligence, machine learning, database, dll. semoga bisa bermanfaat. nanti dilanjutin lagi deh tulisannya.

Dilbert on Data Mining

Oktober 15, 2009 2 komentar

DilbertMiningData1DilbertMiningData2DilbertMiningData3DilbertMiningData4

Kategori:StatisTIC