Showing posts with label ความรู้. Show all posts
Showing posts with label ความรู้. Show all posts

Wednesday, April 19, 2017

สูตรลับ Growth Hacking ไม่ต้องใช้เงินโฆษณาเยอะ ก็ปั้นแบรนด์ให้ Hit ติดชาร์ทได้

ขอบคุณรูปจากหนังเรื่อง The Social Network (2010) - Facebook หนึ่งใน Growth Hacking Platform ที่ประสบความสำเร็จที่สุดในโลก
หยุดยาวช่วงสงกรานต์ที่ผ่านมา แอดไปเดินเล่นที่คิโนะ เห็นหนังสือเล่มนึงน่าสนใจดี เลยหยิบมาลองอ่านๆดูแล้วพบว่า "เฮ้ย แม่งสนุกว่ะ เจ๋งสัสๆ (555+)" เลยกลับบ้านมากดซื้อใน kindle สนนราคา 5.99 เหรียญเอง หนังสือชื่อว่า "Growth Hacker Marketing" เรียบเรียงโดย Ryan Holiday

มานั่งหาอ่านประวัติของพี่ Ryan คนนี้ก็ไม่ธรรมดาเลย อายุ 29 ปีแต่ว่าประสบการณ์ทำงานโชกโชนมากๆ งานหลักคือเป็น media strategist เคยเป็น marketing director ให้กับแบรนด์ดังอย่าง American Apparel งานรองคือเขียนหนังสือหลายเล่มมากๆ อย่าง "The Obstacle is the Way" (2014) ที่ได้รับการแปลมาแล้วกว่า 20 ภาษา และ "Ego is the enemy" (2016) อีกหนึ่งงาน masterpiece ที่เพิ่งออกมาเมื่อปีที่แล้วนี่เอง

ส่วนหนังสือ Growth Hacker เล่มใหม่ยกตัวอย่างแบรนด์ใหญ่ๆระดับโลกที่ประสบความสำเร็จภายในระยะเวลาอันสั้น และ Ryan พยายามจะ crack ว่าแบรนด์เหล่านั้นทำได้อย่างไร ไม่ว่าจะเป็น Facebook, Instagram, Airbnb, Hotmail, Dropbox, Groupon, Pinterest, Snapchat, Evernote เป็นต้น แบรนด์เหล่านั้นเริ่มด้วยการเป็น start-up ไม่ได้จ้าง agency ช่วยโปรโมทแบรนด์ ไม่ได้ทำโฆษณาใช้เงินเป็นร้อยเป็นพันล้าน (zero marketing budget) ผู้ก่อตั้งบริษัทไม่ได้เรียนการตลาดมาด้วย แต่เค้าเปลี่ยนเงินลงทุนไม่กี่ร้อยเหรียญกลายเป็นระดับ 7-8 หลักภายในเวลาสั้นๆได้ยังไง? เด๋วเรามาลองดูไอเดียของ Growth Hacker Marketing ไปพร้อมๆกันในบล๊อกวันนี้ครับ

Monday, April 10, 2017

หัดทำ Central Limit Theorem ด้วยโปรแกรม Excel ง่ายอะไรเบอร์นี้

CLT คือหัวใจสำคัญของการทำงานสถิติแบบ inference เลย




วันนี้มาลองทำ central limit theorem หนึ่งในทฤษฏี holy pillar ของนักสถิติไปพร้อมกับเรานะครับ แอดชอบมากเลยเวลาสอนเรื่องนี้ สนุก ฮ่าๆ นักสถิติใช้ CLT ในการทำงานกับตัวแปรสุ่มที่เราไม่รู้ว่า distribution จริงๆของมันเป็นอย่างไร CLT ยังมีความสัมพันธ์กับสถิติอื่นๆที่มี assumption เรื่อง normal distribution อีกด้วย (หรือที่ภาษาง่ายๆเรียกว่า bell curve, ชื่อทางการอีกอันคือ Gaussian)

ถ้าวันนี้เราเข้าใจ CLT ชีวิตเรากับการเรียนสถิติเบื้องต้น และการทำ inference จะมีเหตุมีผลขึ้นอีกเยอะเลย มาเริ่มกันที่นิยามของทฤษฏีนี้กันก่อนดีกว่า แล้วเด๋วเราจะไปลองทำใน Excel ด้วยกันนะครับ
sample statistics ที่เราคำนวณได้จากการสุ่มซ้ำจะมีการกระจายตัวใกล้เคียงกับ normal distribution เสมอ
โดย sample statistics ในนิยามที่กล่าวข้างต้นคือค่าสถิติที่เราทำการ estimate ขึ้นมา เช่น ค่าเฉลี่ย ร้อยละ ค่า odds ratio หรือแม้แต่ regression coefficient ถ้าเราสุ่มซ้ำ 100 รอบ 1000 รอบแล้วเอาค่าสถิติที่คำนวณได้จากการสุ่มแต่ละครั้ง (expected values with finite variance) มาสร้างกราฟ histogram เพื่อดู distribution จะเห็นว่ากราฟของเราจะออกมา approximately normal เสมอเลย 👊

Sunday, April 9, 2017

The misuse of p-value ความเข้าใจผิด ผลซิกแบบฟลุ๊คๆ กับเรื่องที่อาจารย์ไม่เคยบอก

เรื่องที่ดูเหมือนง่าย แต่ว่าเข้าใจยากเหลือเกิน


ทำไม American Statistical Association (ASA) ถึงต้องประกาศให้นักวิจัยกลับไปศึกษาการใช้ p-value ใหม่ และต้องมีการตรวจสอบอย่างเข้มงวดก่อนที่จะได้ตีพิมพ์? บาง journal ถึงกับบอกเลิกไม่ต้องใช้ p-value เลยก็มี

เพราะ p-value เป็น concept ที่ดูเหมือนง่าย แต่เอาจริงไม่ง่ายอย่างที่คิด ค่าๆนี้ที่ถูกใช้แบบผิดๆมาเกือบร้อยปี วันนี้เราจะมาอธิบายให้เพื่อนๆที่อ่านได้เข้าใจเอง

งั้นเราขอเริ่มจากที่มาของ p-value ก่อน ย้อนกลับไปปี 1925 Ronald A. Fisher เป็นคนแรกที่คิดค้นการใช้ p-value ขึ้นมา โดยชื่อทางการของมันคือ "observed level of significance" 

ถ้าเขียน definition ของมันตามหลักสถิติ จะเขียนได้แบบนี้
p-value = p ( observed data or more extreme | ho is true )
แปลไทยว่า ความน่าจะเป็นที่เราจะเห็นผลที่อยู่ตรงหน้าเรา (observed) หรือว่ายิ่งกว่านั้น (more extreme) ถ้าเกิดสมมติฐานหลัก (ho) เป็นเรื่องจริง แต่แค่ p-value อย่างเดียวไม่สามารถใช้ในการพิสูจน์ได้ว่าเราจะ retain หรือว่าจะ reject ho ตัว Fisher เลยคิดค่า 0.05 ขึ้นมาจากไหนก็ไม่รู้ เอาเป็นว่า 0.05 เป็นค่าที่ Fisher สบายใจอยากจะใช้ #แบบนี้ก็ได้เหรอ และนั่นคือที่มาของ 0.05 ที่เราใช้กันในปัจจุบัน 555+ ถ้าใครถามว่ามันมาจากไหน ก็บอกเค้าไปว่า Fisher เริ่มใช้มาตั้งแต่ปี 1925 แล้ว

ถ้าเกิด p-value <= 0.05 เราก็จะสรุปว่าเจอผล significance และ reject ho แต่ถ้าเกิด p-value > .05 ก็สรุปว่า not significance และ retain ho <ปล. retain แปลว่าไม่ปฏิเสธนะ> 

อ่อ ตะกี้ลืมบอกว่าสมัย Fisher นั้น มีแค่ ho อย่างเดียว ยังไม่มี ha เลยครับ สมัยนั้นเค้าเรียกกันว่าระบบ single null hypothesis testing

Sunday, December 18, 2016

Naked Statistics ทำไมต้องเรียนสถิติ?

Naked Statistics (2013) by Charles Wheelan


สถิติคืออะไร เรียนไปทำไม เป็นสิ่งที่อาจารย์ไม่เคยบอก เข้าห้องเรียนไปแบบงงๆ สูตรเต็มไปหมดเลยแล้วก็สอบให้มันผ่านๆไป ... แค่นั้น จริงหรอ !?

คนส่วนใหญ่บอกว่าไม่ชอบวิชาคณิตศาสตร์ เลยไม่ชอบสถิติ แต่สองวิชานี้ต่างกันตรงนี้ฮะ ... pure mathematics เป็นเรื่องของการคำนวณพิสูจน์สมการล้วนๆ ... ส่วน statistics เป็นเรื่องของความหมายที่มากับตัวเลข... ซึ่งถ้าเราเข้าใจความหมายและที่มาของตัวเลขเหล่านั้น จะทำให้เราเข้าใจปรากฎการณ์ที่เรากำลังศึกษาอยู่ และช่วยให้เราตัดสินใจเรื่องนั้นๆได้ดีขึ้นอย่างมาก ก. ล้านตัว และนี่คือประโยชน์ของการเรียนสถิตินั่นเอง

สถิติช่วยให้เราเข้าใจทุกสิ่งทุกอย่างบนโลกใบนี้ เริ่มตั้งแต่ DNA ของมนุษย์ไปจนถึงการซื้อล๊อตเตอรี่ แพทย์สามารถใช้สถิติเพื่อหาปัจจัยที่ส่งผลกับความเสี่ยงของโรคต่างๆได้ นักการตลาดใช้สถิติเพื่อพยากรณ์ยอดขาย เป็นต้น ไม่ว่าวันนี้เราจะทำงานในสายงานไหน ความรู้ความเข้าใจในสถิติจะช่วยให้เราทำงานได้ดีขึ้น ตัดสินใจได้ดีขึ้น และไม่ถูกหลอกได้ง่ายๆ ด้วยตัวเลขที่ถูกนำเสนอผ่านโทรทัศน์ หนังสือพิมพ์ รายงานบริษัท อินเตอร์เน็ท หรือ poll แบบสอบถามต่างๆ
"โลกนี้มีการโกหกอยู่ 3 แบบ ได้แก่ Lies (โกหก), Damned Lies (ตอแหล), and Statistics (สถิติ)" กล่าวโดย เบนจามิน ดิสราเอลี่ นายกรัฐมนตรีประเทศอังกฤษ ช่วงปี 1800s
โดยหนังสือในตำนาน ขายดีระดับโลกอย่าง How to lie with statistics เขียนโดย Darrell Huff ในปี 1954 ได้อธิบายเรื่องนี้ไว้ชัดเจนมากๆ ว่าสถิติสามารถบิดเบือนความจริงได้ขนาดไหน เวอร์ชั่นแปลไทยของหนังสือเล่มนี้ก็มีแล้ว (แต่อ่านไม่ค่อยรู้เรื่อง 555+) มันเป็นเรื่องง่ายมากเลยที่เราจะหลอกคนด้วยสถิติ ยิ่งคนที่ไม่เข้าใจสถิติเนี่ย ยิ่งถูกหลอกได้ง่ายไปอี๊กกก เสียงสูง! ตัวอย่างเช่น ข่าวด้านล่างนี้

Wednesday, December 7, 2016

Bayes Theorem กับการไขรหัสลับ Enigma ในช่วงสงครามโลกครั้งที่สอง

The Imitation Game (2014)
The Imitation Game (2014)
เมื่อวานแอดเพิ่งได้ดูหนังเรื่อง The Imitation Game (2014) นำแสดงโดยดาราคุณภาพอย่าง Benedict Cumberbatch ที่รับบทเป็น Alan Turing นักคณิตศาสตร์อัจฉริยะชาวอังกฤษ ที่มีส่วนร่วมสำคัญในการไขรหัสลับ Enigma ของฮิตเลอร์ และช่วยให้ฝั่งสัมพันธมิตรชนะสงครามโลกครั้งที่สอง ในช่วงระหว่างปี 1939 - 1945

แต่ว่า ... เป็นที่น่าเสียดายที่คนทั่วไปรู้จักชื่อของ Alan Turing น้อยมาก ทั้งๆที่สิ่งประดิษฐ์ของอลันตอนทำงานให้หน่วยราชการลับของรัฐบาลอังกฤษ (MI6) เป็นรากฐานสำคัญของสองสิ่งที่นักวิทยาศาสตร์ใช้อยู่ในปัจจุบัน ได้แก่
  1. Bayes Theorem ที่อธิบายเรื่องความน่าจะเป็นที่อัพเดทตัวเองได้ตามข้อมูลใหม่ที่มีมากขึ้น
  2. Turing Machine ที่สามารถ simulate computer algorithms ทั้งหลายได้ไม่ว่าโมเดลนั้นจะซับซ้อนเพียงไหนก็ตาม 
จริงๆแล้ว Turing ไม่ได้เป็นคนคิด Bayes Theorem ขึ้นมาหรอก แต่ว่าเป็นคนที่ทำให้มันเป็นที่รู้จักไปทั่วโลกต่างหาก! ผู้ที่ค้นพบทฤษฎีนี้คนแรกคือ Thomas Bayes นักสถิติชาวอังกฤษ (1702-1762) โดยสร้างหลักการขึ้นมาจากความอยากจะทำนายความน่าจะเป็นของเหตุการณ์ที่จะเกิดขึ้นในอนาคตที่เค้าไม่รู้อะไรเลย นอกจากความน่าจะเป็นของเหตุการณ์นั้นที่เคยเกิดขึ้นมาแล้วในอดีต