Tags:
พอดีผมกำลังศึกษาเรื่อง data mining กับเทคโนโลยีใหม่ๆ อย่าง twitter ในการเรียน ป.โท เลยอยากจะขอแชร์เรื่องที่ศึกษาอยู่ และขอคำแนะนำเพิ่มเติมครับ หากใครมี จะเป็นประโยชน์ต่อการศึกษามากเลยครับ ออกตัวก่อนว่าไม่ได้ได้ต้องการโยงไปเรื่องการเมืองหรือผลประโยชน์อื่นใดครับ
-------------------------------
รู้ผลกันไปแล้วสำหรับคดียึดเงินคืนแผ่นดิน ซึ่งก็เป็นไปตามที่เดาไว้ไม่ผิด ที่ยึดทีก็แทบจะใช้หนี้ประเทศที่กู้แหลกไปตอนนี้ได้หลายอยู่ (ถ้ายึดจากนักการเมืองทุกคนที่โกงได้ เราคงปลดหนี้ทั้งประเทศได้เลยนะนี่)


เพื่อให้ไม่เสียความเป็น Geek พอดีช่วงนี้เพิ่งสอบวิชา Data Mining ไปหมาดๆ ว่าแล้วลองเอาวิชาที่ร่ำเรียนมาลองมาใช้กับข้อมูลจริงในวันประวัติศาสตร์นี้กันดีกว่า จะว่าไปมันก็ไม่ได้ทำ mining อะไรหรอก แค่เอา tool ที่ชาวบ้านมีมาลองใช้ดู

ข้อมูล : Twitter - เพราะมี Tools ที่ดึงข้อมูลออกมาได้มากที่สุด

ทำไมต้อง #Judgementday ?

ถ้าใครอ่าน Tweet ในช่วงที่ศาลเริ่มอ่านผลการพิพากษาแล้ว จะเห็น tag นึงที่เป็นที่นิยมใช้กันมากที่สุดคือ #judgementday ซึ่งก่อนหน้าวันนี้ก็ไม่ได้มีนายกออกมาบอกว่า "ชาว Twitter ครับ ผมขอให้ใช้ tag #judgementday แทนวันนี้นะครับ"

แล้วมันมาได้ยังไง ? แสดงว่าต้องมีคนเริ่มก่อน ลองไปดูตามแท็กในรอบอาทิตย์ที่ผ่านมา ก็น่าสนใจมากว่าไม่มีใครใช้แท็กนี้เลย แสดงว่าเป็นแท็กที่มีคนคิดขึ้นมาใหม่ แล้วก็เริ่มมีคนทำตามมา (พลังแห่ง social trend)



ตามไปดูก็พบว่าคนแรกที่ใช้แท็กนี้คือ @bmw2681 และก็ @witwit ตามมา แต่สองคนนี้ไม่ได้ follow ซึ่งกันและกัน เลยคาดว่าจะเหมือนกันโดยบังเอิญ (???) แต่จุดเปลี่ยนก็เกิดขึ้นเมื่อ @jakrapong ได้ tweet ไปให้ @suthichai ว่าน่าจะใช้แท็ก #judgementday เมื่อมีการพูดถึงวันนี้ ซึ่ง @suthichai ก็เห็นว่าเหมาะสมดี จึง retweet ข้อความดังกล่าว และเชิญชวนให้ทุกคนมาใช้แท็กนี้ หลังจากนั้นกราฟของจำนวนการใช้เท็ค



Tip : การพูดถึงเหตุการณ์อะไรเป็นพิเศษควรจะสร้างแท็กใหม่ที่ไม่มีใครใช้มาก่อน เพื่อไม่ให้เกิดความสับสน

หลังจากนั้นกราฟของแท็ก #judgementday ก็พุ่งกระฉูด จึงสรุปได้ว่าทุกคนยอมรับและใช้แท็กนี้เป็นมาตรฐาน ตามกราฟ จึงถือว่าเป็นข้อมูลสำคัญในการแปลผล (target class)



จากกราฟจะเห็นว่าช่วงบ่ายเป็นช่วงที่กราฟขึ้นสูงมาก เพราะศาลเริ่มอ่านคำพิพากษาแล้ว และก็ค่อยๆ ลดลง ตามความยาวยืดที่ไม่รู้ว่าจะจบเมื่อไหร่ จุดเปลี่ยนสำคัญคือช่วงเวลา 2 ทุ่มที่หลายคนเลิกงาน เลิกเรียน และติดตามผลกันอย่างเต็มที่ ไปจนถึงจุดสุดยอด !! ที่เวลา 20.22 เป็นจุดที่จำนวนเงินที่ถูกยึดออกมาพอดี


มีอยู่กราฟนึงที่น่าสนใจ คือเป็นการเทียบว่าแท็ก #judgementday นั้นจะมีการ tweet ไปพร้อมๆ กับคำใดบ้าง ซึ่งจากรูปก็ต้องบอกได้เลยว่า งานนี้ @suthichai ชนะเลิศ มีคนนำไป retweet กันมากที่สุด .. เพราะงั้นหลังจากนี้เราควรศึกษาข้อมูล #judgementday เทียบกับ @suthichai เพราะถือว่าเป็นข้อมูลที่มีความเกี่ยวข้องกันมากที่สุด (basket analysis ใน associate dm)


งั้นลองมาดูกราฟเดิมแต่เป็นข้อมูลเฉพาะ @suthichai จะเห็นความน่าตกใจอย่างนึงคือเฉพาะวันนี้ #judgementday แทบจะถูกใช้คู่กับ @suthichai มาโดยตลอดทั้งวัน เป็นการยืนยัน coupling ที่ดีของข้อมูล

สิ่งนึงที่น่าสงสัยคือ .. แล้ว @thaksinlive หายไปไหน ?

จริงอยู่ว่าถึงแม้วันนี้ @thaksinlive จะของดฟังผลอยู่ที่ดูไบ และไม่ tweet อะไรเลย แต่จากกราฟข้างบนจะเห็นว่าคนพูดถึงน้อยมาก ซึ่งก็เป็นไปได้ว่าชาวไทยยังไม่นิยมที่จะพูดถึง @thaksinlive แทนคำว่า ทักษิน มากนัก

งั้นเราลองมาดูความเกี่ยวข้องกันของ #judgementday , @suthichai , @thaksinlive


จากกราฟนี้จะเห็นได้ว่า #judgementday กับ @suthichai มีความเกี่ยวข้องกันอย่างหนาแน่นมาก แต่ #judgementday กับ @thaksinlive ก็มีความสัมพันธ์กันเช่นกัน ถึงจะน้อยกว่ากรณีแรก 5 เท่าก็ตาม แต่ก็เป็นไปตามที่คาดไว้ข้างต้น

ส่วนที่ดีมากของกราฟนี้อีกอย่างคือดูความไม่เกี่ยวข้องกันเลย จะเห็นว่า @thaksinlive ไม่ได้เกี่ยวอะไรกับ @suthichai มากนัก และยิ่งถ้าเอาทั้ง 3 มารวมกัน ยิ่งไม่เกี่ยวกันเข้าไปใหญ่ ..? แสดงว่า #judgementday เป็นตัวกลางสร้างความสัมพันธ์ระหว่าง @suthichai กับ @thaksinlive แบบอ้อมๆ


ดูรูปมาเยอะ มาดูที่ตัวอักษรจริงๆ เลยดีกว่า ในกราฟ Spectrum นี้ จะเห็นว่า keyword ที่สำคัญกับทั้งสองตัวแปรนี้ก็คือเรื่องที่เกิดในวันนี้นั่นเอง ไม่ว่าจะเป็น thaksin , billion , verdict หรือแม้แต่ @nationchannel24

สุดท้าย .. เหตุการณ์นี้จะมีผลต่อจำนวนคนที่มาสมัคร follow ใครคนใดเพิ่มขึ้นเป็นพิเศษหรือไม่ ?


ถ้า twitter ใช้เป็นเครื่องมืโฆษณาได้ เราก็จะเห็นการ retweet ของ @suthichai ที่พยายามนำเสนอ @nationtv , @nationchannel24 , @oknationblog เข้ามาด้วย .. ซึ่งก็ได้อานิสงค์จริงคือมีคนเอาชื่อนี้ไป retweet เยอะมาก แต่จะมีผลกับการตัดสินใจ follow ตามหรือไม่ ?

ผลก็คือ ไม่ค่อยมีผลนัก .. จากกราฟจะเห็นว่าจำนวนคน follow ทั้ง 3 account นี้เพิ่มขึ้นตามปกติ ไม่มีนัยยะสำคัญพอที่จะบอกว่าเหตุการณ์นี้มีผลกับการเลือก follow ตาม


กับ @thaksinlive และ @suthichai เองก็เช่นกัน

:: สรุป ::
#judgementday ได้เป็นแท็กสากล จากการแนะนำของ @suthichai ซึ่งมีคน follow มากพอ จึงสามารถกำหนดมาตรฐานได้ และทั้ง 2 keyword ก้มีผลซึ่งกันและกันไปตลอดทั้งวันนี้ โดยมี @thaksinlive เป็นตัวแปรตาม

ส่วนการที่มีคน retweet มาก หรือผ่านตาคนมากไม่ได้มีผลอะไรมากนักกับการเลือก follow หรือไม่ follow ตามกัน
ที่มา - Khajochi's Blog
Get latest news from Blognone
By: KnightBaron
ContributoriPhoneAndroidRed Hat
on 2 March 2010 - 12:45 #159799
KnightBaron's picture

"ตัวแปร" นะครับ ไม่ใช่ "ตัวแปล"

By: khajochi
WriteriPhoneIn Love
on 2 March 2010 - 13:17 #159802 Reply to:159799
khajochi's picture

แก้แล้วครับ ขอบคุณครับ


แฟนพันธุ์แท้สตีฟจ็อบส์ | MacThai.com

By: PiKO
ContributorAndroid
on 2 March 2010 - 15:13 #159816

อ่านแล้ว สนุกดี ^^

พอจะรู้เหมือนกันว่า Twitter เอามาวิเคราะห์ กระแสของสังคมได้ แต่ไม่รู้ทำยังไง และท่าไหน

อ่านบทความนี้แล้ว ได้ความรู้ดี +เหตุการณ์พึ่งผ่านมาไม่นาน ก็เลยยังพอจำอะไรๆ ได้

ขอบคุณที่เอามาให้อ่านกันครับ


:: DigiKin8 ::

By: oakyman
ContributorAndroid
on 3 March 2010 - 11:03 #160016

วิเคราะห์ได้สนุกดีครับ

By: ellipsis
Windows Phone
on 3 March 2010 - 12:10 #160029

บทความดีมากครับ

By: jaturont
AndroidUbuntuWindows
on 3 March 2010 - 13:00 #160035
jaturont's picture

สงสัย #judgementday tagนี้มันกลางๆ จนขาดนัยยะให้ติดตามมั้งครับ แต่ถ้าเป็น tag ที่แบ่งกลุ่มคนชัดเจน อาจเป็นอีกแบบ เช่น #redtweet #rednews เป็นต้น ..บางคนก็อาจใช้วิธีหาเพื่อนเพิ่ม โดย search ด้วย @thaksinlive @PM_Abhisit เป็นต้น ..ใคร tweet ดีๆ ก็น่าfollowเพิ่ม ใครtweetด่า ก็แนวคิดคนละแบบก็ไม่ follow

By: Job_The_Gamer
WriterWindows PhoneAndroidWindows
on 4 March 2010 - 01:21 #160143
Job_The_Gamer's picture

JudgementDay ทำให้ผมนึกถึงคนเหล็ก :D


Achievement Unlocked: Being a Blognone's Writer

By: hara
Symbian
on 4 March 2010 - 02:56 #160145

ขอบคุณครับ สำหรับบทความดีๆ :3

By: fatro
ContributoriPhoneAndroid
on 4 March 2010 - 05:18 #160150
fatro's picture

แท็กเอามา reuse ก็ได้นะครับ ไม่ได้ใช้พร้อมกันตลอดเวลาอยู่แล้ว

By: check
Android
on 4 March 2010 - 12:56 #160175
check's picture

การทำงานวิจัย คือการทดสอบสมมุติฐานที่เรายังไม่รู้คำตอบ แต่สมมุติฐานที่สามารถคาดเดาผลลัพธ์ได้ตั้งแต่ต้นนั้นก็ไม่เห็นต้องวิจัยเลยนิคับ

By: khajochi
WriteriPhoneIn Love
on 4 March 2010 - 13:41 #160179 Reply to:160175
khajochi's picture

ใช่ครับ เพราะงั้นผมถึงได้วิจัยเรื่องนี้ เพราะผมยังไม่รู้คำตอบว่า (และคาดเดาผลลัพท์ไม่ถูก) ..
- #judgementday มาได้อย่างไร
- #judgementday มีผลกับ tag ไหนหรือ tweeter account ใดบ้าง
- การ retweet มีผลกับการ follow มากน้อยแค่ไหน


แฟนพันธุ์แท้สตีฟจ็อบส์ | MacThai.com

By: McKay
ContributorAndroidWindowsIn Love
on 4 March 2010 - 13:50 #160180 Reply to:160179
McKay's picture

เห็นด้วยครับ

และจริงๆการคาดเดาผลลัพท์ของสมมติฐานนั้นๆได้ ไม่ใช่ว่าผลลัพท์จะตรงตามที่เราคาดเดาเสมอไปนะครับ เพราะถ้าเกิดเป็นแบบนั้น คงไม่เกิดการเปลี่ยนแปลงทฤษฎีหลายๆอย่าง เพียงเพราะว่าผู้ทดสอบค้นพบผลลัพท์ใหม่ได้หรอกครับ

ยกตัวอย่างเช่นถ้าคิดว่าโลกแบนเป็น common sense ชนิดหนึ่งแล้ว ทำไมกาลิเลโอถึงต้องพิสูจน์ว่าโลกมันกลมหรือแบน ทั้งๆที่ผลลัพท์ก็คาดเดาได้แล้วว่าโลกแบน


Russia is just nazi who accuse the others for being nazi.
someone once said : ผมก็ด่าของผมอยู่นะ :)

By: JN
iPhone
on 5 March 2010 - 19:59 #160363

สนุกดี แต่ไอ้ที่คุณทำมันไม่ใช่ data mining นิ

By: jakrapong
ContributorAndroid
on 8 March 2010 - 06:19 #160612
jakrapong's picture

ขออนุญาตโฆษณานิดนึงนะครับ พอดีเห็นว่าเขียนถึงผม เลยอยากเสริมบางจุดครับ http://jakrapong.com/2010/03/07/twitter-hashtag-judgementday/