เหตุการณ์ครั้งนี้ได้เกิดขึ้นกับนาย Panos Ipeirotis อาจารย์คณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยนิวยอร์คถูก Amazon Web Services เรียกเก็บค่าบริการเช่าโฮสต์ถึง 1,177.67 ดอลลาร์สหรัฐหรือประมาณ 37,000 บาท โดยมีการใช้งานข้อมูลขาออกจำนวน 8.8 TB ภายในเดือนเดียว
จากการตรวจข้อมูลพบว่า Google Feedfetcher ซึ่งเป็นโปรแกรมที่กูเกิลเรียกข้อมูล Atom Feed หรือ RSS เพื่อไปใช้กับ Google Reader และหน้าของกูเกิลเอง ได้ทำการเรียกข้อมูลเดิมซ้ำๆ ทำให้เกิดการใช้งานข้อมูลเกินความจำเป็น เนื่องจาก Feedfetcher ของกูเกิลได้ทำการค้นหาแล้วใช้ข้อมูลดังกล่าวโดยที่ไม่ได้เก็บไว้บนเซิร์ฟเวอร์ของกูเกิลเอง จนมีการเรียกใช้ข้อมูลถึงประมาณ 250GB ต่อชั่วโมง
หลังจากนั้นนาย Panos Ipeirotis ได้ทดลองโดยใช้ URL ภาพที่มีอยู่บน Amazon S3 storage ไปวางไว้บน Google Spreadsheets โดยทำให้ภาพโชว์บนตัว Spreadsheet หรือ Thumbnail และได้ส่งให้คนอื่นๆดู พบว่าได้มีการเรียกข้อมูลเดียวกันซ้ำไปซ้ำมาเป็นจำนวนมากเช่นกัน
ที่มา - Behind The Enemy Lines ผ่าน The Hacker News
Comments
ดอลล่าห์ => ดอลลาร์
8.8TB => 8.8 TB
ส่งออกกี่ชั่วโมง
Coder | Designer | Thinker | Blogger
กี่ชั่วโมงนี่ ยังไงเหรอครับ
ใช้ข้อมูลขาออก 8.8 TB ภายในกี่ชั่วโมงครับ
Coder | Designer | Thinker | Blogger
เขาโดนเรียก 720 เหรียญในครึ่งเดือนแรกปริมาณเขาไม่ได้บอกอ่ะครับ แล้วหลังจากนั้นเขาก็เช็คเป็นรายชั่วโมง จนมา 1,177 เหรียญถึงค่อนบอกว่าปริมาณข้อมูลเป็น 8.8 TB อ่ะครับ
Edit : ผมเจอแล้วครับ 8.8 TB นี่ โดนเรียกต่อเดือนครับ อยู่ในรูปภาพ Summary ตรง 8,877.607GB ครับ
Edit2: ผมเจอจุดที่ผมแปลผิดแล้วครับ ขอบคุณครับ
มันก็เหมือนกับ image hotlink รึเปล่า ที่เอา link รูปจากเว็ปคนอื่นไปใช้ตรงๆ ก็กิน bandwidth
มันก็ประมาณนั้นอ่ะครับ แต่อันนี้เกิดจากการดึงข้อมูลซ้ำๆ เพราะการที่กูเกิลไม่ได้ทำ caching อ่ะครับ
ผมว่าตามเนื้อข่าวที่เขียนมาแล้ว แบบนี้ไม่เรียกว่า "โจมตี" นะครับ
แล้วใช้คำว่าอะไรดีเหรอครับ แต่ The Hacker New บอกว่าเป็น Dos Attack ซึ่งผมคิดว่ามันไม่ใช่ เพราะถ้าใช้ Dos น่าจะมีจุดประสงค์เพื่อล่มระบบ หรือใช้คำว่า "จุดบกพร่อง" ดีไหมครับ เป็น "ค้นพบจุดบกพร่องของ Google Spreadsheets โดยบังเอิญ"
ใช้ Dos ดีกว่านะครับ เพราะสิ่งที่เขาโดนมันก็คือ Dos นี้แหละ มันเรียกเป็นอย่างอื่นไม่ได้เลย ขนาดการที่ผมจะโทรสั่งพิซซ่าจากทุกสาขาไปส่งบ้านคุณ mk ตอนห้าโมงเย็นพร้อมกันยี่สิบสาขา สิ่งนี้ยังเรียกว่า Dos Attack เลยครับ ลองหาหนังสือเกี่ยวกับ Security อ่านจะเข้าใจครับ และอย่ามองที่ผลลัพท์ครับ ให้มองวิธีการหรือขั้นตอนของมัน
โดยส่วนตัวผมว่าศัพท์เทคนิคก็ควรคงไว้เป็นศัพท์เทคนิค ส่วนผู้อ่านทั่วไปถ้าไม่เข้าใจ ก็คงต้องเป็นการขวนขวายศึกษาเองในรายบุคคล ถ้าบัญญัติให้ผู้อ่านทุกคนเข้าใจกันหมด มันจะไม่เหลือความหมายเดิมไว้เลยครับ
มันไม่ง่ายเลยที่จะทำ GIF ให้มีขนาดน้อยกว่า 20kB
อ่า เข้าใจแล้วครับ เดี๋ยวผมลองสรุปใจความอีกทีนึงด้วยครับ
ผมอ่านแล้วยังงงๆ กับประเด็นเรื่อง ไม่เก็บข้อมูลส่วนบุคคล นะครับ
กูเกิ้ลได้ใช้ Feedfetcher เป็นตัวหา URL ข้อมูลส่วนตัวทุกอย่างและทางกูเกิลก็ไม่อยากจะเก็บข้อมูลไว้บนเซิิร์ฟเวอร์ตัวเอง จึงดึงข้อมูลข้อมูลซ้ำไปซ้ำมาเป็นเพราะ Privacy ของตัวกูเกิลเองครับ
คือเข้าใจเหตุผลตรงนั้นน่ะครับ แต่สงสัยว่ามันเป็นประเด็นหลักของข่าวด้วยหรือเปล่า?
ประเด็นหลัก คือ Google Feedfetcher ได้ดึงข้อมูลประมาณ 250GB ต่อชั่วโมง
ส่วนประเด็นรอง คือ คุณ Panos Ipeirotis ได้ทดลองกับ Google Spreadsheets แล้วได้ผลลัพท์แบบเดียวกันครับ
ถ้างั้นก็ตัดส่วนของ "ข้อมูลส่วนบุคคล" ออกจากหัวข่าวได้เลยครับ ลดความสับสน
รับทราบครับ
ผมแก้หัวข่าวไปอีกหน่อย และอนุมัติข่าวแล้วนะครับ
ขอบคุณมากครับ
เกรงว่าจะเข้าใจคำว่า DoS กันผิดนี่แหละครับ
DoS Attack (Denial of Service) แปลตรงตัวคือ "ห้ามหรือปฏิเสธไม่ให้เข้าถึงบริการ" ซึ่ง DoS คือความพยายามที่จะเข้าไปใช้ resource ของ server จน server ไม่สามารถให้บริการได้ โดยทั่วไปคือการส่ง request ไปที่ server พร้อมกัน แต่ในกรณี Google ไม่ได้ส่ง request ไปพร้อมๆกัน ไม่ได้ทำให้ server ล่ม เพียงแต่ Google เลือกที่จะไม่จำข้อมูลที่เคย request ไป ก็เลย request ใหม่ไปเรื่อย(ซึ่งไม่ได้ทำพร้อมกัน)
แต่มีผลให้ค่าใช้บริการบางประเภทสูงขึ้น ถ้าเป็น Co-location บ้านเราก็ไม่ได้จ่ายเพิ่มเพราะคิดตามขนาด bandwidth ไม่ใช่ปริมาณข้อมูลที่เข้าออก
ความเห็นผมเหมือนคุณ churos ครับ ว่ามันไม่ใช่ DoS
ผมมานั่งคิดใหม่เลยคิดว่าเปลี่ยนหัวข้อเลยดีกว่าครับ เพราะว่าต้นเหตุมาจาก Google Feedfetcher ผมเลยเอาไปเป็นหัวข้อแทนครับ
ถ้าบอกว่ามันจะไม่ใช่มันก็ดูไม่ใช่ครับ
แต่ในอีกด้านที่เหลือมันก็เข้าข่ายไม่ใช่เหรอครับ
ผมว่าถ้าหาศํพท์เทคนิคอังกฤษที่บัญญัติเรื่องนี้ได้ในตัวอื่นที่ไม่ใช่คำว่า DoS หรือ DDoS ค่อยมาคิดกันใหม่ครับว่าไม่ใช่
มันไม่ง่ายเลยที่จะทำ GIF ให้มีขนาดน้อยกว่า 20kB
ที่อยากรู้ต่อคือ อาจารย์ท่านนั้นก็เลยจำเป็นต้องเสียตังค์ไปตามนั้นหรือเปล่า?
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
คณะคอมพิวเตอร์วิทยาศาสตร์ = Computer Science รึเปล่าครับ? ถ้าใช้ควรจะเป็น "วิทยาการคอมพิวเตอร์" นะ
เข้าใจแล้วครับ ขอบคุณครับ