duplicate content
วันนี้ผมได้ตรวจสอบเวปไซต์ที่ผมดูแลเรื่อง SEO อยู่เวปหนึ่ง ซึ่งเป็นหนึ่งในสี่อันดับแรกของเวปไซต์ข้างบน ซึ่งเวปไซต์นี้ผมไม่ได้เป็นคนดำเนินการหรือเป็นคนทำเวปไซต์ขึ้นมา ผมได้เข้ามาัรับผิดชอบในส่วนของ SEO หลังจากที่เวปไซต์ได้สร้างเสร็จเรียบร้อยแล้ว ซึ่งผมก็ไม่มีสิทธิ์หรือไม่รู้ว่าเนื้อหาในเวปไซต์นั้นมาจากใหน ซึ่งจากรูปข้างบนก็จะเห็นว่าต้องมีเวปไซต์อย่างน้อยหนึ่งหรืออย่างมากสามเวปไซต์ที่ได้ก๊อปปี้หรือคัดลอกบนความจากเวปไซต์ใดเวปไซต์หนึ่งมาอย่างแน่นอน (งง?) แต่นั้นไม่ใช่ประเด็น
ประเด็นคือ ทำไมเวปไซต์ที่มีการคัดลอกบนความจากเวปไซต์อื่นมา โดยที่ไม่มีแม้แต่การ rewrite เลยด้วยซ้ำถึงมีอินเด็ตอยู่ในฐานข้อมูลของกูลเกิ้ลได้ ซึ่งขัดแย้งกับสิ่งที่ google กำลังทำ นั้นก็คือโยงไปถึงเรื่องของ PANDA ซึ่งก็ผมก็ไม่รู้เหมือนกันว่าเหตุการณ์นี้เกิดขึ้นได้อย่างไร อาจจะเป็นเพราะเพจเหล่านี้เกิดมาก่อน PANDA ซึ่งนั้นทำให้มันไม่รู้เหมือนกันว่าบทความอันใหนเป็นตัวต้นฉบับจริงๆ หรือ PANDA ยังทำงานได้ไม่สมบูรณ์กับภาษาไทยหรือภาษาที่ไม่ใช่ภาษาอังกฤษ
แค่เจออะไรแปลกๆก็เลยเอามาแชร์กันครับ เริ่มทำ SEO มาได้สักพัก ก็ยังงงๆกับหลายๆอย่าง บางอย่างก็ยังไม่เข้าใจ สรุปว่าเวลาที่ผ่านมาผมก็ยังไม่เข้าใจอะไรเลยอยู่ดี
PANDA
ในช่วงอาทิตย์ที่ผ่านมาผมมีงานที่จะต้องจัดการลิงค์ (backlink) ให้เวปไซค์เวปหนึ่ง ซึ่งสิ่งที่ได้เห็นและอยากจะแชร์ก็คือเรื่องที่ฮอตฮิต (ฮอตฮิตไปสัพักแล้วละ) เรื่องของ PANDA นั้นเอง สิ่งที่เห็นคือ เน็ตเวิร์คที่ถูกสร้างขึ้นมา โดยที่ไม่มีประโยชน์อันใดต่อมนุษย์ชาติ เป็นขยะไซเบอร์ เป็นตัวกินเน็ตเวิร์คทราฟฟิก แบบไร้ประโยชน์ประยังอันใด ซึ่งนั้นก็คือ เวปที่ถูกสร้าง/ปั่นขึ้นมา โดยมีเนื่อหา content ที่ copy หรืออาจะ rewrite หรือ translate หรือวิธีการใดวิธีการหนึ่งที่ทำให้ content นั้นเปลี่ยนรูปแบบไป เพื่อหวังผลให้ content นั้นถูกมองว่าเป็น content ที่ unique ซึ่งเวปเหล่านั้นถูก PANDA กินเรียบ ถูก deindex กันเป็นแถวๆ
แต่ก็ยังมีบางเวปไซต์บางเน็ตเวิร์คที่ยังเหลือรอดมาอยู่ อาจจะเพราะอัลกอริธึมของ PANDA ยังไม่สมบูรณ์นักก็เป็นได้ แต่ถึงอย่างไรก็ตาม google ได้ก็ได้เริ่มสร้างสังคมแบบยูโทเปีย สำหรับการค้นหาข้อมูลบนอินเตอร์เน็ตขึ้นมาแล้ว ซึ่งนั้นคือ สิ่งที่คุณต้องการค้นหา คุณจะได้ในสิ่งนั้นจริงๆ และยังมีส่วนย่อยๆลงไปอีกเช่น ย้อนหลังจำนวนกี่วัน ค้นหารูปที่เป็นสี ขาวดำ หรือรูปวาด เรียกว่า Google ไปไกลกว่าที่ใครจะตามทัน สุดท้ายขยะไซเบอร์เหล่านั้นก็ถูกกำจัดไป
PANDA อาจะมีเรื่องของเนื้อหาที่มีความสดใหม่ เช่น เนื้อหาที่มีความสดใหม่ มีความเป็น unique ไม่ซ้ำใคร จะเป็นที่ซื่นชอบของ Googlebot มากว่าเนื้อหาที่ซ้ำและเก่ากว่า (เป็นความเชื่อส่วนตัว) นั้นหมายความว่าเวปไซต์ที่มีการอัพเดตอยู่ตลอดเวลาจะเป็นที่ชื่นชอบมากกว่า เข้าตามหลักของ Web 2.0 ในที่สุด
แต่มีข้อชวนคิดอย่างหนึ่งสำหรับสิ่งที่ PANDA ทำไว้คือ PANDA ชื่อชอบเนื้อหาที่มีความสดใหม่ แต่ PANDA ยังไม่ได้เข้าใจในเนื้อหานั้นว่าพูดเกี่ยวกับอะไรมีประโยชน์สอดคล้องกับอะไรมากน้อยแค่ใหน หรือไม่อย่างไร ไม่แน่ ในอนาคตมันอาจจะมีการเข้าใจความหมายของเนื้อหาข้อความเหล่านั้นได้ เหมือนที่ Google ได้ทำกับ image search ที่สามาถค้นหา รูปวาด เหมือนจริง กราฟฟิก หรือแม้กระทั้งโทนสี นั้นแสดงว่า Google เริ่มมีการทำ Image Processing กับรูปภาพต่างในเวปแล้ว

