SEM SEO Google Adwords Adsense PPC โปรโมทเว็บไซต์ เขียนโปรแกรม

13Nov/110

duplicate content


วันนี้ผมได้ตรวจสอบเวปไซต์ที่ผมดูแลเรื่อง อยู่เวปหนึ่ง ซึ่งเป็นหนึ่งในสี่อันดับแรกของเวปไซต์ข้างบน ซึ่งเวปไซต์นี้ผมไม่ได้เป็นคนดำเนินการหรือเป็นคนทำเวปไซต์ขึ้นมา ผมได้เข้ามาัรับผิดชอบในส่วนของ หลังจากที่เวปไซต์ได้สร้างเสร็จเรียบร้อยแล้ว ซึ่งผมก็ไม่มีสิทธิ์หรือไม่รู้ว่าเนื้อหาในเวปไซต์นั้นมาจากใหน ซึ่งจากรูปข้างบนก็จะเห็นว่าต้องมีเวปไซต์อย่างน้อยหนึ่งหรืออย่างมากสามเวปไซต์ที่ได้ก๊อปปี้หรือคัดลอกบนความจากเวปไซต์ใดเวปไซต์หนึ่งมาอย่างแน่นอน (งง?) แต่นั้นไม่ใช่ประเด็น

ประเด็นคือ ทำไมเวปไซต์ที่มีการคัดลอกบนความจากเวปไซต์อื่นมา โดยที่ไม่มีแม้แต่การ rewrite เลยด้วยซ้ำถึงมีอินเด็ตอยู่ในฐานข้อมูลของกูลเกิ้ลได้ ซึ่งขัดแย้งกับสิ่งที่ กำลังทำ นั้นก็คือโยงไปถึงเรื่องของ ซึ่งก็ผมก็ไม่รู้เหมือนกันว่าเหตุการณ์นี้เกิดขึ้นได้อย่างไร อาจจะเป็นเพราะเพจเหล่านี้เกิดมาก่อน ซึ่งนั้นทำให้มันไม่รู้เหมือนกันว่าบทความอันใหนเป็นตัวต้นฉบับจริงๆ หรือ ยังทำงานได้ไม่สมบูรณ์กับภาษาไทยหรือภาษาที่ไม่ใช่ภาษาอังกฤษ

แค่เจออะไรแปลกๆก็เลยเอามาแชร์กันครับ เริ่มทำ SEO มาได้สักพัก ก็ยังงงๆกับหลายๆอย่าง บางอย่างก็ยังไม่เข้าใจ สรุปว่าเวลาที่ผ่านมาผมก็ยังไม่เข้าใจอะไรเลยอยู่ดี

24Aug/110

PANDA


ในช่วงอาทิตย์ที่ผ่านมาผมมีงานที่จะต้องจัดการลิงค์ (backlink) ให้เวปไซค์เวปหนึ่ง ซึ่งสิ่งที่ได้เห็นและอยากจะแชร์ก็คือเรื่องที่ฮอตฮิต (ฮอตฮิตไปสัพักแล้วละ) เรื่องของ นั้นเอง สิ่งที่เห็นคือ เน็ตเวิร์คที่ถูกสร้างขึ้นมา โดยที่ไม่มีประโยชน์อันใดต่อมนุษย์ชาติ เป็นขยะไซเบอร์ เป็นตัวกินเน็ตเวิร์คทราฟฟิก แบบไร้ประโยชน์ประยังอันใด ซึ่งนั้นก็คือ เวปที่ถูกสร้าง/ปั่นขึ้นมา โดยมีเนื่อหา ที่ copy หรืออาจะ rewrite หรือ translate หรือวิธีการใดวิธีการหนึ่งที่ทำให้ นั้นเปลี่ยนรูปแบบไป เพื่อหวังผลให้ นั้นถูกมองว่าเป็น ที่ unique ซึ่งเวปเหล่านั้นถูก PANDA กินเรียบ ถูก deindex  กันเป็นแถวๆ

แต่ก็ยังมีบางเวปไซต์บางเน็ตเวิร์คที่ยังเหลือรอดมาอยู่ อาจจะเพราะอัลกอริธึมของ PANDA ยังไม่สมบูรณ์นักก็เป็นได้ แต่ถึงอย่างไรก็ตาม ได้ก็ได้เริ่มสร้างสังคมแบบยูโทเปีย สำหรับการค้นหาข้อมูลบนอินเตอร์เน็ตขึ้นมาแล้ว ซึ่งนั้นคือ สิ่งที่คุณต้องการค้นหา คุณจะได้ในสิ่งนั้นจริงๆ และยังมีส่วนย่อยๆลงไปอีกเช่น ย้อนหลังจำนวนกี่วัน ค้นหารูปที่เป็นสี ขาวดำ หรือรูปวาด เรียกว่า ไปไกลกว่าที่ใครจะตามทัน สุดท้ายขยะไซเบอร์เหล่านั้นก็ถูกกำจัดไป

PANDA อาจะมีเรื่องของเนื้อหาที่มีความสดใหม่ เช่น เนื้อหาที่มีความสดใหม่ มีความเป็น unique ไม่ซ้ำใคร จะเป็นที่ซื่นชอบของ Googlebot มากว่าเนื้อหาที่ซ้ำและเก่ากว่า (เป็นความเชื่อส่วนตัว) นั้นหมายความว่าเวปไซต์ที่มีการอัพเดตอยู่ตลอดเวลาจะเป็นที่ชื่นชอบมากกว่า เข้าตามหลักของ Web 2.0 ในที่สุด

แต่มีข้อชวนคิดอย่างหนึ่งสำหรับสิ่งที่ PANDA ทำไว้คือ PANDA ชื่อชอบเนื้อหาที่มีความสดใหม่ แต่ PANDA ยังไม่ได้เข้าใจในเนื้อหานั้นว่าพูดเกี่ยวกับอะไรมีประโยชน์สอดคล้องกับอะไรมากน้อยแค่ใหน หรือไม่อย่างไร ไม่แน่ ในอนาคตมันอาจจะมีการเข้าใจความหมายของเนื้อหาข้อความเหล่านั้นได้ เหมือนที่ Google ได้ทำกับ image search ที่สามาถค้นหา รูปวาด เหมือนจริง กราฟฟิก หรือแม้กระทั้งโทนสี นั้นแสดงว่า Google เริ่มมีการทำ Image Processing กับรูปภาพต่างในเวปแล้ว