EP 17: XML Sitemap & Robots.txt: ‘แผนที่’ และ ‘ป้ายบอกทาง’ สำหรับ Googlebot
เอาล่ะครับ! นักวางผังเมืองเว็บไซต์ทุกท่าน! 🗺️🚫 หลังจากที่เราเสริมเกราะป้องกันความปลอดภัย (EP 16) ให้ “บ้านเว็บ” ของเราแน่นหนาแล้ว คราวนี้เราจะมาทำหน้าที่เป็น “เจ้าบ้านที่ดี” คอยอำนวยความสะดวกให้กับ “แขกคนสำคัญ” ที่มาเยี่ยมเยียนเว็บเราบ่อยที่สุด… นั่นคือ “Googlebot” (ไอ้แมงมุมเก็บข้อมูลของ Google) นั่นเอง! 🕷️🤖
เพื่อให้ Googlebot สามารถ “คลาน” (Crawl) และ “จัดทำดัชนี” (Index) เว็บไซต์ของเราได้อย่าง “มีประสิทธิภาพ” และ “ครบถ้วน” มากที่สุด เราจำเป็นต้องเตรียม “เอกสารสำคัญ” 2 ฉบับไว้ให้มันครับ นั่นคือ “XML Sitemap” (แผนที่เว็บไซต์) และ “Robots.txt” (ป้ายบอกทาง/ป้ายห้ามเข้า)
สองอย่างนี้อาจจะฟังดู “เทคนิค” นิดหน่อย แต่จริงๆ แล้วมัน “ไม่ซับซ้อน” อย่างที่คิด และ “สำคัญ” ต่อการทำ Technical SEO มากๆ ครับ!
EP นี้ เราจะมาทำความรู้จักกับ “แผนที่” และ “ป้ายบอกทาง” สำหรับ Googlebot กันครับ! มาดูกันว่าแต่ละอย่างคืออะไร? มีไว้ทำไม? และเราจะสร้าง/ใช้งานมันได้อย่างไร?
1. XML Sitemap: “แผนที่” นำทางสู่ทุกซอกมุม! 🗺️📍

- คืออะไร? “ไฟล์” (.xml) ที่ “รวบรวมรายการ URL ทั้งหมด” ของหน้าเว็บ “สำคัญๆ” ที่เรา “ต้องการ” ให้ Search Engine เข้ามา “ค้นพบ” และ “Index”
 - ทำไมต้องมี?
- ช่วย Googlebot “หาเจอ” ทุกหน้า (โดยเฉพาะหน้าใหม่/หน้าที่อยู่ลึก)
 - บอก “ข้อมูลเพิ่มเติม” (วันที่อัปเดต, ความถี่, ความสำคัญ) ช่วย Bot จัดลำดับการ Crawl
 - เร่งกระบวนการ Index หน้าใหม่
 
 - หน้าไหน “ควร” / “ไม่ควร” อยู่ใน Sitemap?
- ควร: หน้าสำคัญที่อยากให้ติดอันดับ (Homepage, บริการ, สินค้า, Blog)
 - ไม่ควร: หน้าซ้ำซ้อน, หน้าคุณภาพต่ำ, หน้าที่ถูกบล็อกโดย Robots.txt, หน้าต้องล็อกอิน
 
 - สร้างยังไง? (ง่ายกว่าที่คิด!)
- ถ้าใช้ WordPress: ง่ายสุด! Plugin SEO ยอดฮิต (Yoast, Rank Math) “สร้างให้อัตโนมัติ” เลย! (URL มักจะเป็น 
yourdomain.com/sitemap_index.xml) - ถ้าไม่ได้ใช้ WordPress: ใช้ “เครื่องมือสร้าง Sitemap ออนไลน์” หรือเช็คฟีเจอร์ของ Website Builder ที่ใช้
 
 - ถ้าใช้ WordPress: ง่ายสุด! Plugin SEO ยอดฮิต (Yoast, Rank Math) “สร้างให้อัตโนมัติ” เลย! (URL มักจะเป็น 
 - ทำยังไงต่อ? เอา URL ของ Sitemap ไป “ส่ง” (Submit) ให้ Google รู้จัก ผ่าน “Google Search Console (GSC)” (เมนู Sitemaps)
 
เปรียบเทียบ: XML Sitemap เหมือน “สารบัญ” หรือ “แผนผัง” ของหนังสือ/อาคาร 🗺️ ช่วยให้คนอ่าน (Googlebot) หาเนื้อหาเจอได้ง่ายและเร็ว
2. Robots.txt: “ป้ายบอกทาง” และ “ป้ายห้ามเข้า”! 🚫➡️

- คืออะไร? “ไฟล์ข้อความ” (.txt) ง่ายๆ (`yourdomain.com/robots.txt`) ที่ใช้ “บอก” Search Engine Bots ว่า “หน้าไหน/โฟลเดอร์ไหน” ที่เรา “อนุญาต” หรือ “ไม่อนุญาต” ให้เข้ามา Crawl
 - ทำไมต้องมี?
- ป้องกัน Bot เข้าไป Crawl “หน้าที่ไม่สำคัญ” หรือ “ส่วนตัว” (เช่น หน้า Admin, ตะกร้าสินค้า) >> ช่วย “ประหยัด Crawl Budget” และ “ไม่ให้ข้อมูลที่ไม่ควร Index” หลุดไป
 - บอก “ตำแหน่ง” ของ XML Sitemap ได้
 
 - เขียนยังไง? (โครงสร้างง่ายๆ):
User-agent:ระบุชื่อ Bot (*= ทุก Bot)Disallow:บอก Path ที่ “ห้าม” Crawl (เช่นDisallow: /admin/)Allow:บอก Path ที่ “อนุญาต” Crawl (มักใช้กับ Path ที่อยู่ภายใต้ Disallow)Sitemap:บอกตำแหน่ง Sitemap (เช่นSitemap: https://yourdomain.com/sitemap_index.xml)
 - ตัวอย่าง Robots.txt ง่ายๆ:
User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php Sitemap: https://yourdomain.com/sitemap_index.xml - สร้างยังไง? สร้างไฟล์ Text ชื่อ 
robots.txt-> ใส่คำสั่ง -> อัปโหลดไปที่ “โฟลเดอร์หลัก” (Root) ของเว็บ -> ทดสอบด้วย Robots.txt Tester (ใน GSC เก่า) หรือเครื่องมือออนไลน์ - ข้อควรระวัง!** การตั้งค่า Robots.txt “ผิด” อาจจะส่งผลเสียร้ายแรง! (เช่น เผลอ Disallow ทั้งเว็บ!) >> **ถ้าไม่แน่ใจ ปล่อยให้ Plugin จัดการ (สำหรับ WordPress) จะปลอดภัยกว่า!**
 - สำคัญ: Robots.txt ใช้ “ห้าม Crawl” แต่ “ไม่ได้ห้าม Index” เสมอไป! (ถ้าต้องการห้าม Index ต้องใช้ Meta Tag “noindex”)
 

สรุป: XML Sitemap และ Robots.txt คือ “เครื่องมือสื่อสาร” สำคัญ ระหว่างเรากับ Search Engine Bots การมี “แผนที่” (Sitemap) ที่ชัดเจน จะช่วยให้ Bot สำรวจเว็บเราได้ “ครบถ้วน” และการมี “ป้ายบอกทาง/ป้ายห้าม” (Robots.txt) ที่ถูกต้อง จะช่วยให้ Bot เข้าถึงเฉพาะ “ส่วนที่ควรเข้าถึง” เท่านั้น
ดูแล “เอกสาร” สองฉบับนี้ให้ดีนะครับ! (โดยเฉพาะการตั้งค่า Robots.txt ต้องระวัง!) มันจะช่วยให้การทำ Technical SEO ของคุณราบรื่น และเป็นที่รักของ Googlebot มากขึ้น! 😉
EP หน้า (EP 18) เราจะมาฝึกเป็น “นักสืบ” อีกครั้ง แต่คราวนี้คือการ “อ่านรายงาน” ผลลัพธ์ SEO ของเรา กับ “อ่าน ‘รายงาน’ Google Search Console & GA4 เบื้องต้น (รู้ว่าอะไรเวิร์ค/ไม่เวิร์ค)” มาดูว่าสิ่งที่เราทำไป มันได้ผลแค่ไหน! 📊📈