ตัวแยกวิเคราะห์ URL

เกี่ยวกับเครื่องมือนี้

คุณมี URL อยู่—อาจจากไฟล์ล็อก ข้อมูลที่ผู้ใช้ป้อน หรือเพียงแค่สิ่งที่คุณคัดลอกมาจากเว็บ—และต้องการแยกมันออกจากกัน ไม่ใช่แค่ดูเฉยๆ แต่ต้องการเข้าใจว่าแต่ละส่วนหมายถึงอะไร นี่คือจุดที่ตัวแยกวิเคราะห์ URL เข้ามามีบทบาท มันไม่ใช่เวทมนตร์ แต่ใกล้เคียงกัน จินตนาการว่ามันเหมือนมีดสวิสที่ใช้กับที่อยู่เว็บ คุณป้อน URL ที่ยุ่งเหยิงหรือซับซ้อนเข้าไป แล้วมันจะคืนค่าส่วนต่างๆ ที่สะอาดและมีการติดป้ายกำกับ: โปรโตคอล, โดเมน, พาธ, พารามิเตอร์คิวรี, แฟรกเมนต์—หรือสิ่งใดก็ตามที่มีอยู่

ผมได้ใช้เครื่องมือเหล่านี้มาหลายตัวในช่วงหลายปี และส่วนใหญ่จะอยู่ในระดับที่เกินความจำเป็นหรือเบื้องต้นเกินไป บางตัวพยายามทำทุกอย่าง—ตรวจสอบความถูกต้อง, เปลี่ยนเส้นทาง, ทำความสะอาด—ในขณะที่บางตัวแค่แบ่งสตริงแล้วถือว่าเสร็จ ส่วนตัวนี้? มันตรงไปตรงมา มันทำการแยกวิเคราะห์ นั่นแหละ ไม่มีอะไรเกินความจำเป็น หากคุณต้องการอะไรเพิ่มเติม คุณสร้างขึ้นจากมัน เรียบง่าย

คุณสมบัติหลัก

แบ่ง URL มาตรฐานใดๆ ออกเป็นส่วนประกอบหลัก—สกีม, โฮสต์, พอร์ต, พาธ, คิวรี, และแฟรกเมนต์
จัดการกับกรณีขอบเช่นโปรโตคอลที่ขาดหายไป, พอร์ตเริ่มต้น, และอักขระที่เข้ารหัสโดยไม่ทำให้เกิดข้อผิดพลาด
ส่งคืนพารามิเตอร์คิวรีในรูปแบบออบเจ็กต์หรือพจนานุกรมที่สะอาด เพื่อไม่ให้คุณต้องแบ่งและถอดรหัสด้วยตนเอง
ทำงานได้ทั้งกับ URL แบบสัมบูรณ์และสัมพัทธ์ เพราะพูดตามตรง ไม่ใช่ทุกลิงก์จะเริ่มด้วย “https://”
เบาและรวดเร็ว—ไม่มีการพึ่งพาภายนอก, ไม่มีส่วนเกิน แค่แยกวิเคราะห์แล้วไปต่อได้เลย
มีให้ใช้งานในหลายภาษา (JavaScript, Python, ฯลฯ) เพื่อให้คุณใช้ได้ทุกที่ที่โค้ดของคุณอยู่

คำถามที่พบบ่อย

คำถาม: มันตรวจสอบความถูกต้องของ URL หรือแค่แยกวิเคราะห์เฉยๆ?
คำตอบ: มันแยกวิเคราะห์ หากคุณป้อนข้อมูลที่ไม่เหมาะสม เช่น “htp:/broken-url” มันจะยังพยายามทำความเข้าใจ แต่จะไม่บอกว่า “เฮ้ นี่ไม่ถูกต้อง” นั่นเป็นหน้าที่ของคุณ หากคุณต้องการการตรวจสอบความถูกต้อง ให้จับคู่กับ regex หรือตัวตรวจสอบที่เฉพาะเจาะจง การแยกวิเคราะห์และการตรวจสอบความถูกต้องเป็นงานที่ต่างกัน

คำถาม: ที่เกี่ยวกับโดเมนนานาชาติหรือการเข้ารหัสที่แปลกๆ ล่ะ?
คำตอบ: ใช่ มันจัดการอักขระที่เข้ารหัสแบบเปอร์เซ็นต์ (เช่น %20 สำหรับช่องว่าง) และถอดรหัสออกมาอย่างถูกต้อง สำหรับโดเมนนานาชาติ (เช่น .рф หรือ .中国) มันถือว่าอยู่ในรูปแบบ Punycode แล้วหากจำเป็น—ระบบสมัยใหม่ส่วนใหญ่จัดการเรื่องนั้นก่อนที่ URL จะถึงตัวแยกวิเคราะห์ของคุณ เพียงอย่าคาดหวังว่ามันจะแปลภาษาซีริลลิกให้คุณ