คู่มือ Semalt On Scraper Extension สำหรับ Chrome

เพื่อให้ธุรกิจอยู่รอดและเติบโตในที่สุดจำเป็นต้องอยู่ก่อนคู่แข่งและความเสี่ยงต่าง ๆ การตัดสินใจบนพื้นฐานของข้อมูลการวิเคราะห์เป็นวิธีที่แน่นอนที่จะลืมเกี่ยวกับปัญหาเหล่านี้ ข้อมูลดังกล่าวสามารถรับได้โดยการกำจัดข้อมูล นั่นคือสิ่งที่ ส่วนเสริมของมีดโกน ที่ง่ายสำหรับ Chrome มา: มันจะไม่เพียง แต่อำนวยความสะดวกในกระบวนการของการเก็บข้อมูล แต่ยังทำให้สามารถขูดได้ทุกที่โดยไม่ต้องตั้งค่าที่ซับซ้อน

วิธีใช้มีดโกน

    1. สิ่งแรกที่คุณต้องทำคือติดตั้งส่วนขยายดังนั้นตรงไปที่ chrome web store, ค้นหา "scraper" และคลิกที่ add to Chrome

    2. นำทางไปยังเว็บไซต์ที่คุณตั้งใจจะ ขูดข้อมูล ทำเครื่องหมายรายการที่คุณสนใจโดยเน้นมัน คลิกขวาที่มันแล้วเลือก "ขูดที่คล้ายกัน" บนเมนูที่ปรากฏขึ้น

    3. การทำเช่นนั้นจะเป็นการเปิดหน้าต่างคอนโซลของเครื่องขูดแยกต่างหาก ที่นี่คุณจะเห็นรายการ ข้อมูลที่ถูกคัดลอก

    4. ในการบันทึกเนื้อหาคลิกที่ "บันทึกไปยัง Google เอกสาร" ซึ่งจะส่งออกข้อมูลไปยังสเปรดชีตของ Google โดยอัตโนมัติ

การขูดแบบขยาย

ในกรณีที่คุณวางแผนจะขูดข้อมูลเพิ่มเติมคุณสามารถใช้วิธีการขั้นสูง หมายเหตุมันจะง่ายกว่ามากถ้าคุณมีความรู้เกี่ยวกับ HTML สมมติว่าคุณต้องการที่จะขูดข้อมูลจากแหล่งที่มีการเก็บถาวรตามข้อมูลอนุกรมเวลา ในกรณีเช่นนี้หากคุณลองวิธีที่อธิบายข้างต้นคุณจะได้รับข้อมูลที่อ่านไม่ออก

เพื่อแก้ปัญหานี้คุณสามารถใช้ประโยชน์จากภาษาคิวรี HTML และ XML ที่รู้จักกันในชื่อ XPath มันทำอะไร? XPath จดจำข้อมูลเกี่ยวกับองค์ประกอบต่าง ๆ ที่มีอยู่ในการเลือกแต่ละรายการ ต่อไปนี้เป็นแนวทางในการเดินทาง:

1. ไปที่คอนโซล Scraper ที่ด้านบนซ้ายคุณควรสังเกตเห็นปุ่ม "XPath" คลิกที่มันและดำเนินการต่อเพื่อประกอบตารางเริ่มต้น

2. คุณต้องเขียน XPath สำหรับองค์ประกอบที่ถูกต้อง XPath ปัจจุบันซึ่งรวมถึงข้อมูลทั้งหมดจะถูกแสดงในรูปแบบเช่นนี้ "// div [3] / div [3] / div [2] / div" องค์ประกอบ <div> จะได้รับการยอมรับในเอกสาร HTML โดยคอมพิวเตอร์

3. ในการแยกข้อมูลที่รับรู้คุณต้องใช้คอลัมน์ Scraper ในการทำเช่นนั้นคุณต้องค้นหาข้อมูลประเภทต่างๆที่คุณมีอยู่ คุณอาจมีชื่อเรื่องขึ้นอยู่กับข้อมูลที่คุณคัดลอก ชื่อเหล่านี้จะปรากฏถัดจากชุดข้อมูลทุกชุด พวกเขามาพร้อมกับแท็กในกรณีนี้แท็ก <b>

4. การใช้องค์ประกอบตรวจสอบค้นหาและเพิ่มแท็ก <b> ใน XPath ของคุณ ตอนนี้คุณสามารถติดป้ายกำกับคอลัมน์แรกนี้เป็น "คอลัมน์ชื่อ" ตามที่จะแสดงรายการชื่อ ดำเนินการต่อเพื่อสร้าง XPath ที่แตกต่างกันสำหรับแต่ละคอลัมน์ที่คุณต้องการ

5. คลิกที่ขูดและส่วนขยายจะทำการเก็บเกี่ยวข้อมูลโดยอัตโนมัติและจัดระเบียบลงในคอลัมน์ต่างๆที่คุณตั้งไว้