„Semalt“ pateikia žiniatinklio grandymo įrankių bandymo rezultatus

Kiekvienas vartotojas susiduria su dviem galimybėmis, kai nori naudoti žiniatinklio grandymo įrankius. Jie naudoja įprastą žiniatinklio grandiklį arba pasirinktinį grandiklį. Nors tinkintas grandiklis yra geresnis pasirinkimas, daugelis žmonių jo vengia, nes jo kaina yra aukšta. Priemonė turi būti sukurta atsižvelgiant į jūsų verslą ir pageidavimus, todėl ji reikalauja daug darbo.

Kita vertus, standartiniai žiniatinklio grandikliai yra pernelyg bendri, nes jie yra skirti bendroms žiniatinklio grandymo užduotims. Paprastai jie yra geresni kai kuriuose žiniatinklio grandymo projektuose, o kituose dirba blogus darbus. Tam, kad būtų lengviau padaryti teisingą pasirinkimą, kai kuriems interneto grandikliams buvo atlikti nuodugnūs žiniatinklio grandymo bandymai, o rezultatai pateikti žemiau.

Testo kriterijai

Tinklo grandikliai buvo išbandyti atliekant šias įprastas duomenų gavimo užduotis. Jie buvo tikrinami dėl sugebėjimo subraižyti lentelių ataskaitas, teksto sąrašus ir prisijungimo formas. Be to, buvo patikrinta, ar žiniatinklio grandikliai gali išgauti duomenis iš dinaminių tinklalapių, pastatytų AJAX. Paprastai tai yra viena iš sunkiausių užduočių daugeliui žiniatinklio grandžių. Taip pat buvo išbandytas jų sugebėjimas valdyti „Captcha“. Galiausiai buvo patikrinta jų galimybė valdyti blokų išdėstymą.

Testo rezultatai

Tikrinti žiniatinklio grandymo įrankiai yra „Content Grabber“, „Visual Web Ripper“, „Helium Scraper“, „Screen Scraper“, „OutWit Hub“, „Mozenda“, „WebSundew Extractor“, „Web Content Extractor“ ir „Easy Web Extractor“.

Rezultatai parodė, kad „Content Grabber“ yra geriausias, nes jis puikiai veikė visose patikrintose vietose. Taigi jis pelnė aukščiausią vidutinį įvertinimą. Taip pat buvo pastebėta, kad visi žiniatinklio grandymo įrankiai galėjo nuskaityti prisijungimo formas ir nuskaityti duomenis iš tinklalapių, sukurtų naudojant AJAX. Taigi, jei dėl šių dviejų priežasčių jums reikia žiniatinklio grandiklio, galite pasirinkti bet kurią iš jų. Jiems abiems srityse sekėsi labai gerai.

Kitas turinio grabberio spektaklis yra „Visual Web Ripper“. Jis gerai pasirodė visose srityse, bet ne taip gerai, kaip „Content Grabber“, todėl uždirbo vidutinį 4.5 įvertinimą. Kitas žiniatinklio įrankis yra „Helium Scraper“. Jo veikimas yra beveik toks pat geras kaip „Visual Web Ripper“. Vienintelė „Helium Scraper“ problema yra prasti jo darbai tvarkant blokų išdėstymą.

Remiantis testo rezultatais, žiniatinklio grandymo įrankiai buvo vykdomi tokia tvarka: „Content Grabber“, „Visual Web Ripper“, „Helium Scraper“, „Screen Scraper“, „OutWit Hub“, „Mozenda“, „WebSundew Extractor“, „Web Content Extractor“ ir „Easy Web Extractor“, kurie pasižymi blogiausiu našumu. .

Išvada

Atsižvelgiant į aukščiau analizuotus testų rezultatus, „Content Grabber“ visose bandymo kategorijose gavo 5 balus. Taigi, akivaizdu, kad geriausia. Gali reikėti ir tai išbandyti. Deja, du interneto grandikliai buvo pašalinti iš bandymo dėl skirtingų priežasčių. „Web Data Extractor“ ir „WebHarvy“ kūrėjai ištraukė savo produktus iš bandymo.

Nepaisant to, kad nedalyvavo bandyme, apie juos abu buvo išmokta keleto dalykų. „WebHarvy“ yra skirtas nuskaityti duomenis iš tinkamai suformatuotų puslapių sąrašų, o „Web Data Extractor“ skirtas tik el. Laiškų, URL rinkimui ir kt.