Рубрика // Новичкам 03.03.12

Что такое граббер и парсер сайтов?

0511-0903-2623-1931_Man_with_a_Rake_clipart_image Граббером называют специальный скрипт, с помощью которого можно "выкачивать" необходимую информацию с чужих сайтов на свой.

Парсер же может не только распознать информацию в куче "мусора", но и обработать ее согласно поставленной задаче. На сегодняшний день оба термина принято использовать в качестве синонимов.

У грабберов и парсеров есть несколько ключевых функций. Во-первых, автоматическое обновление страниц. Сайт, на котором свежие новости и статьи появляются редко, как правило, имеет мало посетителей. Если у вас нет времени на регулярную публикацию материалов, на помощь придет парсинг сайтов на заказ или парсер новостей, который будет автоматически добавлять информацию на ваш ресурс с ресурсов схожей тематики.

Во-вторых, поддержание актуальности информации. Например, пользователи вашего сайта хотят знать погоду в своем регионе на данный момент времени. Изменять подобные данные вручную — неудобно и слишком затратно по времени. Для решения такой проблемы идеально подойдет php парсер или скрипт граббера.

В-третьих, мгновенное наполнение сайта и сбор информации в интернете. Понятно, что все ресурсы когда-то начинались с "нуля". Впрочем, если цель вашего сайта — предоставление какой-либо информации (тексты и аккорды песен, каталог ссылок и т. п.), то делать всю работу вручную с чистого листа — крайне трудоемко.

В-четвертых, интегрирование информации. Во всемирной паутине огромное количество сайтов, на которых находится важная для пользователей информация, одним из немногих недостатков которой можно назвать разрозненность. Использование скриптов грабберов контента сайта позволит вам объединить все необходимые материалы, поместив их на одну страницу.

  • Facebook
  • Memori
  • Twitter

2 Комментариев к " Что такое граббер и парсер сайтов? "

  1. Какие граберы и парсеры вы можете посоветовать? Я знаю на языке python есть несколько мощных фреймворков для парсинга — это scrapy и ещё grab. Они позволяют парсить сайты многопоточно и даже обходить капчу.

    • Артем:

      Я использую Content Downloader. Десктоптная версия, считаю его самым лучшим парсером контента. Годится не только для парсинга текста, но и для сбора ссылок, анкоров, есть сканер сайтов. Публикую на сайты с помощью Textkit или Зеброид

Написать комментарий

Copyright © 2010-2011 Как создать сайт и заработать.. Все права защищены.
интернет