|
|
|
Всем привет!
Представляю вашему вниманию бесплатную программу BatchURLScraper, предназначенную для извлечения данных со страниц сайтов используя XPath, CSS-селекторы, XQuery и RegExp.
Возможности программы BatchURLScraper:
- парсинг и извлечение данных по списку URL
- гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
- модуль для тестирования правил парсинга
- экспорт отчетов в Excel (CSV-формат)
Страница скачивания (5 Мб): https://site-analyzer.ru/soft/batch-url-scraper/
Буду рад любым отзывам и пожеланиям по работе программы. |
|
|
|
|
|
Новая версия BatchURLScraper 1.3
Что нового:
- расширено число страниц для парсинга с 1000 до 5000 URL
- добавлена возможность скрапинга через HTML templates
- добавлена возможность извлечения данных через атрибуты CSS
- добавлена возможность скрапинга через внешний и внутренний HTML
- добавлена возможность использования списков Proxy
- исправлен баг некорректного сохранения User-Agent
Страница скачивания: https://site-analyzer.ru/soft/batch-url-scraper/ |
|
|
|
|
|
Новая версия BatchURLScraper 1.4 (build 27), 08.12.2020:
- исправлена ошибка с валидацией HTML-темплейтов
- оптимизирована работа с регулярными выражениями
- добавлена возможность неучета повторений при скрейпинге
- исправлена проблема с учетом пауз между запросами
- диапазон пауз между запросами расширен до полутора минут
- доработан и улучшен перевод программы
- устранены утечки памяти
|
|
|
|
|
|
|
|