BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp

Автор Тема: BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp  (Прочитано 922 раз)

Оффлайн chaserАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 138
  • Сообщений: 357
  • Карма: 20
  • Пол: Мужской
    • Majento

Оффлайн chaserАвтор темы

  • Старожил
  • ****
1
Всем привет!

Представляю вашему вниманию бесплатную программу BatchURLScraper, предназначенную для извлечения данных со страниц сайтов используя XPath, CSS-селекторы, XQuery и RegExp.







Возможности программы BatchURLScraper:
  • парсинг и извлечение данных по списку URL
  • гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
  • модуль для тестирования правил парсинга
  • экспорт отчетов в Excel (CSV-формат)

Страница скачивания (5 Мб): https://site-analyzer.ru/soft/batch-url-scraper/

Буду рад любым отзывам и пожеланиям по работе программы.


Оффлайн dimacheg

  • Бизнес оценка: (0)
  • Пользователь
  • **
  • СПАСИБО: 14
  • Сообщений: 63
  • Карма: 2
    • Брусья для гимнастики и турники

Оффлайн dimacheg

  • Пользователь
  • **
Ребят, Вы просто не перестаёте удивлять.


Оффлайн chaserАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 138
  • Сообщений: 357
  • Карма: 20
  • Пол: Мужской
    • Majento

Оффлайн chaserАвтор темы

  • Старожил
  • ****
Ребят, Вы просто не перестаёте удивлять.
Спасибо, надеюсь, еще ни раз приятно удивим )

Оффлайн chaserАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 138
  • Сообщений: 357
  • Карма: 20
  • Пол: Мужской
    • Majento

Оффлайн chaserАвтор темы

  • Старожил
  • ****
Новая версия BatchURLScraper 1.3







Что нового:
  • расширено число страниц для парсинга с 1000 до 5000 URL
  • добавлена возможность скрапинга через HTML templates
  • добавлена возможность извлечения данных через атрибуты CSS
  • добавлена возможность скрапинга через внешний и внутренний HTML
  • добавлена возможность использования списков Proxy
  • исправлен баг некорректного сохранения User-Agent

Страница скачивания: https://site-analyzer.ru/soft/batch-url-scraper/

Оффлайн chaserАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 138
  • Сообщений: 357
  • Карма: 20
  • Пол: Мужской
    • Majento

Оффлайн chaserАвтор темы

  • Старожил
  • ****
Новая версия BatchURLScraper 1.4 (build 27), 08.12.2020:
  • исправлена ошибка с валидацией HTML-темплейтов
  • оптимизирована работа с регулярными выражениями
  • добавлена возможность неучета повторений при скрейпинге
  • исправлена проблема с учетом пауз между запросами
  • диапазон пауз между запросами расширен до полутора минут
  • доработан и улучшен перевод программы
  • устранены утечки памяти


 

Похожие темы

  Тема / Автор Ответов Последний ответ
2 Ответов
1364 Просмотров
Последний ответ 20-09-2011, 13:20:30
от nnpcto
1 Ответов
3535 Просмотров
Последний ответ 22-08-2013, 21:08:04
от moskitos80
11 Ответов
2988 Просмотров
Последний ответ 01-10-2014, 18:57:19
от DukeZ
6 Ответов
1635 Просмотров
Последний ответ 14-06-2015, 08:18:47
от vold57
1 Ответов
1144 Просмотров
Последний ответ 30-07-2015, 20:56:27
от back