Reversing Center
Дистанционный центр по исследованию защитного ПО.
Используя WebHarvy, вы можете легко извлекать текст, HTML, изображения, URL-адреса и электронные письма с любого веб-сайта и сохранять полученные данные в различных форматах.
Screenshot_2.jpg


Возможности WebHarvy

Невероятно прост в использовании. WebHarvy может собирать данные с любого веб-сайта, обрабатывать вход в систему, отправку форм, навигацию, нумерацию страниц, категории и ключевые слова. Поддерживает прокси и парсинг по расписанию.

Легкий просмотр веб-страниц

Web Scraping легко с помощью интерфейса WebHarvy «укажи и щелкни». Нет необходимости писать код или скрипты для сбора данных. Вы будете использовать встроенный браузер WebHarvy для загрузки и навигации по веб-сайтам, и вы можете выбирать данные для очистки с помощью щелчков мыши.

Интеллектуальное обнаружение шаблонов

WebHarvy автоматически определяет шаблоны данных, встречающихся на веб-страницах. Для извлечения списка или таблицы элементов (имя, адрес, адрес электронной почты, цена и т. д.) с веб-страницы дополнительная настройка не требуется. Если данные повторяются, WebHarvy автоматически очищает их.

Сохранить в файл или базу данных

Собранные данные могут быть сохранены в различных форматах. Текущая версия программного обеспечения WebHarvy Web Scraping позволяет сохранять очищенные данные в виде файлов Excel, XML, CSV, JSON или TSV. Вы также можете экспортировать данные в базу данных SQL.

Обработка нумерации страниц

Часто веб-сайты отображают данные, такие как списки продуктов или результаты поиска, на нескольких страницах. WebHarvy может автоматически сканировать и очищать данные с нескольких страниц. Просто укажите «ссылку на следующую страницу», и WebHarvy автоматически соберет данные со всех страниц.

Отправить ключевые слова

Извлекайте данные, автоматически отправляя список входных ключевых слов в формы поиска. Любое количество входных ключевых слов может быть отправлено в несколько текстовых полей ввода для выполнения поиска. Данные из результатов поиска для всех комбинаций входных ключевых слов могут быть извлечены.

Защита конфиденциальности

Чтобы очистить данные анонимно и предотвратить блокировку программного обеспечения веб-очистки веб-серверами, у вас есть возможность доступа к целевым веб-сайтам через прокси-серверы или VPN. Можно использовать либо один прокси-сервер, либо список прокси-серверов.

Категория Скрапинг

WebHarvy позволяет собирать данные из списка ссылок, ведущих на похожие страницы/списки на веб-сайте. Это позволяет вам очищать категории и подкатегории на веб-сайтах, используя единую конфигурацию.

Обычные выражения

Регулярные выражения (RegEx) можно применять к текстовому или HTML-источнику веб-страниц для извлечения соответствующей части. Этот мощный метод предлагает вам больше гибкости и контроля при очистке данных.

Поддержка JavaScript

Запустите свой собственный код JavaScript в браузере перед парсингом данных. Это можно использовать для взаимодействия с элементами страницы, изменения DOM или вызова функций JavaScript, уже реализованных на целевой странице.

Очистка изображения

Изображения могут быть загружены или URL-адреса изображений могут быть очищены. WebHarvy может автоматически очищать несколько изображений, отображаемых на страницах сведений о продукте на веб-сайтах электронной коммерции.

Автоматизируйте задачи браузера

WebHarvy можно легко настроить для выполнения таких задач, как переход по ссылкам , выбор параметров списка/раскрывающегося списка , ввод текста в поле , прокрутка страницы , открытие всплывающих окон и т. д.
View hidden content is available for registered users!
Стоимость - 699$
FREE download for ForumManager:thumbsup:
  • Мне нравится
Reactions: backdoor
Author
R.Center
Views
1,880
First release
Last update
Rating
0.00 star(s) 0 ratings

Share this resource

Latest updates

  1. WebHarvy 7.9.0.246

    Update
  2. WebHarvy 7.9.0.245

    Update
  3. WebHarvy 7.8.0.244

    Update
  4. WebHarvy 7.7.0.240

    Update
  5. WebHarvy 7.7.0.238

    Update
  6. WebHarvy 7.6.0.233

    WebHarvy 7.6 Released – Updated Browser & Input Text feature The main change in this version is...
  7. WebHarvy 7.5.0.230

    Update
  8. WebHarvy 7.0.1.207

    Update
  9. WebHarvy 6.5.0.194

    Update
Top