Парсинг контента

Ход работы по парсингу контента

1. Для начала запускаем плагин парсинга



2. Выбираем запрос для парсинга и число статей. Максимальное количество статей для парса за 1 проход равно 150.



3. Дожидаемся окончания процесса парсинга


4. Все спарсенные статьи попадают в корень проекта и видны в дереве проектов


5. Код спарсеных статей изобилует спецметками, ненужными тэгами и ссылками. Нужно его зачистить



6. Выбираем с SHIFT  необходимые статьи для зачистки в дереве проекта


7. Устанавливаем варианты зачистки текста и нажимаем OK


8.  Структурируем текст. Для этого создадим новую категорию под названием “Фотоаппараты”


9. Драг энд дропом перетаскиваем выбранные статьи в новую категорию


10. При необходимости допарсиваем новый контент и разносим его по категориям.

На этом контент готов для дальнейшей обработки

Наши проекты

Коммьюнити

Документация

Контакты

Форум: перейти
Е - mail: написать
ICQ тов. DrMax:120-105-786

Счетчики