Парсер

Web/сайты Прочее

Был(а) онлайн: 26.04.20 14:45
Umen 26 лет

1.0 Был(а) онлайн: 26.04.20 14:45

Недавно
Задача
Сбор информации о продавцах автозапчастей с сайта irr.ru

Алгорифм.
Заходим http://irr.ru/
В строку поиска забиваем «Для мазда-3». В результат получеам 15-20 страниц с объявлениями о продаже запчастей. Часть из них выделенна звездочкой либо еще чем-то. Часть не стодержит «Для Мазда-3» в тезисе. Нам нужно:
- обработать все страницы результата поиска;
- выделить те объявления, которые всецело релевантны запросу (точное соответствие фразы);
- скачать объявления, релевантные запросу;
- из этих объявлений составить список с четырьмя колонками, скажем:

Автомобиль Текст Телефон (телефоны) Даты выхода


объявлений
Для Мазда-3 запчасти б/у: капот, фара левая, радиатор


охлаждения, панель передняя, крыло правое,


продаю. 8-916-487-59-29 26.12.2008

- этот список сгруппировать по номерам телефонов, если строк с таким номером телефона больше одной – оставляем всецело текст первой строки, и добавляем в эту строку даты выхода других объявлений, с этого-же телефона.
- Объявления, выделенные цветом, звёздочкой либо чем ещё – в поле ТЕКСТ оббавляем в самое предисловие «* » (звёздочка и пробел);
- далее сортируем список по минимальному числу дат выхода и возвращаем пользователю;
- эту-же информацию сберегаем в .csv (и/или xls) файле, в намеренно сделанной директории;
- пользователю предлагается ссылка для скачивания этого файла.


оплата WM по факту выполнения
ставки без цены и сроков не рассматриваются
новички (кто в сервисе менее месяца) а также студии - проходим мимо

ваши предложения не видны другим

Чтобы добавить заявку к этому заказу, нужно войти или зарегистрироваться

Мой блок

26.04.20 14:45
Umen 26