Грабер

Web/сайты Прочее

Был(а) онлайн: 26.04.20 14:45
Umen 26 лет

1.0 Был(а) онлайн: 26.04.20 14:45

Недавно
Для сайта www.life360.ru нужно сделать экспорт новых материалов с разных сайтов (грабер) в библиотеку нашего сайта.

1. Для админа вероятность добавлять и удалять сайты в грабер и из.

2. Редактировать экспорт если обновился сайт-донор

3. Удалять ранее добавленные материалы

4. RSS на сайте www.life360.ru "новые материалы" для раздела "библиотека".

5. Система тегов – вероятность назначать тег (раздел, метка) для статей, экспортируемых с сайта-донора либо одно из его разделов. Идентичные теги добавленные к различным донорам обязаны объединять статьи различных доноров под одним тегом.

6. Группировка экспортированных материалов по тегам.

7. Облако тегов.

8. Рейтинг тегов – зависит от числа статей для данного тега.

9. Группировка статей в разделе (раздел – тег) по – самые читаемые, самые комментируемые.

10. Комментарий к статье

11. Функция "Подметить как прочитанную" – огромнее не показывать зарегенному юзеру эту статью. Не зарегенные юзеры эту функцию не видят. (ЭТОГО НЕ НАДОБНО. УДАЛИЛ ИЗ ТЗ)

12. Ссылка в статье на сайт-донор (показывать – не показывать на нашем сайте ссылку на сайт-донор).

13. Функция "так же в этом разделе" – нечаянно выбранные статьи из этого раздела (статьи маркированные одним тегом).

14. Облако тегов.

15. На нашем сайте – обособленный раздел "библиотека".

16. Скрипт должен запускаться кроном. Задачи обязаны быть непрерывные и временные. Непрерывные - которые он весь день будет делать либо там определенное число раз в день либо в неделю, а временные - пока не исполнит до конца. Вероятность указывать частоту исполнения скрипта для всякого сайта-донора.

17. Если на сайте-доноре имеется дата добавления статьи, должна трудиться функция – "взять статьи с ХХ. По УУ". Либо с Х и до самой первой. (То есть, я могу захотеть импортировать теснее имеющиеся статьи, а могу только получать новые с какого-то момента.

18. Фотографии в материалах – для всякого сайта своя настройка – брать фото из материала либо нет.

19. Если материал на сайте-доноре большого размера и разбит на страницы, надобна вероятность настроить правила для экспорта такого типа материалов. Скачать их все на сайт, если ссылка типовая (материалы по ссылкам из материалов качать не надобно).

20. Вписать новейший раздел в присутствующий дизайн нашего сайта.

От себя добавлю: я выбираю исполнителя, ориентируясь на вопросы, которые Вы задаете (толковые - +, нет вопросов -; По дополнениям, которые Вы предлагаете (есть идеи +, нет -.).

И позаботьтесь о себе - сразу укажите сумму и срок. Если секрет ото всех, отпишите мне индивидуальной почтой, но заявку оставьте все равно.

[Дополнение: Вт, 05 Июн 2007 11:54]

Дополнения к ТЗ позже результатов на ТОЛКОВЫЕ вопросы.

1. Сайт-донор www.psylive.ru – написан на ASP. www.nkozlov.ru написан на пхп. Потому что предполагается подключение и других сайтов, надобна эта вероятность. Каких- пока не знаю. Либо это нужно знать непременно прямо теперь?
Необходима вероятность задать для сайта-донора исходный и финальный код с сайта, позже котого и до которого надобно брать материалы. То есть, сайты традиционно имеют какой-то код, тот, что указывает на предисловие и конец материалы.
Из импортированного материала обязаны удаляться джава-скрипты, реклама, ifreim и т.д. Согласуем по началу работы.
То есть, на выходе я должен иметь чистый текст, в котором осталась только разметка текста (параграфы, шрифты и т.д.). подключенные жанры удалять. Опцию стайл оставлять. Класс либо ид - удалять.
Итог материала у нас должен быть на жанрах, дабы мы могли менять форматирование материалов у себя на сайте.

2. На сайте может быть РСС, может не быть. Вероятность брать данные из РСС – необходима.
3. Облако тегов http://www.life360.ru/interests.php - пример. Толщина и размер слова (тега) зависит от частоты применения этого тега. В этом ТЗ – от числа материалов в всем тегу.
4. Комментарии к статье могут оставлять только зарегенные пользователи.
5. Наш сайт сделан на ПХП4. Движок самописанный. Вы, реально, напишите обособленный блок, тот, что будет иметь свою страницу и свою папку www.life360.ru/news
6. Если хотите, можете написать один скрипт для выполнения непрерывных задач, а иной для разовых (если я хочу выкачать что-то откуда-то за раз и все). Это не критично для меня.
7. Грабер может быть написан на ПХП4, на Перл. Итог итогов на ПХП4. Можете предложить свои варианты языка программирования. Посмотрим поддерживает ли их мой хост. Хост у меня колакейшн.
8. Надобна помощь прокси и многопоточности. Получается грабер должен перебирать прокси серверы, находить рабочий и трудиться через него.
Ответил на все вопросы.

[Дополнение: Вт, 05 Июн 2007 13:17]

С www.psylive.ru
http://psylive.ru/main.asp?gl=1
http://psylive.ru/main.asp?gl=3
http://psylive.ru/main.asp?gl=2
http://psylive.ru/main.asp?gl=7
http://psylive.ru/main.asp?gl=16
http://psylive.ru/main.asp?gl=8
http://psylive.ru/main.asp?gl=14
http://psylive.ru/main.asp?gl=18
http://psylive.ru/main.asp?gl=23
http://psylive.ru/main.asp?gl=30
http://psylive.ru/main.asp?gl=17
http://psylive.ru/main.asp?gl=19
http://psylive.ru/main.asp?gl=20
http://psylive.ru/main.asp?gl=5
http://psylive.ru/main.asp?gl=22
http://psylive.ru/main.asp?gl=12
http://psylive.ru/main.asp?gl=27
http://psylive.ru/main.asp?gl=29
http://psylive.ru/main.asp?gl=13
http://psylive.ru/main.asp?gl=10
http://psylive.ru/main.asp?gl=28
http://psylive.ru/main.asp?gl=4
http://psylive.ru/main.asp?gl=6

www.nkozlov.ru

http://nkozlov.ru/library/s132/
http://nkozlov.ru/library/s41/
http://nkozlov.ru/library/s318/
http://nkozlov.ru/library/s42/
http://nkozlov.ru/library/psychology/

http://nkozlov.ru/library/s45/
http://nkozlov.ru/library/s221/
http://nkozlov.ru/library/s218/
http://nkozlov.ru/library/other/
http://nkozlov.ru/library/s55/



тут еще и подразделы есть. весь из них обозначить тегом, соответствующим наименованию раздела. То есть, весь подраздел в разделе будет отдельным тегом, потому что теги присваиваются отдельному "потоку". поток - это отдельная страница, откуда происходит импорт.

Чтобы добавить заявку к этому заказу, нужно войти или зарегистрироваться

Мой блок

26.04.20 14:45
Umen 26