Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Парсер/граббер

Модерирует : ShIvADeSt

ShIvADeSt (12-03-2018 00:26):  Версия для печати • ПодписатьсяДобавить в закладки

   

SammyKid

Редактировать | Цитировать | Сообщить модератору
Подскажите, пожалуйста, какой лучше использовать или с помощью какого языка лучше создать парсер или граббер.
 
Задание: Есть сайт интернет-магазина, в который добавили пункт "товары под заказ",где более 10к позиций, под каждую позицию хочется добавить картинку с сайта поставщика.  
 
Видел, что у конкурентов, менеджер каким-то образом написал макрос для Excel, но там объем работы поменьше (продукции потому что в разы меньше).
Раньше нанимали человека, который сидел и самолично находил и скачивал картинки, чтобы было без логотипа поставщика, сейчас это не актуально, поскольку можно автоматизировать процесс.
NEED UR HELP!

Отправлено: 13:52 11-03-2015
landy



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
PERL/PHP/Python/Delphi/C# - выбирай любой.
 
PS: чтобы не тягать картинки друг у друга есть специальные поставщики информации о товарах.

Всего записей: 573 | Зарегистр. 17-01-2003 | Отправлено: 18:43 11-03-2015
ziesto

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если будешь юзать Delphi, то новичку лучше использовать стандартные Indy компоненты, с ними намного проще работать.

Всего записей: 77 | Зарегистр. 16-07-2011 | Отправлено: 13:06 12-03-2015
gorenski



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SammyKid
Как ссылки к картинке определяешь, по наименованию номенклатуры?

Всего записей: 709 | Зарегистр. 29-01-2003 | Отправлено: 07:59 13-03-2015
miwa

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
python + lxml - тут тебе и xpath и csspath и DOM и очень много чего еще. Плюс в разы проще отладка/доработка под новый/измененный сайт.
 
landy

Цитата:
PS: чтобы не тягать картинки друг у друга есть специальные поставщики информации о товарах.

Можно узнать примеры поставщиков информации для товаров, выпущенных в России/Белоруси/Казахстане/Украине/Польше/Турции?

Всего записей: 455 | Зарегистр. 10-10-2004 | Отправлено: 16:03 13-03-2015 | Исправлено: miwa, 16:07 13-03-2015
SammyKid

Редактировать | Цитировать | Сообщить модератору
Всем спасибо.

Отправлено: 14:16 18-03-2015
Luckyniko

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет! Ребят, а может есть вариант готового простого парсера картинок, с минимальными типа условиями - по размеру там или размерам. Скачать например надо кучу картинок с библиотеки. Грабберы очень тупы типа IDM, Sjs и Datacol слишком сложен. Че нить просто работающее без супер программистских заморочек типа код писать, прост кнопачки чтоб были)

Всего записей: 4 | Зарегистр. 27-01-2017 | Отправлено: 16:24 01-02-2017
asutp2

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Luckyniko, есть, но за денежку

Всего записей: 619 | Зарегистр. 22-10-2004 | Отправлено: 18:17 01-02-2017
Luckyniko

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ок, как я понял, это частная разработка?
Могу я попробовать несколько нужных мне сайтов, вдруг не подойдет?

Всего записей: 4 | Зарегистр. 27-01-2017 | Отправлено: 23:59 01-02-2017
karpekinalex

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Datacol. Могу парсить, обращайтесь. Skape: ***

Всего записей: 8 | Зарегистр. 07-03-2008 | Отправлено: 23:39 11-03-2018 | Исправлено: karpekinalex, 23:41 11-03-2018
   

Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Парсер/граббер
ShIvADeSt (12-03-2018 00:26):



Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru