Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Интернет » Web-программирование » Граббер страницы с другого сайта

Модерирует : Cheery

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6

Открыть новую тему     Написать ответ в эту тему

bim



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Скрипт запускается, например на baba.ru и результатом, выдаваемым польователю является определенная (например, заглавная) страница с сайта muzik.ru.
 
ОЧЕНЬ надо. Кто подскажет (или напишет) - отплачу рекламой на bim.km.ru или показами в RLE Classic.

Всего записей: 139 | Зарегистр. 04-08-2001 | Отправлено: 23:02 18-10-2001
SlyfoX



XPrienced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Наиболее простой способ - использовать модуль LWP, включённый в стандартную поставку ActivePerl. Пример использования:
 
use LWP::Simple;
$URL = "http://www.muzik.ru/somedir/somepage.html";
if (!defined ($source = get ($URL))) {
   die "script died while trying to receive $URL\n";
}

Всего записей: 1027 | Зарегистр. 20-04-2001 | Отправлено: 00:11 19-10-2001
bim



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Библиотечки LWP у хостера нет

Всего записей: 139 | Зарегистр. 04-08-2001 | Отправлено: 03:20 19-10-2001
Kiwi



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bim
 
Думаю, неслучайно библиотеки LWP у твоего хостера нет, но еще и внешние сокетные соединения запрещены. Выясни это. Без них - никак.  
 
А на счет LWP: поставь ее сам в директорию, где сайт хостится. Создай, например, поддиректорию lib и укажи в скрипте:

Код:
use lib 'путь к ней';

 
И если твои хостеры - ламеры получишь то, что нужно (хотя я сильно сомневаюсь).

Всего записей: 26 | Зарегистр. 02-10-2001 | Отправлено: 12:13 19-10-2001
Guest

BANNED
Редактировать | Цитировать | Сообщить модератору
SlyfoX

Цитата:
Наиболее простой способ - использовать модуль LWP, включённый в стандартную поставку ActivePerl. Пример использования:  
 
use LWP::Simple;  
$URL = "http://www.muzik.ru/somedir/somepage.html";  
if (!defined ($source = get ($URL))) {  
   die "script died while trying to receive $URL\n";  
}  

 
Не подскажете как потом вывести $source на экран?

Отправлено: 12:53 22-10-2001
Wowik



The Warlock
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не подскажете как потом вывести $source на экран?

print $source;


----------
Настоящие программисты не ищут легких путей!

Всего записей: 1192 | Зарегистр. 27-08-2001 | Отправлено: 04:34 23-10-2001
Guest

BANNED
Редактировать | Цитировать | Сообщить модератору
Wowik, спасибо.
 
 
Добавлено

Цитата:
use LWP::Simple;  
$URL = "http://www.muzik.ru/somedir/somepage.html";  
if (!defined ($source = get ($URL))) {  
   die "script died while trying to receive $URL\n";  
}  


Цитата:
print $source;  

 
Почему же тогда не работает такая программа (error 500):

Код:
 
#!/usr/bin/perl
use LWP::Simple;
$URL = "http://forum.ru-board.com";  
if (!defined ($source = get ($URL))) {  
   die "script died while trying to receive $URL\n";  
}  
print "$source";

Отправлено: 08:35 23-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Guest

Цитата:
Почему же тогда не работает такая программа (error 500):  

 

Код:
 
print "Content-type: text/html\n\n";
print "$source";
 

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 10:46 23-10-2001
Guest

BANNED
Редактировать | Цитировать | Сообщить модератору
batva, благодарю.
 
P.S. конечно, лучше фундаментально изучать предмет, тем так...

Отправлено: 13:06 23-10-2001
dvs



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Есть ещё Snoopy - класс на РНР
 
http://sourceforge.net/project/?group_id=2091

Всего записей: 333 | Зарегистр. 18-05-2001 | Отправлено: 13:56 23-10-2001
bim



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dvs
Интересная штук, только разбираться влом
 
В моем случае самое лучшее решение - паучек на Delphi: сдираем по HTTP, правим ссылки, льем по FTP.
ОК, всем спасибо за дельные советы!
Проблема через месяц отпадет

Всего записей: 139 | Зарегистр. 04-08-2001 | Отправлено: 00:42 24-10-2001
webxtor



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А как сграбить сразу (одновременно) несколько страниц? Говорят для этого LWP::PArallel нужен, а вот как его юзать мутно что-то... Главное: В PHP можно как-то реализовать?
 
Я ваще щас тему лучше сделаю по этому поводу..

Всего записей: 56 | Зарегистр. 09-04-2003 | Отправлено: 16:16 29-06-2003
exMIB



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как же всё-таки грабить определенные символы и строки с чужих страниц и помещать на свои?

Всего записей: 3337 | Зарегистр. 27-09-2001 | Отправлено: 18:50 06-11-2003
woffer

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как же всё-таки грабить определенные символы и строки с чужих страниц и помещать на свои?

Берешь страницы и парсишь их (eg). Или что-то другое в виду имелось ?

Всего записей: 935 | Зарегистр. 11-10-2002 | Отправлено: 22:01 06-11-2003
AntonNe

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
webxtor - что имеется ввиду под грабом страницы? если это показ нескольких страниц на своём сайте, то да на php это реализуется легко...
exMIB - берёшь код нужной страницы и очищаешь его от всего кроме нужных символов/строк

Всего записей: 3 | Зарегистр. 19-10-2003 | Отправлено: 17:48 07-11-2003
Tikhonov



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Библиотечки LWP у хостера нет  

 
Если LWP нет или сокеты запрещены, можно попробовать через wget, он почти везде стоит. Только скачанную страницу нужно отправить в STDOUT:
 
$wgetpath="/usr/bin";
$URL = "http://www.muzik.ru/somedir/somepage.html";  
$page=`$wgetpath/wget -O $URL`;
print "$page\n";

Всего записей: 9 | Зарегистр. 11-11-2003 | Отправлено: 23:37 11-11-2003
kisin

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Есть ещё Snoopy - класс на РНР  
http://sourceforge.net/project/?group_id=2091

Как я почитал - как раз нужная мне вещь, только установить не смог((.

Всего записей: 613 | Зарегистр. 30-12-2003 | Отправлено: 19:35 06-10-2004
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kisin

Цитата:
как раз нужная мне вещь, только установить не смог((.  

ну и?.. ну скажи, зачем это написал, если нет вопроса? нет подробного описания проблемы.

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 19:37 06-10-2004
kisin

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Snoopy.class.inc - его нету в архиве.

Всего записей: 613 | Зарегистр. 30-12-2003 | Отправлено: 19:42 06-10-2004
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kisin

Цитата:
Snoopy.class.inc - его нету в архиве.

советую обратить на тему.. речь о CGI, а не PHP
детский сад, млин.. переименуй Snoopy.class.php в Snoopy.class.inc и будет.
отсюда же очевидно

Цитата:
SYNOPSIS:
 
include "Snoopy.class.inc";
$snoopy = new Snoopy;
 

можно не переименовывать, а просто писать инклуд на php файл.

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 19:47 06-10-2004
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6

Компьютерный форум Ru.Board » Интернет » Web-программирование » Граббер страницы с другого сайта


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru