Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Тематические » Системы управления сайтами » Индексация в поисковиках (Яндексе)

Модерирует : Antuan

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3

Открыть новую тему     Написать ответ в эту тему

FatCat



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мы тут Uniq'ом  довольно интересно общаемся по почте, я подумал перенести обсуждение сюда - может кому интересно будет.
Не знаю как вам, но я с одного Яндекса раньше имел +150 хостов в день, столько же сколько с баннеров.
 
 
На практике выяснили что Яндекс вполне нормально индексит Нюковые сайты, т.е. "жрет" знаки ? и т.п. У меня как раз сейчас  сайт переиндексируется с нуля.
 
Единственный минус, который мы заметили - он подставляет в описание поле description (первые 250 кажись символов). А зараза Нюк лепит туда по стандарту слоган сайта. Что есть очень-очень некрасиво с его стороны. Получаются одинаковые страницы, вот такие:
 
http://www.yandex.ru/yandpage?q=184213250&p=35&qs=text%3D%26serverurl%3Dwww.rolemancer.ru/%26refine%3D
 
Не прикольно, да?
:(((
 
Проблема решается просто - нужно генерить поле description точно так же как мы генерили поле keywords, только нужно всего лишь взять  и дописать в sections.php в функцию function viewarticle глобальную переменную $browserdescription, вставить строку:
 

Код:
 
$browserdescription = strip_tags(substr($content,0,800));
 

 
в главном header.php также прописываем  $browserdescription как глобальную и заменяем генерацию тега description на:

Код:
 
if ($browserdescription == "") {echo "<meta name=\"description\" content=\"$slogan\">\n";} else  
{echo "<meta name=\"description\" content=\"$browserdescription\">\n"; }
 

 
Кстати, сразу вопрос  - если в тексте есть переводы строки (через /n), то он будет весь браться поисковиком или только до перевода строки?
 
Сейчас мой сайт как раз индексится, вчера было 344 страницы, сегодня уже 400 (во тормозит, а?), так что завтра увидим результаты.
 
Собственно, то же самое можно делать в articles.
 
Кстати, как оказалось, Яндекс индексит все два жды. Для articles это разные режимы просмотра (у меня хак стоит, который показывает в plain новости по отдельной категории), для sections - это режим просмотра перед печатью.
 
Тем самым мы поисковик спаммим однозначно!
 
Вот.  
 
 
Есть еще одна проблема, которую я бы хотел обсудить - Яндекс пишет что сервер не выдает дату модификации файла. Как вы думаете - что будет лучше - лепить в тег текущую дату или честно брать из базы дату занесения статьи/новости и подставлять ее.
А также есть непростая тема по "упрощению адресов" в которой я пока не разобрался, то тоже интересно.
 
http://www.rolemancer.ru/articles/3145 выглядит понятнее, чем
http://www.rolemancer.ru/article.php?sid=3145&mode=thread&order=0&thold=0.
 
У кого есть мысли как это сделать через Апач? Я просто еще не ковырялся в mod'ах, но видел такое уже на многих сайтах.
 
 

Всего записей: 346 | Зарегистр. 10-07-2001 | Отправлено: 11:07 11-10-2001
Uniq



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
FatCat, пока я собирался, ты уже открыл :)
 
Насчет даты модификации, думаю лучше выдавать реальную дату. Насчет быстрой индексации. Как известно, поисковики обходят сайты послойно. В первый заход только главную страницу, во второй - все ссылки с главной, в третий... И примерно 1 заход в две недели. Так вот, у меня около 1500 статей. Они доступны только через фэткэтовский хак календаря, так называемый архив. Итак, чтобы тому же боту Яндекса добраться до статьи, ему надо пройти такой путь
1. www.rikatv.kz/index.php
2. http://www.rikatv.kz/modules.php?op=modload&name=NS-Calendar&file=index - таблица с архивом новостей за текущий месяц
3. http://www.rikatv.kz/modules.php?op=modload&name=NS-Calendar&file=index&type=year&Date=10/11/2001 - табличка с архивом новостей за текущий год
4. http://www.rikatv.kz/modules.php?op=modload&name=NS-Calendar&file=index&Date=03/05/2001&type=day - архив новостей за текущий день
5. http://www.rikatv.kz/article.php?sid=126 - сама статья.
 
То есть в лучшем случае, поисковик доберется до самой статьи только за три месяца. А ведь Яндекс - самый быстрый поисковик по скорости индексации. :( В общем, полный отстой.
 
В общем, что я предлагаю. Если есть спецы по PHP, написать хак, выводящий на одной странице все заголовки всех новостей, понятно что со ссылками на полную новость. Эту страничку зарегистрировать вовсех поисковиках. И тогда за два захода ваш сайт будет проиндексирован (ну и мой понятно тоже).
Могу и сам написать, но у программистов думаю код будет легче и изящнее.
 
Слово FatCat'у.

Всего записей: 128 | Зарегистр. 30-07-2001 | Отправлено: 12:41 11-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Uniq

Цитата:
Так вот, у меня около 1500 статей.  

а если на одной странице столько будет ссылок, яндекс это сожрет думаешь?
Может он примет это за спам?
Вообщем я написал скрипт, там я вывел как заголовок <h1> (его говорят любят очень поисковики?) название категории, название темы, и название статьи. Может надо другой порядок, сначало название статьи? Далее идет текст превью.
Вообщем это тестовый вариант, скажите что еще добавить или изменить, мне ваша тема тоже интересна, я бы тоже не проч проиндекситься в поисковиках. (кстати ни сайт ни форум ни разу нигде еще не индексился, даже мета теги не прописывал. Во как. )
 
Скрипт лежит тут http://ru-board.com/demoscript/yandex_nuke.txt
Посмотреть его в работе нужно тут http://ru-board.com/cgi-bin/demoscript/yandex_nuke.cgi

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 14:52 11-10-2001
Uniq



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
batva, нет смысла вставлять категорию и название темы, ведь генерируемая страница - это лишь возможность поисковику съесть сразу все ссылки ко всем статьям сайта. <h1> тоже необходим в самой статье, но никак не на странице ссылок.
Во-вторых, надо чтобы новые статьи появлялись вначале, можно будет вставить метатэг динамик и ревизит, чтобы бот чаще заходил.
В-третьих, для того же Яндекса очень важен CY, индекс цитирования, а проще говоря - количество ссылок с внешних серверов на твой сайт. А потому в рамках руборда было бы круто организовать клуб по обмену линками. :) Но это уже совсем другой тред. ;)

Всего записей: 128 | Зарегистр. 30-07-2001 | Отправлено: 15:20 11-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Uniq

Цитата:
нет смысла вставлять категорию и название темы, ведь генерируемая страница - это лишь возможность поисковику съесть сразу все ссылки ко всем статьям сайта. <h1> тоже необходим в самой статье, но никак не на странице ссылок.  

 
смысл есть.
Следуя твоим рассуждениям текст тоже нет смысла вставлять, тогда мы просто получим страницу с сотнями линков.
И ты уверен что бот ее съест когда ты пойдешь ее регить ему?
Он примет такую страницу за спам, а если он так сделает, то он забанит весть твой сайт, и все, ты пропал, меняй домен суши весла.
 
А так, и заголовки есть, и текст есть, и кое какое форматирование, очень привлекательно будет боту пойти по ссылкам.
Щас мы lynx позовем, она у нас спец по поисковикам.
http://ru-board.com/new/search.php?query=&topic=35
 
 

Цитата:
Во-вторых, надо чтобы новые статьи появлялись вначале, можно будет вставить метатэг динамик и ревизит, чтобы бот чаще заходил.  

Нет проблем,  дай в студию все метатеги нужные я изменю скрипт.
 

Цитата:
В-третьих, для того же Яндекса очень важен CY, индекс цитирования, а проще говоря - количество ссылок с внешних серверов на твой сайт. А потому в рамках руборда было бы круто организовать клуб по обмену линками. Но это уже совсем другой тред.  

 
Об этом можно подробнее, мне тоже очень интересно.  
Но только в отдельной теме.

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 15:37 11-10-2001
DimoN



Tech administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В-третьих, для того же Яндекса очень важен CY, индекс цитирования, а проще говоря - количество ссылок с внешних серверов на твой сайт. А потому в рамках руборда было бы круто организовать клуб по обмену линками. Но это уже совсем другой тред.  

У нас с этим налаживается дело.
В каждом скачаном у нас форуме стоит линк на нас

----------
Мы Баним с улыбкой :) ™

Всего записей: 7528 | Зарегистр. 19-04-2001 | Отправлено: 07:05 12-10-2001
FatCat



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DimoN
Гы...у нас есть проект gametop.ru :) специально ради таких целей
 
CY штука важная. Вот у нас сайт из каталога вылетел (неверное зеркало подсунули вместо основного сайта, сисадмину ручки уже оторвал), так с первого места в своем разделе вылетели.
А это было +50 хостов.
 
Вот интересно, если мы сейчас в каталоге снова появимся, CY прежний будет? (что-то порядка 370 последний раз), или с нуля при переиндексации будет добавляться?
 
Гм....а мы почему-то из индексов Яндекса снова исчезли :(
 
Пишет "Ваш URL http://www.rolemancer.ru/ уже известен роботу Яndex. Данный ресурс будет доступен для поиска в ближайшее время", хотя вчера 400 страниу проиндексированных было.
 
Это не может быть связано с движком? Типа принял страницы за спам и выкинул из искалки?

Всего записей: 346 | Зарегистр. 10-07-2001 | Отправлено: 20:23 12-10-2001
Uniq



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
FatCat

Цитата:
Гм....а мы почему-то из индексов Яндекса снова исчезли  

Yandex

Цитата:
В связи с участившимися попытками накрутки индекса цитирования предупреждаем, что накрученный индекс нами безжалостно обнуляется. Решение о наличии накрутки принимается администрацией Яндекса на основании детального изучения ситуации.

 
Наверно, яндексовцы со своей сверхподозрительностью поработали...

Всего записей: 128 | Зарегистр. 30-07-2001 | Отправлено: 21:15 12-10-2001 | Исправлено: Uniq, 21:18 12-10-2001
lynx



Advanced lynx
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
batva
 

Цитата:
Щас мы lynx позовем, она у нас спец по поисковикам.  


 

Цитата:
Вообщем я написал скрипт, там я вывел как заголовок <h1> (его говорят любят очень поисковики?) название категории, название темы, и название статьи.  

Н1 - любят. Просто обожают.
Скрипт классный!
Если это только поисковикам, то так можно и оставить. Ничего, IMHO, менять не надо. Если люди будут забегать, напиши в head:
<style type="text/css">
<!--
h1 {color:#покрасивше; font-size:15pt; font-weight:600;}
//-->
</style>
Правда, не везде работать будет, зато просто.
 

Цитата:
смысл есть.  
Следуя твоим рассуждениям текст тоже нет смысла вставлять, тогда мы просто получим страницу с сотнями линков.  
И ты уверен что бот ее съест когда ты пойдешь ее регить ему?  

 
Текст это хорошо! Особенно такой. Т.е. в тексте повтооряются ключевые слова - лакомство для бота.
Ну, попробуйте, на одной сранице дать только линки, а на на другой - линки с текстом, сразу поймете, что больше боту приглянулось.
 
По индексу цитирования.  
Если два сайта имеют одинаковую релевантность по ключевому слову (фразе), то в результатах поиска выше отобразится тот, у кого выше индекс цитирования. ИЦ - это количество ссылок на ресурс с других серверов. Ассоциируется с популярностью ресурса.
Подробнее по Яндексу: http://www.yandex.ru/info/cy.html
http://www.yandex.ru/info/ci.html
 
Если ключевое слово "программы" - то ИЦ очень важен, т.к. конкуренция таких сайтов велика. Собственно и вот. Не надо и топика отдельного.
 

Цитата:
Это не может быть связано с движком? Типа принял страницы за спам и выкинул из искалки?

 
Скорее всего. Мои так постоянно вылетают. Яндекс воообще очень подозрительный.  
У меня есть ресурс, на котором релевантность по слову, скажем, "собака" на одной странице более 30 % - он ее не выдает в результатах поиска, а выдает другую,  где релевантность по этому слову меньше 10 %.

Всего записей: 11712 | Зарегистр. 08-05-2001 | Отправлено: 01:43 13-10-2001 | Исправлено: lynx, 02:11 13-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
FatCat

Цитата:
Это не может быть связано с движком? Типа принял страницы за спам и выкинул из искалки?

Запросто.
 
а к моим словам, которые я говорил Uniq'у в этом топике я хочу кое что добавить.
Мало того, что на этой странице http://ru-board.com/cgi-bin/demoscript/yandex_nuke.cgi нужен и текст и заголовки и кое какое форматирование, а не просто голые линки, так я еще вот что думаю.
Эта страница должна быть залинкована на тех страницах линки на которые на ней есть.
Ибо так бот точно примет это за спам.
Я где то читал, что очень важно иметь все страницы закольцованными.
Маленький пример.
Если боту всунуть вот эту страницу http://forum.ru-board.com/active.cgi в качестве стартовой для индексации ботом форума, то это будет наверно рулез.  
 
Ибо ссылка на эту страницу есть на всех страницах (в шапке форума), которые та страница линкует.
Понимаете фишку? Это боту очень нравится когда страница с которой он шарить по сайту пошел, эта страница залинкована на всех остальных. Это мое мнение.
Так я и сделаю наверно.
Там я только выставлю кол-во часов в 240 например (это все топики за 10 дней больше нет смысла ибо бот сильно огромную страницу все равно до конца не станет смотреть), и сделаю ее статичной с автообновлением раз в день (ибо бот статику любит больше чем скрипты) а в мета напишу ревизит раз в сутки. Плюс названия топиков сделаю <h1> а ниже буду писать еще первый пост с топика. А также выкину с нее линковку ников, нафига боту время тратить и ходить индексировать профили мемберов.
 
И ссылку на нее кину в шапку форума чтобы залинковать на всех страницах форума, тогда он точно за спам не примет ибо ясно что та страница часть сайта, с шапкой, с форматированием, с графикой наконец.
Как вам мои рассуждения? я прав?
 
 
lynx

Цитата:
Скрипт классный!  
Если это только поисковикам, то так можно и оставить.

думаю там еще реверс надо сделать, чтобы новые статьи были наверху, Uniq тут правильно заметил.

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 02:34 13-10-2001
lynx



Advanced lynx
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Batva

Цитата:
сделаю ее статичной с автообновлением раз в день  

Это как?
 

Цитата:
ибо бот статику любит больше чем скрипты

Ну... да, но скрипты, которые часто обновляются, он тоже любит. Форумы, новостные сайты. Набери ему в запросе название любой софтины - первыми форумы полезут: "Помогите найти софтину..."
 

Цитата:
также выкину с нее линковку ников


Цитата:
И ссылку на нее кину в шапку форума чтобы залинковать на всех страницах форума, тогда он точно за спам не примет ибо ясно что та страница часть сайта, с шапкой, с форматированием, с графикой наконец.  
Как вам мои рассуждения? я прав?  
   

Лев. Еще внешних ссылок бы на нее организовать. Тогда его любовь к этой странице будет всерьез и надолго.

Всего записей: 11712 | Зарегистр. 08-05-2001 | Отправлено: 03:12 13-10-2001
DimoN



Tech administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Еще внешних ссылок бы на нее организовать. Тогда его любовь к этой странице будет всерьез и надолго

Так а в чем проблеммы.
Зарегить пару-десять аккайнтов повесить на них Нюка
и на каждой странице линк сюда
 
ну а потом боту все это дело и скормить

----------
Мы Баним с улыбкой :) ™

Всего записей: 7528 | Зарегистр. 19-04-2001 | Отправлено: 05:33 13-10-2001
DimoN



Tech administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 
Новые правила
С 30 января 2001 года изменены правила подсчета индекса цитирования. Было принято решение не учитывать ссылки с веб-бордов, форумов и сетевых конференций. Изменение правил связано с попытками "накрутки" CY.  
 

http://www.yandex.ru/info/ci.html
 


----------
Мы Баним с улыбкой :) ™

Всего записей: 7528 | Зарегистр. 19-04-2001 | Отправлено: 05:47 13-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
lynx

Цитата:
сделаю ее статичной с автообновлением раз в день  
 
Это как?  

ну это не cgi расширение а htm
То есть страница не будет генериться каждый раз при запросе, она статичная будет, а перегенерироваться будет автоматом только раз в сутки допустим.  
Плюсы: htm расширение бот любит, почему? потому что нет клоакинга например. Я так думаю.
 

Цитата:
 Еще внешних ссылок бы на нее организовать. Тогда его любовь к этой странице будет всерьез и надолго

Точно, идея.
Как только накидать?
А если сделать имя этой страници index.html
Люди при наборе http://forum.ru-board.com все равно будут на board.cgi попадать, а http://forum.ru-board.com/index.html все равно никто руками набирать не будет.
В чем фишка?
Может бот увидив имя страницы как индекс, подумает что она главная на сайте.
И поэтому все те линки что есть на нас в сети например такие  http://forum.ru-board.com он будет считать их линками на ту страницу и от этого станет добрее?  
 
 
DimoN

Цитата:
Так а в чем проблеммы.  
Зарегить пару-десять аккайнтов повесить на них Нюка  
и на каждой странице линк сюда  
 
ну а потом боту все это дело и скормить

не ну это не серьезно.

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 05:53 13-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DimoN

Цитата:
Новые правила  
С 30 января 2001 года изменены правила подсчета индекса цитирования. Было принято решение не учитывать ссылки с веб-бордов, форумов и сетевых конференций. Изменение правил связано с попытками "накрутки" CY.  

ты не понял нифига, и зря поставил такой смайлик.
Наш CY от этого не страдает, что мы конфа а не сайт понимаешь?
 lynx предложила накидать в сети на нас, но она же не предлагала их кидать на чужих конфах.
Само сабой понятный перец, что линки на нас с конф нам в поднятии CY не помогут.

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 05:58 13-10-2001
DimoN



Tech administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ПОнятно что если говорить про сайт то это нас не касается.
 
А вот конфы касается напрямую.

----------
Мы Баним с улыбкой :) ™

Всего записей: 7528 | Зарегистр. 19-04-2001 | Отправлено: 06:01 13-10-2001
FatCat



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Uniq

Цитата:
В общем, что я предлагаю. Если есть спецы по PHP, написать хак, выводящий на одной странице все заголовки всех новостей, понятно что со ссылками на полную новость. Эту страничку зарегистрировать вовсех поисковиках. И тогда за два захода ваш сайт будет проиндексирован (ну и мой понятно тоже).  

Сорри, чтормозил сразу ответить. Делов то
У меня "почти" такое уже есть - http://www.rolemancer.ru/modules.php?op=modload&name=My_Articles&file=index
 
Правда тут последние 100, а у меня больше 1000. Поэтому если готовить такую страничку, то, конечно, в статике, и генерить ее раз в ...э....неделю. Щас чего-нить сляпаю на php.

Всего записей: 346 | Зарегистр. 10-07-2001 | Отправлено: 08:42 13-10-2001
lynx



Advanced lynx
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
batva

Цитата:
страница не будет генериться каждый раз при запросе, она статичная будет, а перегенерироваться будет автоматом только раз в сутки допустим.  

Это хорошо! Бот очень любит, когда страница обновляется.
 

Цитата:
htm расширение бот любит, почему? потому что нет клоакинга например. Я так думаю.  
 

Ну, я не замечала, что бот html любит больше, чем cgi. Хотя это не значит, что это не так. Особено в данном случае. Т.е. страница html обновляющаяся раз в сутки, например, будет для него привлекательней, чем такой же cgi-шник. Мне так кажется.
 

Цитата:
Как только накидать?  

Ну, боту сильно много то и не надо. Можно силами админов и сочувствующих это сделать.
Вариант 1. Нормальный обмен кнопками. В качесве ссылки даем твою страницу. Только тогда она должна быть под людей тоже оптимизирована, а не только под бота.
Вариант 2. В неприметном месте дружественного сайта просим поставить так:
<a href="твоя_страница.html"><img src="однописксельный_гиф.gif" alt="Ключевые слова"></a>
 
Можно еще что-нибудь придумать. Вот, например, инфа для размышления - ссылки на ресурсы, оставленные в гостевых книгах, тоже влияют на ИЦ ресурса. Честное слово. сама проверяла. Это не мысль, просто  пока инфа, может, у кого в связи с этим хорошая мысль родится.

Всего записей: 11712 | Зарегистр. 08-05-2001 | Отправлено: 16:41 14-10-2001
batva



crazy administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DimoN

Цитата:
ПОнятно что если говорить про сайт то это нас не касается.  
 
А вот конфы касается напрямую.

 
да никак не касается.
ты еще раз внимательно прочитай то что ты сам цитировал с яндекса.
если на нас будут давать ссылки с форумов, нашему форуму это не поднимет индекс цитирования, это и ежу понятно, но если ссылки с сайтов на форум, то индекс будет считаться не взирая на то что мы конфа, а не сайт.
То есть мораль сей басни такова, что нам пофигу что мы форум.
 
lynx
надо завести клуб друзей.
каждый добавляет нас, мы его, все члены клуба короче линкуют друг друга.
Выгодно всем.

Всего записей: 12593 | Зарегистр. 07-01-2001 | Отправлено: 07:12 15-10-2001
DimoN



Tech administrator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Насчет клуба тоже придумал на днях.
 
Пишем скрипт куда любой может себя занести, но обязуется поставить и на нас ссылочку.
 
Добавляет, мы проверяем поставил ли он, и уже обавляем его в сам лист

----------
Мы Баним с улыбкой :) ™

Всего записей: 7528 | Зарегистр. 19-04-2001 | Отправлено: 07:17 15-10-2001
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3

Компьютерный форум Ru.Board » Тематические » Системы управления сайтами » Индексация в поисковиках (Яндексе)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru