Написание скрипта для каталогизации e-book'ов в Варезнике - [4] :: Web-программирование

Цитата:

Я пытаюсь объяснить что машинной идентичности быть не может.

Для очень широкого класса ебуков (расширить который впервые предлагаешь ты сейчас) именно что возможна машинная идентичность по признакам: ISBN + формат (CHM, PDF, возможно djvu) + (условное именование) "ранг непохожести" (как chm, так и pdf-ы размером 2 и 6 метров с нехилой вероятностью различаются сильно, а отличающиеся на сотню килобайт скорее всего вовсе неразличимы для человека-читателя).

Так вот: мы здесь создаем инструментарий для того, чтобы человек, занимающийся локальной каталогизацией своих книг и решивший заняться обменом, потрудился бы в первую очередь идентифицировать свои ебуки по ISBN (это, безусловно, по факту стандартизации, самый подходящий ключ каталогов, предназначенных для обмена именно книгами). И чтобы напрягаться для этого ему пришлось минимально.

Если бы в этом направлении не была проделана уже большая и результативная работа - я уже писал, что, пожалуй, согласился бы с тем, что ты предлагаешь. И сейчас стопроцентно соглашаюсь вот с этим:

Цитата:

пользователь получит в итоге упорядоченную и отсортированную базу своих книг с поиском и чтением книги сразу из базу (нашел в табличке поиском книгу щелкнул на ней и она сразу открылась)

а вместе с ней открылась страничка Амазона, в том случае, если книга недостаточно идентифицирована.

Цитата:

ну и естественно поиск по глобальной базе и скачивание.

Непременным условием "распределенного" обмена является идентификация по ISBN: иначе получится распределенный каталог типа "свалка", заведомо неполный и не обладающий для меня, например, вообще никакой ценностью (да-да, это такой закон природы: при объединении упорядоченных каталогов разного происхождения неизбежно образуется свалка)

Ситуация изменится, если кто-то предоставит для проекта сервер и рабочее время админа (далеко не фуллтайм, но все же довольно серьезное время). Для того, чтобы обойтись без ISBN, необходима кропотливая ручная работа, причем весьма квалифицированная, как в IT, так и в каждой предметной области. (Из этой причины вытекает на первых порах естественное ограничение книгами компьютерной тематики). Я на своем опыте знаю, что такое заниматься ручным объединением баз, не имеющих единого ключа. Лично мне НЕ НУЖНЫ результаты самопальной деятельности в этом направлении васей пупкиных, то есть они, опять же, для меня не представят никакой ценности. Результаты примитивных утилит сопоставления не сильно лучше результатов трудолюбивых ламеров. А не-примитивная программа этой функциональности называется Искусственный Интеллект

Отменить требование ISBN (если я правильно понимаю, для тебя важно обмениваться текстами, существующими "на правах рукописи") можно будет потом, когда появится каталог изданий, обладающий самоценностью для масс: сначала околокомпьютерных, потом профессионалов в широком спектре, и только потом васейпупкиных. Тогда - и не ранее - свалка от васейпупкиных не помешает профессиональной взаимопомощи.

Цитата:

И вообще ISBN хороший индентификатор для книги а для файла учитывая вышесказанное лучше хеш.

Чем в таком случае тебя не устраивают существующие p2p сети, идентифицирующие файлы как раз хэшем?

Чем они меня не устраивают - я знаю, потому и затеял тему. Если бы они устраивали массу пользователей ебуков - оттуда всегда можно было бы скачать почти любую релизнутую книгу. Но это далеко не так.

Цитата:

Book Collection сейчас скачиваю хотя ее размер и триальность уже говорят не в его пользу

Размер компенсируется навороченной функциональностью. А без наворотов имеется в наличии суперлайтверсия, в виде файла shelf.hta, разрабатываемого Raven377. Триальность компенсируется регулярными варез-релизами, имеющими место быть.

По поводу обращения к автору "буксира" - решающее слово за Raven377. Посмотри, пожалуйста, прогу, и напиши, имеет ли смысл попытаться привлечь к нашему делу ее разработчика (учитывая все риски, в т. ч. риск "не сработаться").

Модерирует : Cheery
Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10