Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Интернет » Web-программирование » Написание скрипта для каталогизации e-book'ов в Варезнике

Модерирует : Cheery

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10

Открыть новую тему     Написать ответ в эту тему

LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
За первый общепригодный результат благодарим vladgangan
 

IsbnExtractor v1.2 Executable:
http://dl.downloadhosting.com/download/vladgangan/IsbnExtractor_v1.2.exe
 
IsbnExtractor v1.2 Source:
http://dl.downloadhosting.com/download/vladgangan/IsbnExtractor_Source_v1.2.exe

 
Утилита написана под .NET
 
Вытаскивает номера ISBN из локальной коллекции ебуков, располагает их в XML-дескрипторах папок (для удобства перемещения папок с книгами между носителями).
 
 
Процесс рождения утилиты описан на 1-6 страницах темы, там же - более подробная документация.  
 
Теперь, наконец, можно начинать Web-программирование
 
 
А пока срочно ищется человек, который откомпилит под винды один из серверных скриптов для проверки варез-релизов. Или иным образом перенесет их логику на винды, с целью не только выявления битых релизов, но и вытаскивания всего, что вытаскивается, во временный каталог.
 
Вторая полезная утилита:

Цитата:
Написал скрипт AutoIT3 для извлечения ISBN из коллекции DJVU книг. Необходим FR и  Djvudecode. В скрипте также выполняется проверка ISBN по 10-ой контрольной цифре.  
http://www.mytempdir.com/2026301  
(c)U235
 
Alfa Ebooks Manager-0.4.5.0 2008-01-17
Готовая утилита для работы с PDF с множеством встроенных функций, таких как распаковка архивов, поиск информации в Интернете и экспорт в локальную базу данных Microsoft Access (JET Engine .mdb)
 
 
 
Первоначальная шапка темы





Исправил название. — Svarga.

Всего записей: 18151 | Зарегистр. 14-10-2001 | Отправлено: 23:46 28-06-2004 | Исправлено: 174bpm, 14:38 24-02-2008
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LevT

Цитата:
А с амазона она у тебя описания умеет брать?

Конечно умеет, и не только, там есть 4 плагина, для amazon, barnse & noble и ozon.ru, books.ru для русских книг, в дальнейшем еще добавится хватило бы времени и сил.  
В редактировании книжки (двойной щелчок по книжек в таблице), нажать на иконку "Update from Internet". Может за выходные напишу руководство по эксплуатации.

Цитата:
Добавь проверку и распаковку варезных релизов

Можно  была такая  идея, просто надо обдумать сам механизм

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 13:47 28-09-2007 | Исправлено: 413XFireFox, 13:48 28-09-2007
LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

ну механизм довольно прост, только реализации под винду я не знаю. А серверные скрипты стоят на куче варезных FTP-серверов и проверяют релизы, к плохим архивам дописывают расширение .bad и пишут в директорию манифест типа 90% релиза в порядке.
 
Если распаковывать релизы - надо как-то обрабатывать ошибки. Предлагаю вместо этого запускать конвейером сначала такую утиль, а потом по ее результатам распаковку как таковую. Ну и такая утиль под винду была бы сама по себе полезна для варезников - отнюдь не только для книжных релизов.  
 
 
Добавлено:
 
Да, тестить такого рода софт лично я всегда готов. Но реально полезным для меня он станет лишь тогда, когда сможет обрабатывать варезные релизы.

Всего записей: 18151 | Зарегистр. 14-10-2001 | Отправлено: 18:09 28-09-2007
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
To LevT
 
А можно еще поподробней описать алгоритм, просто я толком не знаю с каких варезных сайтов чего брать, можно написать мне на почту 413X.fox гав-гав  gmail.com

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 16:32 01-10-2007 | Исправлено: 413XFireFox, 16:32 01-10-2007
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чего-то смотрю движений нет. Вот что я предлагаю, у меня есть база 5500 книг, с заполненными данными и обложками. Можно взять за основу мою базу (с превьюхами она весит 120М, без где-то 30М), потом каждый просканирует свои книжки, и если такая в базе есть, то меняется путь, если нет то можно занести недостающие.
 Я в принципе обновляю базу постоянно, то есть слежу за новинками. Оговорюсь сразу собираю книжки только около компьютерной тематики и только если есть ИСБН, разные доки и мануалы нет.
Насчет сканирования, извлечение ИСБН из .chm файлов я уже сделал, думаю вскоре сделаю для .pdf. и интегрирую в программу. Так же данные можно хранить в xml на сервере, а потом заносить в программу, это тоже можно сделать.
Все нюансы можно оговорить здесь.

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 18:14 03-10-2007
LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
413XFireFox
 
для меня очень важна обработка варезных релизов. Нераспакованных книг у меня явно больше половины.
 
насчет извлечения ISBN из PDF - посмотри утилиты vladgangan в шапке, там это есть.
 
 
Добавлено:
 
Кстати, я тебе послал письмо. Получил?

Всего записей: 18151 | Зарегистр. 14-10-2001 | Отправлено: 18:57 03-10-2007 | Исправлено: LevT, 18:58 03-10-2007
174bpm



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
413XFireFox

Цитата:
Можно взять за основу мою базу (с превьюхами она весит 120М, без где-то 30М), потом каждый просканирует свои книжки, и если такая в базе есть, то меняется путь, если нет то можно занести недостающие.

 
что-то тяжеловата, но книжки просканирую, если поиском пользоваться удобно
у меня около 10 Гб книжек околокомпьютерной тематики
 

Всего записей: 887 | Зарегистр. 12-01-2006 | Отправлено: 01:59 04-10-2007
LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
413XFireFox

Цитата:
Можно взять за основу мою базу (с превьюхами она весит 120М, без где-то 30М), потом каждый просканирует свои книжки, и если такая в базе есть, то меняется путь, если нет то можно занести недостающие.  

 
Не надо ничего пускать на самотёк: просто отдели описание самой ебуки от описания  личной коллекции (путей к книгам).
 
Вторая часть может оказаться тоже полезной - но не сразу, и использоваться будет иначе, чем первая. Например, когда возникнет желание-возможность упростить обмен ебуками по запросу.

Всего записей: 18151 | Зарегистр. 14-10-2001 | Отправлено: 09:44 04-10-2007 | Исправлено: LevT, 09:56 04-10-2007
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LevT
Да письмо только увидел, жмейл поместил его в спам , сейчас разберусь

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 10:05 04-10-2007
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот набросал свою версию распаковщика варезных книжек, плюс распознавания ISBN из pdf и chm.  
http://alfaebooks.com/system/files/WarezUnpacker.rar

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 11:11 10-10-2007 | Исправлено: 413XFireFox, 16:03 15-10-2007
Ghost mail



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
413XFireFox

Цитата:
Вот набросал свою версию распаковщика варезных книжек, плюс распознавания ISBN из pdf и chm.  
http://alfaebooks.com/system/files/WarezUnpacker.rar

Ты не мог бы переложить в дургое место, а то : "Page not found"

Всего записей: 52 | Зарегистр. 28-09-2006 | Отправлено: 18:26 04-12-2007
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://alfaebooks.com/files/WarezUnpacker0.1.rar
Здесь лежит, если кому надо. А то в принципе судя по активности, особо не надо, вот я и забил.

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 15:09 07-12-2007
LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
413XFireFox
мне надо, я обязательно доберусь. Просто под столом внезапно завёлся ESX сервер, и заботы об этой зверушке пока отодвинули разбор накопленного вареза.

Всего записей: 18151 | Зарегистр. 14-10-2001 | Отправлено: 16:39 07-12-2007
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LevT
Ну значит подождём лучших времён.

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 17:04 07-12-2007
test0

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что-то Alfa Ebooks Manager нифига не добавляет в каталог. Создал базу, делаю Books Operation -> Add books from folder, сканирует, находит ISBN'ы, щелкаю везде, где надо, под занавес - окошко с логом и предложение отсканировать по новой и закрыть. После закрытия ничего не добавляется.

Всего записей: 7 | Зарегистр. 31-10-2006 | Отправлено: 21:22 12-01-2008
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
test0
После нахождения ИСБНов, можно либо сохранить в базе как есть, для этого надо поставить галочку Add Book to DataBase Automatic и нажать OK, либо получить информацию с сайтов о книжке и потом уже занести стандартным способом, через диалог добавления книги.

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 11:33 14-01-2008
hyphen

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не находит ISBN для книги (виснет)
http://rapidshare.com/files/80647348/_Combinatorics_and_Commutative_Algebra-0817643699.rar

Всего записей: 101 | Зарегистр. 22-04-2002 | Отправлено: 04:28 15-02-2008
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hyphen
Проверил, все работает, попробуйте скачать новую версию программы, а с какого сайта ведётся поиск?

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 14:26 15-02-2008
174bpm



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
413XFireFox, спасибо, утилита понравилась.
 
Исправь только пожалуйста Автора на Авторы
 
не заметил только привязки к букварезу и не понравилось что прога не поддерживает многопользовательность - пытался отредактировать простым юзером шаблон, который при установке из-под админа записался почему-то в Program Files, а не в профиль Юзера

Всего записей: 887 | Зарегистр. 12-01-2006 | Отправлено: 14:44 24-02-2008
413XFireFox

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
174bpm
Спасибо за интерес, о многопользовательности как-то не думал, исправлю, а с букварезом я и не привязывал, не знаю надо ли делать привязку или нет.

Всего записей: 14 | Зарегистр. 17-05-2006 | Отправлено: 11:11 25-02-2008
LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Для проверки варезных релизов есть скрипт Latest version :- http://rapidshare.com/files/93548388/latest_WUTemp.rar.html
 
Version History
14-02-08 - CZ - beep_do beep PC Speaker 10 times to indicate end of script? - uses .\Support\BEEP.TXT
14-02-08 - CZ - get a 'best fit' FNFILES for the Unpacked Title Filename - uses .\Support\FNFILES.TXT
14-02-08 - CZ - UNPACKPMOVE, UNPACKPMLOC move Unpacked PAR2's to location of UNPACKPMLOC?
14-02-08 - ALL - par2cmdline v0.4 used and other minor improvements
12-02-08 - CZ - clk_do do the clock routine? and other minor improvements
12-02-08 - CZ - MAKEPAR create a PAR2 set for the ZIP fileset ? also uses UNPACKSFV, UNPACKRED values
10-02-08 - CZ - UNPACKPAR/RED block size now calc'd from title byte-size
10-02-08 - CZ - ODAY, ODAYGRP, ODAYLOC to extract 0Day Packaged Posts etc
24-01-08 - CZ - UNPACKPAR/RED Create a PAR2 set for the UNPACKED title?
21-01-08 - CZ - UNPACKSFV Create an SFV file for the UNPACKED title?
20-01-08 - CZ - minor impr's for file_id.diz not existing try UNCHECKED, force VS on when using COMPULT, etc
18-01-08 - CZ - if fc1.txt is NULL try COMPULT testing for unknown filesets
16-01-08 - CZ - SAVENAMEP at start takes user input for the log filename to save to
15-01-08 - CZ - clk_type time processing solved 00:00 case where set treats 00 as OCTAL
14-01-08 - CZ - clk_type time processing calculation 12/24hr - 'total time taken' 'no titles per minute' etc
13-01-08 - CZ - COMPULT tests in COMPULO if no rar/zip/001/etc archives then forces COMPCHK testing
13-01-08 - CZ - UNPACK strengthened and WinRar windows all minimised
12-01-08 - CZ - UNPACK, UNPACKLOC where to xcopy UNPACKED titles tested OK by COMPULT
12-01-08 - CZ - COMPUOO    For COMPULT testing of ## 001 archives only ## by WinRar if they exist for title
11-01-08 - CZ - INCORRECT AND INCOMPLETE titles get WinRar tested and -ilog%TEMP%\backup.log reported
10-01-08 - CZ - SAVELOGS, SAVELOC & SAVENAME options to save LOG files as a Winrar archive in 'SAVELOC\SAVENAME'
10-01-08 - CZ - UNCHECKED titles now WinRar tested and errors logged in BACKUP.LOG & formatted beautifully
09-01-08 - CZ - COMPULT better reporting for INCO's
04-01-08 - CZ - NOZIPs strengthened - NULL dir's will ALWAYS have '2 Dir(s)' due to '<DIR> . ..'
24-12-07 - CZ - COMPCHK strengthened for *([0-9]).zip condition = act. no files
22-12-07 - CZ - CLI option '-SEC' to use .\Support\STARTUP2.INI
22-12-07 - CZ - GROUPNFO & FILEIDDIZ options to keep NFO & DIZ after DEL'ing crap nfo's
15-10-07 - CZ - COMPTAG Create a 0-byte TAG file for COMPLETE titles?
15-10-07 - CZ - COMPULT Archive testing optional check for COMPLETENESS-CORRUPTION STATE
14-10-07 - CZ - COMPCHK Filemask testing optional check for COMPLETENESS STATE
12-10-07 - ALL - OSCHECK Tided up OSCHECK and Micronauts NDS group done for PR
09-10-07 - ALL - OSCHECK Section to check for OS compatibility and take action
07-10-07 - CZ - NOZIPs Put in section to detect NOZIPs in a directory and log
01-10-07 - CZ - Solved odd case where INC-UNCHK-COMP checking got messed up, esp. for PDA titles (!)
15-09-07 - CZ - Minor fixes - improve handling of 1st ZIP corrupt cases, etc
31-08-07 - CZ - New option to move out INCO-UNCHK titles to value of INCDIR in STARTUP.INI
31-08-07 - CZ - New option to copy out SPECIAL CASES - set in STARTUP.INI & SPECIALCASE.TXT
06-05-07 - PZ/CZ - Handle spaces in echo screens and log files
04-05-07 - CZ we can write to DOWNLOADS area - for error processing later
04-05-07 - PZ/CZ - %'s done for No. of COMPLETE titles, etc
03-05-07 - PZ/CZ - additional stats for complete titles, etc - have to work out how to do percentages!
03-05-07 - PZ/CZ - better handle BYTE counting, Winrar skip option, minor fixes
02-05-07 - PZ/CZ - turn %CNTBYTES/t% into KB so can count to 2.147TB !
01-05-07 - PZ/CZ - solved case where %CNTBYTESt% is > 2.147GB
01-05-07 - small bug fix for no diz zips
30-04-07 - speed optimisation for dir's with >1 ZIP files in them
30-04-07 - ALL - header and footer STATS section to LOG files
29-04-07 - 1st release of ZIP checking script.
 
сам пока не проверял.

Всего записей: 18151 | Зарегистр. 14-10-2001 | Отправлено: 18:30 28-02-2008
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10

Компьютерный форум Ru.Board » Интернет » Web-программирование » Написание скрипта для каталогизации e-book'ов в Варезнике


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru