Jonmey
Запрет на пост | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: Может нужно изменить какие-то настройки в программе для скачивания??? | Возможно, ошибаюсь, но думаю, вряд ли вы скачаете задачки с пом. OE. OE не хватает режима работы, в котором он полностью имитировал бы работу браузера, то есть, фактически им бы был, но еще и самостоятельно кликал на все кнопки, ссылки и тд., закачивая все, что ему приходило бы из инета, обрабатывал как браузер, формировал html (статичные) страницы, снова находил ссылки и тд. до выполнения задания. Понятно, что такой режим был бы медленным, но в ряде случаев он был бы единственным спасением. В данном же случае он выполняет роль качалки, перебирая все явные и отчасти неявные ссылки, имеющиеся на странице. При этом, насколько понимаю, он не формирует страниц на основе полученного контента в динамическом режиме (как локальный сервер), но способен опционально вычислять ссылки в скриптах, в некоторых случаях. В данном случае этого недостаточно. Возможно я коряво объясняю, автор может меня поправить. Но это полбеды для конкретно вашего случая. Если бы проблема была только в этом, возможно, стоило бы еще повозиться с этим сайтом обходными путями. Проблема в другом. Как я уже сказал выше. Многие задачки - это ролики на youtubе (то есть это видео, а не текст), а остальные задачки (или большинство - не проверял) - это не текст, а картинки, которые без OCR распознавания имеют малую ценность. Пример задачки, где представлены оба варианта - ролик и картинка https://gdz-putina.org/reshebnik-po-algebre/7-klass/makarychev задача №118 https://gdz-putina.org/attachments/images/tasks/000/032/710/0000/57b1de8905ce1.png Ответ: https://www.youtube.com/watch?v=kEr3Fos0eBI https://gdz-putina.org/attachments/images/tasks/000/032/710/0000/57b1df5a92d12.png https://gdz-putina.org/attachments/images/tasks/000/032/710/0002/57b1dee41a822.jpg Как вы можете заметить картинки-задачки имеют водяные знаки, что исключает автоматизированное OCR распознавание. Даже если вы скачаете картинки-задачки и ролики-задачки, то вам придется практически создать с нуля все остальное, чтобы это работало оффлайн. Распознавание же картинок, а тем более роликов - титанический труд. Видеоролики с сайта (более 8000) https://www.youtube.com/channel/UCFKgi9IJ5ps8s1X8k45Bg5A/playlists Кстати, мою версию именно о монетизационной основе сайта подтверждает факт наличия большого количества его кровных двойников, отличающихся лишь цветом бантиков https://megaresheba.ru/ https://gdz.ru/ https://gdzputina.com/ https://reshebnik.com/ https://zoobrilka.org https://gdzputina.ru https://megaresheba.net https://gdz.lol/ https://гдз.рус/ и т.д. и т.п. Цитата: И все-таки, как Вы думаете, есть ли способ автоматом вытянуть из него решения??? | Выдрать можно все. Вопрос - в цене - время+трудозатраты. Можете поискать на форуме программы автоматизации операций в браузерах. Такая программа будет делать то же самое, что вы делаете вручную, включая сохранение открытых страниц. Получите несколько десятков тысяч страниц с ассоциированными с ними папками, в которых будут находиться картинки с решениями. Что делать потом – вам решать. Как скачивать ролики с youtub'а – полно руководств и программ. |