Хлебные крошки
01.06. Book Browser 4.0
- Подробности
- Категория: Создание элек. книг
- Опубликовано 07.11.2011 10:22
- Автор: Шитов В.Н.
- Просмотров: 6358
Открытие онлайн-библиотек
Бесплатная утилита из программы Book Designer 4.0. Программа позволяет читать в онлайн-режиме. Для открытия списка онлайн-библиотек нажмите на кнопку Show net libraries list (Показать список онлайн-библиотек) (). После этого открывается панель со списком онлайн-библиотек (Рис. 9). Интернет должен быть предварительно загружен.
Рис. 9. Рабочее окно браузера с открытым списком онлайн-библиотек |
Для открытия онлайн-библиотеки из списка выполните по ее имени двойной щелчок мышью. Некоторые библиотеки, указанные здесь, уже не функционируют или настолько заняты, что открыть их проблематично.
Правила работы с поисковыми роботами
Так как значительное время будет посвящено поиску библиотек или отдельных книг, то читатель должен знать правила работы с поисковыми роботами. Поисковые роботы — это программы, являющиеся составной частью поисковой системы и предназначенные для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами. Робот посещает все сайты, которые были добавлены в каталог поисковой системы, просматривает их, запоминает страницы, их названия, рисунки и т. д.
Наиболее популярными поисковыми роботами являются программы, разработанные порталами: Yandex.ru, Google.ru, Rambler.ru, Mail.ru, Yahoo.com, Bing.com и некоторые другие.
Лидером в России, согласно последним данным статистики, пока является Yandex.ru, пользователи доверяют именно ему наибольшую долю поисков. Мы свои публикации и отзывы на них также стараемся выполнять именно в этом поисковике, так как он находит наибольшее число упоминаний о нас. Обычные поиски мы часто ведем в Google.ru, так как этот портал является нашей домашней страницей.
На любом поисковике предлагается строка поиска: укажите в нее слово или фразу, нажмите на клавишу Enter на клавиатуре ПК и после этого выполняется поиск, но вместе с полезными ссылками часто приходит и ненужная информация. Часто вместе с незначительной частью полезной информации приходит море бесполезной или пустой информации, среди которой приходится вручную выбирать полезные крохи. В этой информации приходится вручную разбираться, тратя на это много времени. Поэтому на любом поисковике создана своя система поисковых запросов. Часто эти правила повторяют правила поиска на других поисковиках. Но на каждом поисковике существуют и некоторые своеобразные правила. Чем точнее мы построим запрос, тем точнее получим информацию, в которой меньше придется затратить ручного труда для анализа полученной информации.
Поисковик на Яндексе
Так как Yandex.ru в России используется чаще всего, то начнем мы изучение с него. Для использования наиболее востребованных команд, прежде всего, можно воспользоваться расширенным поиском (Рис. 10).
Рис. 10. Настройка расширенного поиска на Yandex |
В поле Я ищу укажите слово или фрагмент текста, который нужно найти. Для исключения слова из поиска используйте перед этим словом символ минус (-). Если поиск нужно выполнить на сайте, то в поле На сайте укажите этот сайт. Вы можете определить формат файла, язык сайта, периодичность обновления, а также регион поиска. Кроме этого можно организовать поиск в конкретных областях сайта: в заголовке или в тексте сайта, а также поиск заданного фрагмента в любой форме или в той последовательности слов, как в запросе.
Знание языка запросов дает возможность решать более сложные поисковые задачи.
Для поиска заданной фразы заключите ее в кавычки в поисковом поле. В этом случае поисковик будет искать слова, которые следуют на веб-странице так, как они указаны во фразе в кавычках. Регистр букв при этом часто не важен, хотя иногда и влияет на поиск. Например, фраза «Свободные программы» требует найти фразу, в которой должно сначала идти слово «свободные», а затем должно идти слово «программы». Если на веб-странице будет встречена фраза «Свободные лучшие программы», то такую фразу поисковик должен пропустить.
Если поиск слов должен вестись в пределах одного предложения, то необходимо использовать оператор &. Например, поисковый запрос «Свободные & программы» найдет фразы «Свободные программы» и «Свободные лучшие программы».
Для поиска слов в одном документе необходимо использовать оператор &&. Например, запрос «Заполнение & тонером && Смоленск» найдет страницу, в которой в одном предложении должны быть слова «заполнение» и «тонером», а в любом месте этой страницы должно быть слово «Смоленск». В результате Вы получите адреса организаций и предпринимателей, заправляющих картриджи тонером в городе Смоленске.
Вы можете регулировать расстояние между словами с точностью до слова. Расстояние между словами a и b — это разница между номерами слов b и a. Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстояние между соседними словами, стоящими в обратном порядке, равно -1. Вы можете указать максимально допустимое расстояние между двумя любыми словами запроса, поставив после первого слова символ /, сразу за которым идет число, означающее расстояние. Запрос:
художественные /2 книги
найдет страницы, где есть фразы «книги художественные», или «художественные последние книги», или «художественные отличные книги», но не найдет страницы, где есть «художественные последние отличные книги» (расстояние между словами равно 3).
Можно указывать слова на расстоянии в несколько предложений. Для этого необходимо перед оператором расстояния / указать оператор &&. Например, для поиска страницы, на которой упоминается пьеса В. Шекспира «Буря» нужно указать запрос «В. Шекспир &&/4 Буря». Число после оператора / указывает число слов, на расстоянии которых нужно выполнять поиск.
Кроме расстояния между словами, можно указывать и их порядок. Слова следуют в определенном порядке на заданном расстоянии. Для определения расстояния и порядка слов запроса, в котором они должны идти в тексте, укажите между символом / и числом-расстоянием символ + для прямого порядка слов или символ - для обратного. Если вы хотите узнать отчество Медведева, то задайте запрос Дмитрий /+2 Медведев. В результате будут найдены страницы, где между словами Дмитрий и Медведев есть только одно третье слово. Это слово между именем и фамилией и есть отчество.
Создание запроса со словами, расположенными в заданной области. В некоторых поисковых запросах слова могут идти в разном порядке, причем между ними может быть от «a» (минимум) до «b» (максимум) слов. Добавив между словами запроса оператор /(n m), можно получить нужные ссылки. Например, запрос Дормидонт /(-1 +2) Досипаторов найдет как страницы с текстом Дормидонт Гермошлепович Досипаторов, так и Досипаторов Дормидонт.
Для поиска любого из указанных слов нужно использовать оператор |. Например, это может потребоваться для поиска слов, имеющих синонимы. Например:
телефон | факс | пейджер | мессенджер
Свободные | бесплатные & программы
Поисковик Яндекса позволяет исключать веб-страницы, где имеются заданные слова. Для этого используется оператор с двумя символами тильда ~~, слева от которого нужно указать, что нужно искать, а справа нужно указать, какие страницы необходимо исключить из поиска. Например, если Вы ищете информацию о программах (но не средствах программирования), то можете задать запрос «Свободные программы ~~ средства программирования». Будут найдены все страницы, где есть слово «Свободные программы» и нет слов «средства программирования».
Если в запросе нужно, чтобы слово встречалось на странице, но нельзя, чтобы оно встретилось в том же предложении, то необходимо использовать оператор ~. Например, если составить запрос «Свободные ~ программы», то поисковик найдет страницы, на которых встречается слово «свободные», нет слова «программы» (Свободные зоны, свободные деньги).
Сложные выражения можно заключать в круглые скобки.
Если вы ищете описание программы, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос: программы && (описание | работа | правила)~~(цена | прайс | рубли | доллар | фирма | магазин). Будут найдены все страницы, где есть слово «программы», а также любое из слов «описание», «работа» или «правила», и нет ни одного из слов, перечисленных после оператора ~~.
По умолчанию слова из запроса будут искаться с учетом морфологии. Например, слово «Пушкин» будет искаться по всем падежам: Пушкину, Пушкиным и т. д. Для отключения морфологии используйте оператор ! перед словом (без пробела). Например, !Пушкин будет искаться без падежей.
Если одна или несколько форм слова совпадает с другими словами, поиск может находить лишние страницы. Указав нормальную форму слова с помощью оператора !!, можно убрать многие из ненужных страниц.
Яндекс позволяет организовать поиск в отдельных элементах страницы или в связанной с ней информации (Таблица 1). При использовании операторов, где в качестве параметра задается имя хоста (таких как url, host и т. д.), в качестве имени должно указываться главное зеркало сайта, иначе ничего не будет найдено. Например, необходимо указывать host=«lib.ru», а не host= «www.lib.ru». Для того, чтобы узнать главное зеркало сайта необходимо добавить хост в базу Яндекса. Если он не является главным зеркалом, будет выдано сообщение: «Добавленный вами сайт не индексируется, так как является «зеркалом» http://www.domain.ru/.»
Таблица 1. Синтаксис операторов Яндекса
Синтаксис оператора |
Что означает оператор |
Пример запроса |
левый_операнд << правый_операнд |
Неранжирующее И. Оператор очень похож на &&, с той лишь разницей, что правый_операнд влияет на возможность документов попасть в результаты поиска, но не влияет на ранжирование |
Сравните результаты поиска по запросам: релевантность && РОМИП и запросу релевантность << РОМИП |
title [запрос] |
Поиск текста в заголовке страниц (title) |
Эйнштейн << title [биография] |
url=«www.url.ru/cat/*» |
Поиск ограничивается группой страниц, с заданным URL. Если в конце адреса стоит *, то учитываются страницы, адрес которых начинается с заданного URL |
«пес Барбос» << url=«www.exler.ru*» |
inurl=«url» |
Поиск ограничивается группой страниц, URL которых содержит заданный фрагмент |
inurl=«schitov» |
host=«www.host.ru» |
Оператор аналогичен url с именем хоста |
host=«www.rambler.ru» |
rhost=«ru.url.*» или rhost=«ru.url.www» |
Оператор аналогичен host, но имя хоста записывается в обратном порядке — вначале домен верхнего уровня, затем второго и т.д. Если в конце указано .*, то поиск идет по всем поддоменам заданного домена (но не включая домен ru.url!) |
rhost=«ru.mail.*» |
mime=«тип_файла» |
Позволяет ограничить поиск определенным типом файла: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash) |
(инструкция && стиральная машина) << (mime=«pdf» | mime=«rtf») |
lang=«аббревиатура_языка» |
Отбирает для поиска страницы, написанные на определенном языке: русском (ru), украинском (uk), белорусском (be), английском (en), французском (fr), немецком (de) |
Doppeldecker << lang=«de» |
domain=«домен» |
Выполняет поиск по страницам, которые расположены в заданном домене |
domain=«yandex» /+1 domain=«ru» |
date=«ГГГГ{*|ММ{*|ДД}}» |
Поиск выполняется только по страницам, дата которых удовлетворяет заданному условию |
date=«181209*» |
cat=(ID региона) или cat=(ID темы) |
Поиск включает только страницы сайтов, зарегистрированных в Яндекс.Каталоге, тематическая рубрика или регион которых совпадают с заданным. Идентификатор региона можно получить, прибавив к коду региона смещение 11000000. Идентификатор тематической рубрики получается прибавлением к коду темы смещения 9000000 |
трясогузка << cat=(11000052) |
Поисковик Google
В поисковике Google, как и на Яндексе, предлагается расширенный поиск (Рис. 11). В большинстве случаев поиска этот вариант способен организовать даже сложные запросы.
Рис. 11. Расширенный поиск на Google |
Для поиска точного запроса в Google необходимо заключить запрос в кавычки. Например, «FTP-серверы».
Например, если Вы ищете информацию о программах (но не средствах программирования), то можете задать запрос «Свободные программы «-» средства программирования». Будут найдены все страницы, где есть слово «Свободные программы» и нет слов «средства программирования».
Если нужно найти фразу с неизвестным словом или фразой, то вместо неизвестных элементов необходимо использовать оператор *. Например:
лучшие *
* программы
Для указания диапазона нужно ввести многоточие. Например, «Цена 50…100». Это означает, что искать нужно цену в пределах от 50 до 100 каких-нибудь денег.
Для принудительного включения слова в поиск необходимо использовать оператор +. Например, «температура + Воронеж» требует искать температуру в Воронеже.
Поиск синонимов выполняется с помощью оператора ~.
Для вывода сохраненной страницы из кеша Google используйте оператор cache:viktor-schitov.ru, где viktor-schitov.ru — имя сайта, который нужно извлечь из кеша.
Оператор link:viktor-schitov.ru выводит список сайтов, которые ссылаются на указанный сайт.
Оператор info:viktor-schitov.ru выводит информацию, которая есть у Google об указанном сайте.
Оператор site:viktor-schitov.ru выводит список проиндексированных страниц на сайте.
Оператор related:viktor-schitov.ru выводит список сайтов, которые похожи по содержанию и тематике на указанный сайт.
Для поиска текста запроса только в заголовках веб-страниц нужно использовать оператор allintitle:очистка системы. Заголовки указываются в тегах с <H1> до <H6>.
Для поиска текста запроса только в текстах сайтов нужно использовать оператор allintext:бесплатное телевидение.
Для поиска текста запроса только в заголовках сайтов нужно использовать оператор intitle:онлайн-игры. Заголовки сайтов указываются в теге <TITLE> и выводится в системную полосу сайта.
Поисковик Rambler
Кавычки используются для поиска текста, заключенного в кавычки. Порядок слов и их падежи в этом случае не меняются. Кроме слов с кавычками разрешается использовать текст без кавычек. В этом случае текст без кавычек будет искаться в любом падеже.
Для усложнения запроса необходимо использовать операторы. Оператор + означает обязательное слово, которое должно присутствовать на странице. Часто этот оператор используется с другим оператором (?), который является необязательным словом. Например:
+художественные ?фильмы
Слово «Художественные» на странице присутствовать обязательно должно. Слово «Фильмы» не обязательное и поэтому могут быть найдены и «Художественные фильмы», и «Художественные галереи», и «Художественные книги».
Для запрета использования словоформ используется оператор ++. В этом случае запрещаются другие падежи, знаки препинания и т. д.
Оператор && является логическим «И» и требует выполнения обоих частей запрета. Например:
Бесплатные&&программы
Слова «бесплатные» и «программы» могут быть в любом месте документа и могут следовать в любом порядке. При этом в запрос попадают даже далеко отстоящие друг от друга слова.
Чтобы точнее указать следование указанных слов необходимо использовать оператор модифицированного «И» &. Этот оператор используется с угловыми скобками < и >. Чтобы расстояние между словами в результате поиска было меньше заданного по умолчанию, можно использовать конструкцию &< или &<<. Чем больше будет регулирующих операторов, тем сильнее будет уменьшено расстояние. Для увеличения исходного расстояния, нужно применить обратный оператор: &> или &>>.
Существует модификация оператора «И» — оператор &&&. Он применяется для расширения границ поиска. В этом случае поиск будет выполняться не в пределах одного документа, а в пределах одного сайта.
Оператор || является оператором логического «ИЛИ». Запросу, состоящему из двух запросов, соединенных оператором ||, удовлетворяют все документы, удовлетворяющие хотя бы одной части запроса. По запросу Фильмы || Книги найдутся документы, в которых есть хотя бы одно из двух слов — слово «Фильмы» или слово «Книги» (или оба эти слова вместе).
Модифицированный оператор | используется для корректировки результата по запросу путем добавления к запросу необязательных, но встречающихся на искомых страницах слов. Как правило, их применяют, когда число найденных по запросу страниц велико и необходимо вывести некоторые страницы в числе первых.
Оператор NOT является оператором логического «НЕ». Оператор NOT позволяет сформировать запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Например, результатом поиска по запросу:
Художественные NOT книги
будут все документы, в которых есть слово «Художественные» и нет слова «книги».
Если оператор явно не указан, поисковый робот сам расставляет операторы так, как считает нужным. Например, запрос:
Бесплатные программы
будет истолкован как:
Бесплатные && программы
На режиме Расширенный поиск оператор по умолчанию можно заменить на ||, который требует искать хотя бы одно слово запроса.
Сложный запрос из нескольких слов с несколькими различными операторами, будет выполняться в соответствии с их приоритетом. Оператор NOT имеет самый высокий приоритет. Следующий по приоритету оператор && (логическое И), поэтому запрос из нескольких слов при обработке сначала группируется по операторам NOT, && (И) и лишь потом по операторам || (ИЛИ). Изменить порядок группировки можно использованием скобок. При построении запросов можно объединять слова запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в круглые скобки.
Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются правила языка построения запросов. Использование скобок позволяет создавать вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию. Если запрос без скобок:
художественные фильмы || книги
то это означает, что нужно найти документы, содержащие либо слова «художественные» и «фильмы» или слово «книги», то запрос со скобками:
художественные (фильмы || книги)
означает найти документы, содержащие слово «художественные» и одно из слов «фильмы» или «книги».
Поисковик Mail
Для поиска на указанном сайте необходимо использовать оператор URL:
Виртуальные миры << url=«viktor-schitov.ru/*»
Где фраза «Виртуальные миры» — текст запроса, а адрес после слова URL — адрес сайта, на котором необходимо выполнить запрос.
Для поиска на заданном языке необходимо использовать оператор Lang. Запрос будет иметь примерно такой вид:
Поисковые роботы << lang=«ru».
Можно искать страницы на 6 языках:
русский — ru
белорусский — be
украинский — uk
английский — en
немецкий — de
французский — fr
Для поиска любого из заданных слов нужно использовать оператор |. Например:
архиваторы | дефрагментаторы | прожигалки | антивирусы
Для исключения из поиска некоторых слов, используйте оператор ~~. Слева от оператора укажите искомые слова, а справа укажите те слова, которые нужно исключить. Например, «Бесплатное видео ~~ порнография». Будут найдены все страницы, где есть слово «Бесплатное видео» и нет слова «порнография».
Для поиска слова на странице, но при условии, что это слово не должно встречаться в одном предложении с тем, что нужно найти, используйте оператор ~. Например, если Вы хотите найти упоминание о гражданине Кузькине, но не хотите связывать его с Кузькиной матерью, то нужно написать следующий запрос:
Кузькин~мать
В качестве операторов можно использовать кавычки. Поиск в этом случае будет выполняться только по словам, идущим подряд в кавычках. Например, «Наука и техника». Если на странице будут слова «Техника и наука», то такой текст найден не будет. Если Вы хотите найти слова, которые должны встречаться в одном предложении, то необходимо использовать оператор &. Если поиск нужно выполнить по словам, которые могут встречаться в любом месте документа, то необходимо использовать оператор &&.
Кроме расстояния между словами, можно указывать и их порядок. Слова следуют в определенном порядке на заданном расстоянии. Для определения расстояния и порядка слов запроса, в котором они должны идти в тексте, укажите между символом / и числом-расстоянием символ + для прямого порядка слов или символ - для обратного. Если вы хотите найти отчество Пушкина, то задайте запрос Александр /+2 Пушкин. В результате будут найдены страницы, где между словами Александр и Пушкин есть только одно третье слово.
Можно привести несколько ссылок, в которых описываются языки поисковых запросов:
HTTP://HELP.YANDEX.RU/SEARCH/?ID=481939
HTTP://WWW.IT2B.RU/IT2B2.VIEW2.PAGE91.HTML
HTTP://WWW.GOOGLE.COM/HELP/OPERATORS.HTML
HTTP://WWW.GOOGLEGUIDE.COM/ADVANCED_OPERATORS_REFERENCE.HTML