Книга Информационные технологии и лингвистика XXI века - Алла Викторовна Гуслякова
Шрифт:
Интервал:
Закладка:
Список кластеров выводится слева от списка результатов поиска. Для каждого кластера указывается образующая его фраза и количество документов в кластере. Пользователь может управлять кластерами при помощи специальных ссылок под списком кластеров.
Nigma поддерживает русскую морфологию. Используется морфологический модуль для русского языка собственной разработки.
Nigma позволяет производить простейшие арифметические преобразования и решать математические задачи, с учётом различных единиц измерения и распознаванием математических и физических констант. Также поддерживаются запросы на конвертацию валют, решение систем уравнений и построение графиков функций. Математическая система была запущена в октябре 2008 года.
В декабре 2008 года появилась поддержка запросов по неорганическим химическим реакциям, как по исходным, так и по конечным веществам реакции. Впоследствии были добавлены поиск химических реакций и поддержка органической химии.
На 2011 год система позволяет производить поиск по более чем 12 000 неорганических реакций. Вещества можно задавать как в виде названий («хлорид натрия», «каменная соль»), так и в виде формул («NaCl»).
Кщта эффективна для обзорного поиска при сборе информации. Она позволяет быстро найти открытые сведения из различных областей и проверить, не пропустили ли вы что-либо важное, используя другие поисковики.
Приложение 6
Правила формирования запросов в поисковых системах (на примере поисковой системы Яндекс)
Правила формирования запроса в поисковой системе Яндекс
1. Ключевые слова в запросе следует писать строчными (маленькими) буквами. Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.
2. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. и.
3. Для поиска устойчивого словосочетания следует заключить слова в кавычки. Например, «фонема».
4. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Например, для поиска слова «сентябрь» в родительном падеже следует написать «¡сентября».
5. Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &. Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.
6. Для того, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, необходимо поставить перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки «+» и «-» надо писать через пробел от предыдущего и слитно со следующим словом. Например, по запросу «Волга – автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».
7. При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.
8. Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки. Например, «(ребенок | малыш | дети | младенец) +(уход | воспитание)».
9. Знак «~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе. Например, по запросу «книги – магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».
10. Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&,—) задает поиск в пределах документа. Например, по запросу «дева— астрология» будут найдены документы со словом «дева», не относящиеся к астрологии.
11. Вернемся к примеру с аквариумными рыбками. После прочтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум – сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.
На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.
Для поиска литературы или полнотекстовых документов возможен следующий запрос: «+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) – (цена | магазин | доставка | каталог)».
После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам.
Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:
Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.
Прочитать предлагаемые статьи и приступить к устройству аквариума.
Примечания
1
Интернет (World Wide Web (WWW) «всемирная паутина») – это гетерогенная система, то есть соединение разнообразных аппаратных платформ, исполняющих приложения, предназначенные для решения широкого диапазона задач.
2
Теория «информационного общества» была развита такими известными авторами, как М. Порат, Й. Масуда, Т. Стоуньер, Р. Карц и др. (Porat М., Rubin М. The Information Economy: Development and Measurement. Wash., 1978; Masuda Y. The information Society as Post-Industial Society. Wash., 1981; Stonier T. The Wealf of Information. L., 1983; Katz R.L. The Information Society: An International Perspective. N.Y., 1988.); в той или иной мере она получила поддержку со стороны тех исследователей, которые акцентировали внимание не столько на прогрессе собственно информационных технологий, сколько на становлении технологического или технетронного (technetronic – от греч. techne) общества (Brzezinski Zb. Between Two Ages. N.Y., 1988.), или же обозначали современный социум, отталкиваясь от возросшей или возрастающей роли знаний как «the knowledgeable society», «knowledge society» или «knowledge-value society». Сегодня существуют десятки понятий, предложенных для обозначения отдельных признаков современного общества.
3
ТМХ (Translation Memory Exchange – обмен памятью переводов) – открытый формат файлов XML (англ, extensible Markup Language – расширяемый язык разметки) для обмена данными памяти переводов, которые создаются в процессе автоматизированного перевода.
4
Trados – профессиональный продукт для компаний, использующих переводческие процессы, основанный на выявлении в переводимом документе ранее переведенных фрагментов. Продукт был разработан в 1992 году немецкой компанией Trados GmbH. В 2005 году Trados был куплен британской компанией SDL International, и в 2006 году появился совместный продукт Trados SDLX. Trados SDLX имеет разные модули, необходимые для перевода документов различных форматов (Microsoft Word, PowerPoint, HTML, FrameMaker, InterLeaf и np.), а также для работы с терминологическими базами данных (модуль MultiTerm).
5
FTP (File Transfer Protocol – протокол передачи файлов) – стандартный протокол, предназначенный для