ГОСТ Стандарт

ГОСТ 7.25-2001

Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления

1 061 переглядів

Завантажити документ

Формат .docx · доступно зареєстрованим користувачам

Увійти та завантажити

Текст документа

ГОСТ 7.25-2001

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУС

ИНФОРМАЦИОННО-ПОИСКОВЫЙ

ОДНОЯЗЫЧНЫЙ

Правила разработки, структура, состав и форма представления

МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ

ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ

Минск
Предисловие
1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской Академии наук, Минпромнауки России и Межгосударственным техническим комитетом по стандартизации МТК 191 «Научно-техническая информация, библиотечное и издательское дело»
ВНЕСЕН Госстандартом России
2 ПРИНЯТ Межгосударственным Советом по стандартизации, метрологии и сертификации (протокол № 19 от 22 мая 2001 г.)
За принятие проголосовали:
Наименование государства Наименование национального органа по стандартизации
Азербайджанская Республика Азгосстандарт
Республика Беларусь Госстандарт Республики Беларусь
Республика Казахстан Госстандарт Республики Казахстан
Кыргызская Республика Кыргызстандарт
Российская Федерация Госстандарт России
Республика Таджикистан Таджикстандарт
Туркменистан Главгосслужба «Туркменстандартлары»
Республика Узбекистан Узгосстандарт
Украина Госстандарт Украины
3 Постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 4 сентября 2001 г. № 370-ст межгосударственный стандарт ГОСТ 7.25-2001 введен в действие непосредственно в качестве государственного стандарта Российской Федерации с 1 июля 2002 г.

4 ВЗАМЕН ГОСТ 7.25-80

ГОСТ 7.25-2001

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННО-ПОИСКОВЫЙ ОДНОЯЗЫЧНЫЙ

Правила разработки, структура, состав и форма представления
System of standards on information, librarianship and publishing. Monolingual thesaurus for information retrieval.
Rules for its development, structure, composition and form of presentation
Дата введения 2002-07-01
1 Область применения
Настоящий стандарт устанавливает правила разработки, структуру, состав и форму представления информационно-поисковых тезаурусов (далее - ИПТ), ориентированных на использование лексики русского языка и разрабатываемых в рамках автоматизированных информационных систем и сетей научно-технической информации.
2 Нормативные ссылки
В настоящем стандарте использованы ссылки на следующие стандарты:
ГОСТ 7.0-99 Система стандартов по информации, библиотечному и издательскому делу. Информационно-библиотечная деятельность, библиография. Термины и определения
ГОСТ 7.47-84 Система стандартов по информации, библиотечному и издательскому делу. Коммуникативный формат для словарей информационных языков и терминологических данных
ГОСТ 7.49-84 Система стандартов по информации, библиотечному и издательскому делу. Рубрикатор ГАСНТИ. Структура, правила пользования и ведения
ГОСТ 7.67-94(ИСО 3166-88) Система стандартов по информации, библиотечному и издательскому делу. Коды названий стран
HYPERLINK "5199.htm" \o "Система стандартов по информации, библиотечному и издательскому делу. Поиск и распространение информации. Термины и определения" ГОСТ 7.73-96 Система стандартов по информации, библиотечному и издательскому делу. Поиск и распространение информации. Термины и определения
ГОСТ 7.74-96 Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения
ГОСТ 7.75-97 Система стандартов по информации, библиотечному и издательскому делу. Коды наименований языков
HYPERLINK "5201.htm" \o "Система стандартов по информации, библиотечному и издательскому делу. Межгосударственный рубрикатор научно-технической информации. Структура, правила использования и ведения" ГОСТ 7.77-98 Система стандартов по информации, библиотечному и издательскому делу. Межгосударственный рубрикатор научно-технической информации. Структура, правила использования и ведения
3 Определения
В настоящем стандарте применяют следующие термины с соответствующими определениями:
3.1 лексическая единица (ЛЕ) ИПТ: Слово, словосочетание или лексически значимый компонент сложного слова естественного языка, включенное в ИПТ в качестве дескриптора или аскриптора.
3.2 класс эквивалентности ЛЕ: Совокупность лексических единиц, различие значение которых несущественно для определения основного содержания документов в информационной системе.
3.3 Остальные термины - по ГОСТ 7.0, HYPERLINK "5199.htm" \o "Система стандартов по информации, библиотечному и издательскому делу. Поиск и распространение информации. Термины и определения" ГОСТ 7.73 , ГОСТ 7.74.
4 Правила построения информационно-поискового тезауруса
4.1 По своему построению ИПТ подразделяют на два типа:
- тезаурусы, выделяющие среди своих лексических единиц дескрипторы и аскрипторы;
- тезаурусы, все ЛЕ которых являются дескрипторами.
Построение ИПТ включает следующие этапы:
- определение тематического охвата ИПТ;
- сбор массива ЛЕ;
- формирование словника ИПТ;
- построение словарных статей и указателей;
- оформление ИПТ;
- экспертиза и регистрация ИПТ.
4.2 Определение тематического охвата ИПТ
Определение тематического охвата ИПТ осуществляется на основе Государственного рубрикатора НТИ по ГОСТ 7.49 или Межгосударственного рубрикатора НТИ по HYPERLINK "5201.htm" \o "Система стандартов по информации, библиотечному и издательскому делу. Межгосударственный рубрикатор научно-технической информации. Структура, правила использования и ведения" ГОСТ 7.77 путем анализа информационной потребности абонентов (потребителей). При анализе состава имеющегося или проектируемого информационного фонда и информационных потребностей абонентов отмечаются все рубрики нижнего уровня Рубрикатора, по которым осуществляется комплектование фондов или которые соответствуют запросам абонентов.
4.3 Сбор массива лексических единиц
До начала работ по сбору массива ЛЕ разработчик должен обратиться в депозитарный фонд с целью определения наличия зарегистрированных тезаурусов по заданной тематике.
При наличии таких тезаурусов проводят оценку возможности внедрения их в данной системе.
Первоначальный сбор лексики осуществляется выделением ЛЕ из представительной коллекции документов и/или запросов.
В полученный массив ЛЕ дополнительно должны быть включены соответствующие тематике ЛЕ, выделенные в соответствии с методикой построения данного тезауруса из следующих источников:
Государственного рубрикатора НТИ (ГОСТ 7.49);
рубрикатора соответствующей системы научно-технической информации;
энциклопедических, толковых и терминологических словарей и справочников;
терминологических стандартов;
классификаторов технико-экономической информации;
таблиц Универсальной десятичной классификации (УДК) и других систем классификации;
нормативных (авторитетных) словарей коммуникативных форматов.
Наименования стран и других географических единиц должны соответствовать требованиям ГОСТ 7.67, наименования языков - требованиям ГОСТ 7.75.
4.4 Формирование словника ИПТ
4.4.1 В словник ИПТ могут быть включены следующие типы ЛЕ:
одиночные слова (существительные, прилагательные, глаголы, наречия);
именные словосочетания;
лексически значимые компоненты сложных слов;
сокращения слов и словосочетаний.
4.4.2 Допускается включать словосочетания в словник, если в качестве опорного слова они содержат существительное и если выполнено одно из следующих условий:
- значение словосочетания не выводится из значений его компонентов.
Примеры

ЧЕРНЫЙ ЯЩИК,

АБСОЛЮТНО ЧЕРНОЕ ТЕЛО,

ЦАРСКАЯ ВОДКА;

- хотя бы один из компонентов словосочетания не употребляется в составе других сочетаний или употребляется всегда в другом смысле.
Примеры

ТОРГОВЛЯ НА ВЫНОС,

ЛЕГКАЯ ПРОМЫШЛЕННОСТЬ;

- для данного словосочетания в словнике ИПТ существуют полные синонимы.
Пример

НАТРИЯ ХЛОРИД = ПОВАРЕННАЯ СОЛЬ;

- данное словосочетание является устойчивым словосочетанием с именем собственным.
Примеры

ТАБЛИЦА МЕНДЕЛЕЕВА,

ЗАКОН БОЙЛЯ-МАРИОТТА;

- отдельные слова словосочетания имеют слишком широкое значение.
Пример
слово МАШИНЫ в словосочетаниях:

СТРОИТЕЛЬНЫЕ МАШИНЫ,

ЭЛЕКТРИЧЕСКИЕ МАШИНЫ;

- для данного словосочетания в словнике ИПТ существует общепринятая аббревиатура.
Примеры

ПОВЕРХНОСТНО-АКТИВНЫЕ ВЕЩЕСТВА = ПАВ,

УНИВЕРСАЛЬНАЯ ДЕСЯТИЧНАЯ КЛАССИФИКАЦИЯ = УДК,

ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС = ИПТ,

ЭЛЕКТРОННО-ВЫЧИСЛИТЕЛЬНАЯ МАШИНА = ЭВМ;

- разбиение словосочетаний на отдельные компоненты приводит к потере важных для поиска семантических связей.
Пример
разбиение ЛЕ «ЯЗЫК ПРОГРАММИРОВАНИЯ» не позволяет установить связи с такими ЛЕ, как «АЛГОЛ», «КОБОЛ», «ФОРТРАН».
Словосочетания, которые не удовлетворяют перечисленным условиям, разбивают на компоненты.
4.4.3 Падежные формы одиночных существительных следует заменять формой именительного падежа. Падежные формы опорных существительных в словосочетаниях также заменяют формой именительного падежа с одновременным изменением падежной формы согласованных определений.
4.4.4 В ИПТ должно быть принято последовательное представление ЛЕ, выраженных именами существительными и именными словосочетаниями, в формах единственного либо множественного числа в соответствии с традицией лексикографических источников, либо практикой промышленных каталогов. В предисловии к ИПТ должны быть указаны принципы выбора формы числа ЛЕ.
4.4.5 Формы прилагательных и причастий следует приводить к именительному падежу. Прилагательные и причастия в единственном числе приводят к форме мужского рода.
4.4.6 Глаголы рекомендуется заменять отглагольными существительными. Глаголы, включенные в словник, приводят к форме инфинитива.
4.4.7 Компоненты сложных слов, включаемые в словник ИПТ, должны быть широко употребляющимися частями сложных слов, общепринятых в данной специальности. Отсутствующий компонент сложного слова заменяют дефисом.
Примеры

ЭЛЕКТРО-

ГИДРО-

ВОДО-

ТЕРМО-.

4.4.8 При наличии аббревиатур в словник должны быть включены также соответствующие им полные формы.
Примеры

ИПТ - ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС,

ОКГ - ОПТИЧЕСКИЙ КВАНТОВЫЙ ГЕНЕРАТОР,

УКВ - УЛЬТРАКОРОТКОВОЛНОВЫЙ.

4.4.9 Сокращения должны соответствовать требованиям стандартов на сокращения слов в библиографических описа