Связанные понятия
Разговорник — сборник переводов полезных фраз на иностранном языке. Разговорники выпускаются, как правило, для туристов. Содержат тематические разделы (например, «В гостинице», «Вывески», «В ресторане», «Знакомство»), в которых приводятся общеупотребительные фразы как на иностранном языке, так и в фонетической транскрипции на языке пользователя. Первоначально разговорники выпускались в формате карманных книг.
Сноска — примечание (замечание), помещаемое внизу полосы (постраничная сноска) или в конце текста (концевая сноска).
Стандартный английский язык (англ. Standard English, в кругах лингвистов часто используется аббревиатура SE) — понятие, которое относится к любой форме английского языка, включающей в себя грамматику, лексику и правописание, принятой в качестве национальной нормы в англоязычных странах. Поскольку, в отличие от абсолютного большинства наиболее распространённых языков мира, у английского языка нет никакого официального регулятора, точное определение «стандартного английского языка» невозможно дать...
Сло́вник — перечень слов, расположенных в алфавитном или систематизированном порядке, составляемый в процессе работы над словарём или энциклопедией. При подготовке словника энциклопедии он представляет собой оглавление издания, отражающее его структуру и профиль. При составлении словника производится отбор терминов и устанавливается соотношение объёмов разделов и отдельных статей, выделяется цикл статей, разрабатывается система ссылок. С работой над словником тесно связано планирование помещения...
В лингвистике кóрпус (в данном значении множественное число — кóрпусы, не корпусá) — подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка. Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке.
Подробнее: Корпус текстов
Большой словарь японского языка (яп. 日本国語大辞典, にほんこくごだいじてん, нихон кокуго дайдзитэн) — крупнейший в мире толковый словарь японского языка. Издан в издательстве «Сёгакукан» благодаря сотрудничеству японских языковедов со специалистами других наук. Основной справочный источник для исследователей японского языка.
Возрождение языков (языковое возрождение, также оживле́ние или восстановле́ние языков) — процесс, который может иметь два значения...
Панграмма (c греч. «все буквы») или разнобуквица — короткий текст, использующий все или почти все буквы алфавита, по возможности не повторяя их.
Теза́урус (от греч. θησαυρός «сокровище»), в общем смысле — специальная терминология, более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей, в которых указаны...
Оглавле́ние — указатель заголовков издания, отражающий рубрикацию произведения и ускоряющий поиск частей издания.
Указатель — это справочный текст, который выглядит как список ключевых слов и страниц, где они упомянуты.
Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), по типичности (слова, частотные для большинства текстов), и т. д. Частотные списки используются для преподавания языка, создания новых словарей, приложений компьютерной...
Глобиш (англ. Globish) — версия английского языка, разработанная вице-президентом по международному маркетингу компании IBM Жаном-Полем Нерьером на основе стандартной английской грамматики и лексикона в 1500 английских слов. По оценкам самого Нерьера, глобиш «сам по себе не является языком», но служит средством коммуникации в международном бизнесе для людей, не являющихся носителями английского языка.
Идеографи́ческий (семанти́ческий) слова́рь — словарь, в котором статьи упорядочены не по алфавиту, как обычно, а по смыслу (лексическому значению заглавного слова или фразы). Если алфавитный словарь служит для того, чтобы узнать что-то о данном слове, то идеографический словарь служит для того, чтобы узнать что-то о данном смысле — например, какими словами можно выразить данное значение.
Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.
Пара́граф (от греческого παράγραφος — написанное рядом) — мелкое подразделение текста внутри главы, раздела, обозначаемое обычно специальным знаком — § или пп.
Библиографическая запись — наименьшая единица библиографического списка, состоящая из заголовка и библиографического описания, одна из форм библиографической информации. Используется для идентификации документа, составления библиографий и осуществления библиографического поиска.
Семанти́ческий ана́лиз — этап в последовательности действий алгоритма автоматического понимания текстов, заключающийся в выделении семантических отношений, формировании семантического представления текстов. Один из возможных вариантов представления семантического представления — структура, состоящая из «текстовых фактов». Семантический анализ в рамках одного предложения называется локальным семантическим анализом.
Орфографи́ческий слова́рь — словарь, содержащий перечень слов в их нормативном написании. Отличается от толкового словаря по способу описания слова, поскольку раскрывает слово лишь в аспекте его правописания. Является показателем современной ему орфографии.
Амперса́нд (иногда — амперсе́нд; англ. ampersand) — знак &. Он является логограммой, заменяющей союз «и», и возник как лигатура букв et (с лат. — «и»).
Коды языков — короткие алфавитные или цифровые коды, разработанные для представления языков в обработке данных и коммуникациях. Разработано несколько различных систем, наиболее известная из которых — ISO 639.
Кернинг (англ. kerning) при наборе текста — избирательное изменение интервала между буквами в зависимости от их формы.
Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.
Орфография исландского языка — правописание, система правил, определяющих единообразие способов передачи речи (слов и грамматических форм) на письме в исландском языке.
Гиперкорре́ктность , гиперкорре́кция — в языкознании: использование языковых правил за пределами границ их применимости, приводящее к появлению ошибок; гиперкорректность — следствие языковой неуверенности в попытке говорить «правильно», используя более престижные формы. Гиперкоррекции могут подвергаться как написание, так и произношения слова, а также другие аспекты языка.
Нау́чный стиль — функциональный стиль речи литературного языка, которому присущ ряд особенностей: предварительное обдумывание высказывания, монологический характер, строгий отбор языковых средств, тяготение к нормированной речи.
Электронное издание — электронный документ (группа электронных документов), прошедший редакционно-издательскую обработку, предназначенный для распространения в неизменном виде, имеющий выходные сведения.
Мангеймский корпус немецкого языка (COSMAS corpora или DeReKo) — это коллекция современных немецкоязычных текстов, поддерживаемая Институтом немецкого языка в городе Маннгейм (Германия). В корпусе представлены различные типы текстов: научная и научно-популярная литература, большое количество газетных текстов, художественная проза, и др. Представляя собой самое большое в мире электронное собрание современных немецкоязычных текстов, является инструментом корпусной лингвистики.
Языки среднеевропейского стандарта (англ. Standard Average European или SAE), также языки СЕС — языки европейского языкового союза, обладающие рядом общих грамматических особенностей, как правило не связанных с общим происхождением. К языкам СЕС относятся романские, германские, балканские и балто-славянские языки, чуть более периферийное положение среди них занимают западные финно-угорские.
Частеречная разметка (автоматическая морфологическая разметка, POS tagging, part-of-speech tagging) — этап автоматической обработки текста, задачей которого является определение части речи и грамматических характеристик слов в тексте (корпусе) с приписыванием им соответствующих тегов. POS tagging является одним из первых этапов компьютерного анализа текста.
Паро́нимы (от др.-греч. παρα- — приставка со значением смежности + ὄνυμα — «имя») — это слова, сходные по звучанию и морфемному составу, но различающиеся лексическим значением. Также возможно ошибочное употребление одного из них вместо другого. Например, адресат — адресант. По аналогии с ложными друзьями переводчика паронимы иногда называются ложными братьями.
Язык
эсперанто был стабилен с момента его создания на фоне других искусственных языков. Это связано с документом Декларация Булонь (Declaration of Boulogne) от 1905 года, определяющим суть и основные принципы движения эсперантистов. Декларация была написана Л. Л. Заменгофом. Согласно декларации, обязательной для всех эсперантистов, фундаментом языка эсперанто является произведение «Основы эсперанто», в которое никто не имеет права вносить изменения.
Дескриптиви́зм , дескриптивная лингвистика (англ. descriptive "описательный" < позднелатин. descriptivus < descript- "записанный") — направление американской лингвистики 1920—1950-х годов. Основоположником дескриптивизма и его главным теоретиком считается Л. Блумфилд.
Абза́ц (нем. Absatz «раздел, часть текста») — отрезок письменной речи, состоящий из одного или нескольких предложений.
Авторский знак , или один из основных элементов выходных сведений печатного издания, введён специалистом библиотечного дела Любовью Борисовной Хавкиной в 1916 году.
Удобочитаемость («читабельность») — свойство текстового материала, характеризующее лёгкость восприятия его человеком.
Кавы́чки — парный знак препинания, который употребляется для выделения прямой речи, цитат, отсылок, названий предприятий, литературных произведений, газет, журналов, а также отдельных слов, если они включаются в текст не в своём обычном значении, используются в ироническом смысле, предлагаются впервые или, наоборот, как устаревшие и тому подобное.
Язык закона (язык нормативных правовых актов) — совокупность лексических, синтаксических и стилистических средств, посредством которых формируется текст закона или иного нормативного правового акта.
Маке́т изда́ния — макет оформления книги, газеты или журнала, согласно которому набирается и верстается текст. Макет с готовой вёрсткой издания называется оригинал-макет.
Международный вспомогательный язык (МВЯ) — язык, предназначенный для общения между людьми различных народов, говорящих на разных языках (обычно в качестве второго языка).
Диалекты английского языка — совокупность диалектов, сложившихся на Британских островах, возникших в результате расширения Британской империи и — после Второй мировой войны — влияния Соединённых Штатов по всему земному шару. Число диалектов и базирующихся на английском креольских языков и пиджинов довольно велико.
Двуязычный
словарь по традиции называется переводным. На протяжении веков перевод текстов был главным стимулом для создателей двуязычного словаря. Однако современные двуязычные словари становятся все более интегральными, включая синонимы и толкования, краткие сведения о реалиях и дополнительную грамматическую информацию о заглавном слове. С появлением электронной и кибернетической лексикографии возможности и перспективы двуязычного словаря могут оцениваться не только с позиции адекватности и полноты...
Порося́чья латы́нь , также сви́нский лати́нский (англ. Pig Latin, «самоназвание» — Igpay Atinlay) — «тайный язык», представляющий собой зашифрованный английский. Чаще всего используется в шутливом или полушутливом контексте. В Великобритании также называется backslang.
Память переводов (ПП, англ. translation memory, TM, иногда также называемая «накопитель переводов») — база данных, содержащая набор ранее переведённых сегментов текста.
Дезеретский алфавит , англ. The Deseret alphabet (???????/???????) — фонетический алфавит, разработанный в середине XIX века правлением Дезеретского университета (ныне Университет Юты) под руководством Бригама Янга, второго президента мормонской церкви. Название дано в честь нереализованного мормонского проекта по созданию штата Дезерет.
Бе́йсик-и́нглиш (англ. Basic English — базовый английский; иногда название расшифровываются как British American Scientific International Commercial — «британо-американский научный международный коммерческий») — международный искусственный язык на основе английского языка, созданный в 1925 году британским лингвистом Чарльзом Огденом.
Библиоме́трия — применение математических и статистических методов к изучению книг, периодических изданий и прочих публикаций.