Языковые рекорды. Что у нас с БАСом? В каком языке больше

Сколько слов в русском языке и сколько слов в английском языке?

Угрожающие попытки "развенчать мифы о великом и могучем"

Хорошо известно, что словарный запас различных языков неодинаков. Лексикон цивилизованного человека может в десятки раз превышать словарный запас представителя какого-нибудь дикого племени Африки. Также понятно, что и в пределах одного и того же языка у разных носителей словарный запас сильно различается: у ребенка и взрослого, у дворника и профессора... В любом случае, ни у кого не возникает сомнений, что более обширный словарь всегда связан с запасом знаний и интеллектуальным превосходством. А теперь внимание: что бы вы подумали, если бы вам официально заявили, что наш русский язык - дикарский, содержит в пять раз меньше слов, чем английский? Конечно, возмущенно оспорили бы эту чушь! Однако подобное "научное мнение" неоднократно транслируется в СМИ. Это не может не настораживать.

Последний раз это утверждение прозвучало с телеэкранов в 2011 году. Но обсуждать и анализировать легче не телепередачи, а печатные материалы, с которыми легче ознакомиться (например, в интернете). Так, можно заглянуть в архив журнала "Наука и жизнь". В 6-м номере за 2009 год опубликована доктора филологических наук (!), некоего Милославского, под издевательским названием "Великий, могучий русский язык". В нем автор "развенчивает мифы" о русском языке. В частности, утверждается, что "по весьма огрубленным подсчетам, словари английского литературного языка содержат порядка 400 тыс.слов, немецкого - порядка 250 тысяч, русского - порядка 150 тысяч". Из чего предлагается сделать выводы о том, что "богатство русского языка - миф" (почти дословная цитата). Вообще, статья написана в духе самооплевывания, характерного для начала 90-х; меня даже несколько поразила ее анахроничность. Не говоря уж о полной ненаучности.

Автор даже не упомянул о сложностях и проблемах подсчета слов и вообще о проблеме возможности и уместности сколь-нибудь научного определения и сравнения словарного запаса целых языков. Считаю необходимым привести следующие возражения.

1) В разных культурах различны критерии "допуска" слов в литературный язык. В континентальной традиции господствует централизованное планирование, тогда как у англосаксов во всем стихия рынка (неформальный подход). Например, у французов лексика проходит строгую цензуру со стороны такого органа как Academie Francais (Академия французского языка). Она решает, какие слова принадлежат литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда считается, что во французском языке, со всей его богатейшей литературой, не более 150.000-200.000 слов. В английском же каждый может придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тыс.слов из своего писательского словаря в 21 тысячу слов. Это, кстати, огромное достижение для писателя, его превышает только наш Пушкин: 24 тыс.слов, абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен - см. "Словарь языка Пушкина" в 4-х томах (М., 1956-1961). Большинство же образованных европейцев активно используют не более 8-10 тыс.слов, а пассивно - 50 тыс. и более.

Очевидно, названные автором той статьи 150.000 русских слов - это слегка округленный объем широко известного Большого Академического словаря русского языка (БАС), который в издании 1970 года в 17 томах насчитывал 131 257 слов. А английские 400.000 - это, по-видимому, последние издания Оксфордского и Вебстера. Причем в предпоследних изданиях этих же английских словарей слов было в несколько раз меньше (конкретику можно посмотреть в интернете). Откуда же такой прирост и почему их словари содержат больше слов, чем наши? Первая причина - беззастенчивый подсчет архаизмов, которые современные англичане и американцы, конечно же, не знают. В английской филологической традиции лексикой современного английского языка считаются все слова со времен Шекспира (современника Ивана Грозного и Бориса Годунова). В российской же традиции вся допетровская, а с подачи знаменитого лексикографа Ушакова - и допушкинская лексика считается древне- или старорусской.

Вторая причина в том, что стали еще менее строгими критерии "приема" новых слов в язык. Подходы к английскому языку становятся всё более смелыми, появляющиеся в интернете оценки просто фантастичны. Так, агентство GLM (Global Language Monitor, сайт www.languagemonitor.com) рапортует о появлении... миллионного слова в английском языке! По тому, какое слово считается миллионным, сразу понятно, за какую свалку мусора они пытаются выдать английский язык: это "слово" Web 2.0! И это наряду с тем, что (the) web ("паутина") считается отдельным словом. Очевидно, Web 1.0 тоже где-то посчитали как отдельное слово! Более того, они не стесняются считать словами словосочетания: в качестве 1 000 001-го слова посчитано "financial tsunami" - "Финансовое цунами". В таком случае и в русском языке наряду со словами "финансовый(-ая,-ое)" и "цунами" есть слово "финансовое цунами", которое можно посчитать. Впрочем, пуристы, составлявшие БАС, вряд ли включили в него слово "цунами", поскольку это иностранное заимствование (об этом см. следующий пункт ниже).

Для справки:

Анализ компании Global Language Monitor состоит из нескольких этапов. На первом этапе подсчитываются слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s . При этом стоит заметить, что в последнее издание словаря Merriam-Webster"s вошло только 450 тысяч английских слов. На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывают все неологизмы английского языка. При этом производится анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитываются периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Именно этот прием в работе компании Global Language Monitor вызывает шквал критических замечаний со стороны независимых экспертов. Главный упрек сводится к тому, что при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при своем методе учета, компания учитывает и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. А это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. Вдобавок ко всему, в качестве лексических новинок английского языка, учтены и языковые ляпы, допущенные Президентом США - Бушем.

Предлагаю: внести в словарь все ляпы Черномырдина и тем самым "перегнать Америку"!

Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает только 300 тысяч слов.

2) Английский не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Мы жалуемся на засилье английских заимствований, но тот слой научно-технической и деловой лексики, который проник в наш язык с падением железного занавеса, - это лишь жалкая горсточка по сравнению с активными заимствованиями, без всякого ложного стеснения производимыми английским языком. Еще со времен Вильгельма Завоевателя он наполовину французский. Получается, что мы заимствуем заимствованное! Или, образно говоря, перекупаем купленное. А теперь, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые пласты лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти пласты лексики относятся к так называемым окказионализмам .

Для справки:

Окказионализмы - это слова, созданные спонтанно, для однократного употребления. Встает вопрос - с какого момента считать это слово частью словарного запаса? Сколько нужно повторений этого слова в речи или в печати, чтобы прийти к выводу, что оно перестало быть случайным артефактом и стало полноправной частью лексики?

Существуют также слова, ограниченные очень узкой частью социума. Скажем, одной семьей. Реальный пример: все члены одной известной мне семьи называют вареную картошку, поджаренную с колбасой, словом «второжарёнка». Это их собственное изобретение, и больше я такого слова нигде не встречал. Можно ли считать этот окказионализм полноправной частью русской лексики?

В Оксфордском словаре в четыре раза больше слов, чем в БАСе - Большом академическом словаре русского языка. "Великий и могучий" полон английских заимствований. Школьники перестали понимать Пушкина. Что происходит с русским языком? Рождает ли он новые слова? Почему наши словари такие тонкие? На эти вопросы "РГ" отвечает один из авторов Большого академического словаря русского языка - знаменитого БАСа Людмила Кругликова.

Как считают словарный запас? Почему Оксфордский словарь такой толстый?

Людмила Кругликова: Лингвисты избегают такого рода сравнений между языками и словарями. У каждого своя специфика. Скажем, в Вебстеровский словарь в качестве самостоятельных статей включаются символы, например, химических элементов: B (бор), Ba (барий), Be (бериллий), Br (бром) и так далее, сокращенные наименования мер длины, веса, объема: km (километр), kg (килограмм), bbl (баррель)... Мало того, толковые словари английского языка начали включать символы обозначений размеров листов бумаги: А3, А4, А5, а также, например, символ @.

Поэтому вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) - 600 000, не что иное, как обман. БАС отражает лексику только современного литературного языка, а Оксфордский словарь - слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые.

А сколько слов в русском языке, если считать по-английски?

Людмила Кругликова: Если мы добавим к 150 000 слов современного русского литературного языка, например, еще и диалектные слова, то получим уже 400 000 слов...

Как объяснить тот факт, что один из самых известных английских словарей Вебстеровский стал резко худеть, и время "похудения" пришлось на Вторую мировую войну и начало "холодной"?

Людмила Кругликова: Не стоит искать в лингвистических процессах какую-то политику. Вебстеровский словарь, появившийся в 1909 году, содержал 400 000 английских слов. В его втором издании (1934 год) содержится 600 000 слов, в третьем (1961 год) - 450 000 слов. На основании этого можно заявить, что с 1934 года началось катастрофическое вырождение английского языка. А причина таких резких скачков всего лишь в том, что у второго и третьего изданий были разные редакторы, а у них разные принципы подхода к отбору слов.

На сайте издательской фирмы Merriam-Webster сказано: "Считается, что словарь английского языка включает примерно миллион слов". Это честная цифра?

Людмила Кругликова: Большинство лингвистов восприняло такую оценку с долей юмора, а некоторые сказали, что они не были бы удивлены, если бы он оценивался в четверть миллиона.

Откуда тогда взялся миллион?

Людмила Кругликова: Начиная с 2006 года некто Дж. Дж. Паяк, специалист по маркетингу и аналитике, основатель компании Global Language Monitor неоднократно заявлял о том, что скоро будет зафиксировано миллионное слово английского языка. Таким словом стало, по версии Паяка, "Web 2.0", которое является техническим термином. Кстати, уже есть и Web 3.0, а в Сети идет речь о скором появлении Web 4.0, Web 5.0. Если включать все подобные образования, то скоро можно будет говорить о миллиардном слове английского языка.

Как англичане и американцы относятся к таким сенсациям?

Людмила Кругликова: Приведу высказывание Нунберга, лингвиста из Школы информации в Калифорнийском университете в Беркли: "Наше восхищение необъятностью английского языка возникает из своего рода лингвистического империализма - ощущения, что "наши словари больше, чем их словари". Но это на самом деле не делает нас сколь-либо богаче лингвистически".

Но и среди исследователей "великого и могучего" есть лингвистические пессимисты, которые считают, что корни русского языка "бесплодны": не рождают новых слов, а большинство неологизмов имеет иностранное происхождение...

Людмила Кругликова: Лингвист и философ Михаил Эпштейн утверждает, что в XIX веке было 150 слов с корнем "люб", а наши современники знают в три раза меньше. Между тем в "Словообразовательном словаре русского языка" Тихонова, насчитывающем около 145 000 слов современного русского литературного языка, имеется 310 слов с корнем "люб". А если считать начиная с первых памятников письменности, то получится 441 слово. В английском языке, по данным OED, только 108 лексем с аналогичным корнем (love) в начале слова.

Новые слова "про любовь" современные россияне производят?

Людмила Кругликова: В начале ХХ века появилось существительное "книголюб", а затем "природолюб", "однолюбка", "любовь-игра", "любовь-ненависть", "любовь-морковь", "безлюбье". При беглом просмотре я насчитала не менее 40 слов с корнем "люб", которые появились в XX - начале XXI века. В английском языке с корнем (love) только пять единиц вошло в язык в ХХ веке (с 1907 по 1989 год), а после этого времени ни одной.

Насколько активны сейчас наши соотечественники в политическом словотворчестве?

Людмила Кругликова: В этом отношении весьма интересно читать комментарии в Интернете. События на Украине вызвали к жизни такие лексемы, как майдауны, майданутые, онижедети, укры, укропы, псакинг, Фашингтон, Гейропа и другие. Приживутся они или нет, покажет время.

Наши депутаты периодически восстают против заимствований. Где их критический предел в языке? 70% - катастрофично?

Людмила Кругликова: По подсчетам лингвистов, во втором издании Вебстеровского словаря только 35% исконных английских слов, остальные 65% - заимствования. Но пока ничего катастрофического не случилось. Русский язык действительно испытывает большое влияние английского. Но обогащение его англицизмами наблюдается прежде всего в сфере необщенародной лексики, среди которой преобладают термины из области спорта, компьютерного дела, экономики, финансов. Плохо, если они начинают влиять на структуру языка. С русским этого не происходит. Иноязычные слова подстраиваются под систему, заимствованные корни обрастают русскими аффиксами, например: постить, смайлик, океюшки, лайкать и даже облайканный.

За 10 лет работы над БАСом сделано 22 тома - это две трети работы. Вас не упрекают за медлительность?

Людмила Кругликова: Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома. Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов. Когда в нью-йоркском офисе Оксфордского словаря узнали о наших темпах работы мизерными силами, то план работы их сотрудников увеличили, а главного редактора отправили на пенсию.

Пишу только потому, что не нашел у предыдущих отвечающих конкретных ответов на конкретные вопросы.

Если сравнить русский и английский словари, то видно, что мы проигрываем по числу слов английскому языку:

Да, в основном это так. Можно спорить по поводу конкретных цифр, но если сравнивать по словнику, то безусловно количество вариантов перевода с русского на английский конкретного слова обычно больше, чем в обратную сторону. Это факт известен и не подлежит переосмыслению.

150 тысяч слов, среди которых не менее 30% заимствованных слов;

А вот здесь уже начинаются натяжки. Какие слова считать заимствованиями? Все, кроме прямых индоевропейских? Так их 0,2-0.3%. Доставшиеся от праславянского? Их не более 3% Из древнерусского? Этих поболее, но тоже явно не 70%. Другими словами, в русском, как и почти во всех живых и развитых языках (кроме, может, китайского, там просто заимствования не приживаются), основной состав словника - заимствования разных этапов. Для чего я это говорю? Просто для того, чтобы высказать одну простую мысль. В английском заимствований не в пример больше. Потому и слов больше.
Вопрос это не принципиален ровно до того момента, пока не начитается сравнения в разных языках. Огромные пласты французской, голландской, норманнской и кельтской лексики. И вроде бы даже единичные докельтские (пиктские) слова имеются. Короче, тут ловить нечего.

А вот это уже, простите, полный бред. Мог бы показать несостоятельность идеи, но поскольку "духовность" (и прочие скрепы) весьма мало связаны с филологией, развивать эту мысль не буду. Просто за рамками темы.

Впрочем, как уже сказали, количество слов в языке, не отражает количества понятий ими выражаемых. В немецком "слов" неизмеримо больше, поскольку едва ли не любая пара существительных допускает образования нового слова слияним исходных. Да и не только пара... Но понятий-то больше не становится от того, что слова пишутся слитно...

И потенциал реализации этого ресурса тоже есть – ведь английские слова активно проникают в русский язык".

Вот, пожалуй, единственная нетривиальная тема - о заимствованиях. Обогощают они язык или засоряют. Но у вас вопрос так не стоит, я не буду мысию по древу растекаться. Если коротко, то ни то, ни другое. Надо просто принять как данность, что процесс идет.

Перебросился я репликами с МаркИз"ом - и вот что подумал.

Получается, что реальность англоговорящих богаче по восприятию, чем у русскоговорящих. И это значит, что ресурс (у нас, по-видимому!) в понимании себя и мира есть, и большой.

Видимо, надо прежде всего понять, что тут означает сам термин "богатая по восприятию реальность". Очевидно, что вот мы с МИ трактуем это совершенно по-разному. Возможно, что у автора этого текста вообще своё собственное понимание этого. И не исключено, что в этом его понимании, слованый запас действительно как-то коррелирует с богатством мировосприятия. Ну скажем, на уровне выразительности средств.

Я считаю, что в нашем современном мире очень сложно обойтись без средств коммуникации. А ведь в далеком прошлом общение между нами, людьми, отличалось от общения между животными только наскальными рисунками. Я часто задумываюсь над тем, что самое большое приобретение цивилизации - это слово и речь в частности.

Поиск языка-рекордсмена по количеству слов

В малоразвитых народах Африки современные языки насчитывают до четырёхсот слов, нужно ли говорить о письменности? Стоит напомнить, что среднестатистический житель ведущих стран мира за всю свою жизнь изучает около 100 000 и активно использует примерно 15–50 тысяч.

Покопавшись немножечко в цифрах официальных источников, я нашла ответ, который довольно не очевиден, но оставим самое вкусное на потом.

Восточные языки

Да, я сразу подумала о дальних странах и множестве мудреных иероглифов в языках, например в:

  • японском филологи насчитывают до 120 000 отдельных слов;
  • китайском - этот азиатский язык насчитывает около 500 000, включая диалектные;
  • корейском - ну тут совсем мало, лишь 100 000.

Малейшая палочка или помарка в корне меняет суть целого предложения, которое может вместиться в символ. Поэтому для тех регионов каллиграфия ну очень важна.

Самым обширным из них, как мы видим, является китайский. Простые носители этого языка используют примерно 5 000 иероглифов.

Я не удовлетворилась таким результатом и пошла искать дальше.

Русский

Как настоящий патриот, я сразу подумала о своём изящном и красочном языке, цитируя великого классика: «Я русский бы выучил только за то, что им разговаривал Ленин». Но может ли родной певчий тягаться количеством слов, например, с тем же китайским? Увы, но словари с филологами говорят, что не может: дальше двухсот тысяч не насчитали.

Английский

« Интернациональный язык должен быть самым полным, чтобы все люди в мире однажды смогли понять друг друга!» - дошло до меня.


Он опережает предыдущего претендента на сей титул аж вдвое! Да-да, он насчитывает в себе более миллиона слов при том, что каждый день впитывает в себя приблизительно пятнадцать новых . Как приятно изучая его, каждый раз расширять свой диапазон знаний и осознавать, что ему еще есть чем меня приятно удивить! Но сердце подсказало, что это не предел и я продолжила копаться дальше.

Итальянский

В Неаполе у Королевского дворца на экскурсии гид как-то упомянул, что теоретически самый богатый в мире язык - итальянский. Это все из-за того, что все составные числительные прописью пишут слитно . А это значит, что слова попросту невозможно сосчитать , так как числовой ряд бесконечен.


Но можно ли разговаривать с помощью одних лишь чисел? Да, если присвоить каждому слову порядковый номер, например. Будет ли это удобно? Нет. Посему утоляем жажду познаний дальше.

Арабский

Уж этот язык является безоговорочным лидером, так как слов насчитывает целых шесть миллионов! Кто бы мог подумать, что именно он из ныне живых языков самый красочный и огромный. Вот уж есть где разгуляться внутреннему рассказчику! Язык бесплодных песчаных дюн и роскошных дубайских построек так и чарует своим восточным шармом с первых слогов.

Хороших слов в хорошем языке должно быть много!


В каком языке больше слов? В основном, интересует русский и английский языки, стандартная лексика (без устаревших слов и специальн

Здравствуйте, Юрий!
Для всех людей ответ разный. У нас русский, это родной язык. Мы его знаем лучше, чем например британцы. А английский мы знаем хуже чем они. нам кажется, что в русском языке больше слов.Я вот полазила по иинтернету.

"Приступая к изучению языка, важно знать, насколько он распространен. Возможны 2 критерия: (а) количество людей, для которых тот или иной язык является родным; (б) число людей, владеющих данным языком на уровне родного или близко к этому.
По критерию (а) в реальном мире уверенно лидирует китайский язык (около миллиарда носителей, включая отклонения от стандартного пекинского/"мандаринского" варианта, иногда рассматриваемые как отдельные языки). Следом идут английский и испанский (по 400 млн), хинди (320 млн), арабский (260 млн), бенгальский (210 млн), португальский (190 млн), русский (160 млн), японский (120 млн), немецкий (100 млн), французский (90 млн), пенджабский, яванский, вьетнамский и индонезийский (по 80 млн), корейский, тамильский, маратхи, телугу и урду (по 70 млн), фарси (персидский), турецкий и итальянский (по 60 млн). На 21 перечисленном языке говорит 4 млрд человек - 64% населения планеты.”
Но эта статиска людей, но не слов. Но я думаю, по этой статистике тоже много можно судить.

"Хотя Британский совет прогнозирует, что к 2015 году по-английски заговорит почти полмира, налицо признаки утраты английским языком его главенствующей роли. Перепись населения США 2000 года показала значительный рост числа американских граждан, которые дома говорят не на английском, а на других языках. 47 млн американцев старше 5 лет - 1/5 населения США за вычетом маленьких детей - дома не говорят по-английски. Произошел также резкий скачок числа американцев, которые считаются "лингвистически изолированными" из-за ограниченного владения английским: почти 12 млн человек живут в семьях, в которых ни один взрослый не владеет английским на достаточном уровне для того, чтобы свободно общаться с продавцами, врачами или полицией. "

"13 апреля 2006 года число слов в английском языке составило 988 тысяч 968 . С учетом скорости словообразования, который рассчитала американская лингвистическая компания Global Language Monitor (GLM), миллионный рубеж будет преодолен уже летом текущего года, отмечает британская газета The Independent.
Расчеты GLM состоят из двух частей. Первая - это учет всех слов, занесенных в общепринятые словари английского языка - Oxford English Dictionary, Merriam-Webster"s, Macquarie"s. Одно только третье издание Merriam-Webster"s включает свыше 450 тысяч слов. Вторая часть работы GLM - это подсчет новых образований в языке при помощи специального алгоритма (Predictive Quantities Indicator). Этим алгоритмом его создатели пользуются при анализе СМИ (бумажных и электронных), новейшей печатной продукции, включая научно-техническую литературу, и блогов, постоянно растущего корпуса частных записей, доступного для всеобщего обозрения в интернете. "

" До 20 процентов слов, учтенных GLM, происходят из "гибридных" вариантов английского языка, которые используются в Китае и Японии ("Chinglish" и "Japlish", соответственно). Среди них можно встретить такие находки, как "drinktea", что значит "закрыто", и "torunbusiness" ("открыто"). Кроме того, в словник GLM попали и "бушизмы" (неологизмы американского президента), например, "uninalienable" and "misunderestimate". "

"Древний или классический английский язык насчитывал около 60 тыс. слов. В частности, в произведениях Вильяма Шекспира встречается 25 тыс. слов. Две тысячи из них были привнесены в современный ему язык самим поэтом.
К этому можно добавить, что английский язык сегодня используется почти во всех странах мира, а число говорящих на нем составляет более полутора миллиардов человек."