- Троицкий вариант — Наука - https://trv-science.ru -

Русский национальный

Ирина Левонтина

Ири­на Левон­ти­на

А вот и нет, совсем не про поли­ти­ку. Речь о том, что 29 апре­ля 2014 года испол­ни­лось 10 лет Наци­о­наль­но­му кор­пу­су рус­ско­го язы­ка. Я, кста­ти, и сама не зна­ла, что день рож­де­ния у НКРЯ в один день с заме­ча­тель­ней­шим линг­ви­стом А.А.Зализняком. НКРЯ – «это инфор­ма­ци­он­но-спра­воч­ная систе­ма, осно­ван­ная на собра­нии рус­ских тек­стов в элек­трон­ной фор­ме». Сей­час общий объ­ем Кор­пу­са – более 500 млн слов. Дела­ет его бле­стя­щая коман­да линг­ви­стов — спе­ци­а­ли­стов по так назы­ва­е­мой кор­пус­ной линг­ви­сти­ке, при уча­стии раз­ных орга­ни­за­ций, преж­де все­го Яндек­са и Инсти­ту­та рус­ско­го язы­ка им. В.В.Вино­градова РАН. Отме­тим, что в мире кор­пус­ная линг­ви­сти­ка вооб­ще сей­час бур­но разви­вается, ср., напри­мер, один из образ­цо­вых кор­пу­сов – Бри­тан­ский наци­о­наль­ный кор­пус (BNC) (www.natcorp.ox.ac.uk).

Кор­пус – это не про­сто боль­шое собра­ние тек­стов. Это собра­ние сба­лан­си­ро­ван­ное (тек­сты раз­но­го типа ото­бра­ны в опре­де­лен­ной про­пор­ции). При этом для кон­крет­ной зада­чи мож­но выбрать тек­сты того или ино­го жан­ра, вре­ме­ни и т.п. Напри­мер, мож­но за­дать такой под­кор­пус: поэ­ти­че­ские тек­сты с авто­ром – жен­щи­ной до 1950 года рожде­ния. Искать по мас­си­ву тек­стов мож­но опре­де­лен­ную сло­во­фор­му или соче­та­ние слов, а так­же два или более слов, нахо­дя­щих­ся в тек­сте на ука­зан­ном рас­сто­я­нии друг от дру­га, а так­же мож­но задать не сло­во, а грам­ма­ти­че­скую фор­му (напри­мер, что­бы изу­чить модель управ­ле­ния гла­го­ла). И мно­го еще чего мож­но делать. И разу­ме­ет­ся, со всяче­ской ста­ти­сти­кой.

Напри­мер, недав­но я пыта­лась выяс­нить, как за послед­ние 100 лет изме­ни­лось произ­ношение сло­ва артель, и вос­поль­зо­ва­лась, в част­но­сти, МУРКО – муль­ти­ме­дий­ным кор­пусом, вхо­дя­щим в НКРЯ. Как же было здо­ро­во, нажав кноп­ку, момен­таль­но полу­чить 17 отры­воч­ков из филь­мов, где это сло­во про­из­но­сят! Заме­ча­тель­но, что Кор­пус все рас­тет и рас­тет, а его поис­ко­вые инстру­мен­ты все изощ­ря­ют­ся и изощ­ря­ют­ся. Соб­ствен­но, все мож­но посмот­реть на сай­те НКРЯ – www.ruscorpora.ru.

С появ­ле­ни­ем НКРЯ жизнь линг­ви­стов-руси­стов очень укра­си­лась. То, на что у нас рань­ше ухо­ди­ли годы (выис­ки­ва­ние при­ме­ров по тек­стам, сор­ти­ров­ка пыль­ных кар­то­чек с вы­писанными кон­тек­ста­ми), теперь дости­га­ет­ся за несколь­ко секунд и в гораз­до боль­шем объ­еме. А для лек­си­ко­гра­фов наста­ла про­сто рай­ская жизнь! Прав­да, заме­чу, что это при­ве­ло и к появ­ле­нию боль­шо­го коли­че­ства линг­ви­сти­че­ских работ, выпол­нен­ных по прин­ци­пу «на­ливай и пей»: про­го­ня­ешь какое-нибудь сло­во через Кор­пус – и гото­во дело. А там есть еще такая чуд­ная кно­поч­ка – «Пока­зать рас­пре­де­ле­ние по годам». Нажи­ма­ешь – и выскакива­ет кра­си­вый гра­фик. И пожа­луй­ста – науч­ная ста­тья: вот, мол, такое-то сло­во, в такие-то годы столь­ко-то, вот столь­ко-то про­цен­тов во мно­же­ствен­ном чис­ле, а в таком-то жан­ре столь­ко-то. Хочет­ся спро­сить: «И?». В моло­дом поко­ле­нии линг­ви­стов мно­гие убеж­де­ны, что это-то и есть насто­я­щая нау­ка, а, ска­жем, про­во­ди­мый вруч­ную тон­кий семан­ти­че­ский ана­лиз – это так, пере­жит­ки про­шло­го. Ну да ниче­го, будем наде­ять­ся, что это дет­ская болезнь и она прой­дет.

Поми­мо соб­ствен­но науч­ной рабо­ты, Кор­пус еще изу­ми­те­лен тем, что теперь мож­но полу­чать какие-то пред­ва­ри­тель­ные отве­ты на воз­ни­ка­ю­щие в ходе жиз­ни лингвисти­ческие вопро­сы. Дело в том, что наш инди­ви­ду­аль­ный язы­ко­вой опыт очень огра­ни­чен и обыч­но сла­бо отре­флек­ти­ро­ван. И Кор­пус поз­во­ля­ет нам вый­ти за его пре­де­лы. При­веду несколь­ко при­ме­ров из послед­не­го вре­ме­ни.

Подру­га-редак­тор спро­си­ла меня, насколь­ко вооб­ще допу­сти­мо тав­то­ло­ги­че­ское со­четание денеж­ные купю­ры. Этот очень лег­кий вопрос для Кор­пу­са (денеж­ный + купю­ра на рас­сто­я­нии 1). Ока­зы­ва­ет­ся, такое встре­ча­ет­ся неча­сто (48 вхож­де­ний при том, что само сло­во купю­ра зафик­си­ро­ва­но 1430 раз), но в том чис­ле и у хоро­ших авто­ров: С.Довлатова, И.Грековой, В.Дудинцева, А.Азольского, Д.Рубиной и др. Ну а даль­ше – даль­ше каж­дый сам реша­ет, доста­точ­ные ли это для него авто­ри­те­ты.

Или вот в послед­нее вре­мя мно­гие заме­ти­ли, что поми­мо нор­ма­тив­но­го вари­ан­та в Дон­бассе и из Дон­бас­са в лите­ра­тур­ной речи начал рас­про­стра­нять­ся вари­ант на Дон­бас­се и с Дон­бас­са (понят­ное дело, реги­о­наль­ное вли­я­ние). Тут надо заме­тить, что как раз в дан­ном слу­чае про­ве­сти серьез­ное социо­линг­ви­сти­че­ское иссле­до­ва­ние с при­вяз­кой к террито­риям НКРЯ (пока) воз­мож­но­сти не дает. В про­шлой колон­ке про пореб­рик я упо­ми­на­ла не­которые дру­гие инстру­мен­ты, кото­рые мож­но тут исполь­зо­вать. Но Кор­пус поз­во­ля­ет бы­стро при­ки­нуть, дей­стви­тель­но ли рань­ше в лите­ра­тур­ной речи тако­го не встре­ча­лось. Как выра­жал­ся В.С. Чер­но­мыр­дин, Сро­ду тако­го не было, и вот опять то же самое. Вооб­ще-то этот вари­ант и рань­ше встре­чал­ся – и у при­лич­ных авто­ров: Мои роди­те­ли, кото­рые всю жизнь зачем-то коле­си­ли по всем доступ­ным им про­стран­ствам, при­вез­ли меня из Таджи­кистана в город Пер­во­майск на Дон­бас­се [Вла­ди­мир Вой­но­вич. Замы­сел (1999)]; Баб­ка моя даже зави­до­ва­ла, что сест­ра успе­ла похо­дить в мехах и брил­ли­ан­тах, пока она с мужем ра­ботала то в Каре­лии, то на Дон­бас­се [Вален­тин Кур­ба­тов. Доро­га в объ­езд (1999)]; Так на Дон­бас­се и остал­ся на эту зиму: что-то там с желез­ны­ми доро­га­ми [Ири­на Рату­шин­ская. Одес­си­ты (1998)]. Но, конеч­но, доволь­но ред­ко, в Дон­бас­се во мно­го раз чаще.

Инте­рес­но, что ана­ло­гич­ное с Дон­бас­са попа­да­ет­ся поча­ще, при­чем есть и доволь­но ста­рые при­ме­ры: Я вот мастер кок­со­вых печей, с Дон­бас­са, а при­е­хал сюда — печей-то еще не постро­и­ли, посла­ли меня на рабо­ту в проф­ор­га­ни­за­цию [А.Г. Малыш­кин. Люди из захо­лу­стья (1938)]; Я еще мог бы понять, если наша армия посла­на для демон­стра­ции, что­бы любой це­ной оття­нуть силы белых с Дон­бас­са.. [А.Н. Тол­стой. Хож­де­ние по мукам/​ Кни­га тре­тья. Хму­рое утро (1941). Но вот у Лимо­но­ва, напри­мер, более стан­дарт­но: Малень­кий гени­аль­ный еврей, недо­учив­ший­ся в Гор­ном инсти­ту­те, бежал в Харь­ков из Дон­бас­са, где он вот уже несколь­ко лет рабо­тал масте­ром на шах­те [Эду­ард Лимо­нов. Моло­дой него­дяй (1985)]

Я очень люб­лю поль­зо­вать­ся поэ­ти­че­ским кор­пу­сом НКРЯ для уточ­не­ния вопро­сов, свя­зан­ных с уда­ре­ни­ем (сла­ва рус­ской сил­ла­бо-тони­ке!). Вот недав­но по понят­но­му по­воду в сети обсуж­да­ли сти­хо­тво­ре­ние Демья­на Бед­но­го 1923 года «Соци­ал-тра­ур­ным пре­да­те­лям»: В бес­силь­ном тра­у­ре немец­кая сто­ли­ца, /​ Повсю­ду тра­ур­ные лица. /​ Что ни про­цес­сия, то — вот она, гля­ди! - /​ Колон­на соци­ал-про­хво­стов впе­ре­ди, /​ Предате­ли! Тру­сы! Забей­те ватой уши /​ И тра­у­ром густым закрой­те зер­ка­ла: /​ Вы обна­жи­ли до­гола /​ Свой раз­вра­щен­ный ум и сля­кот­ные души!

Мно­гие обра­ти­ли вни­ма­ние на стран­ное уда­ре­ние тру­сы́ вме­сто тру́сы. Народ очень ве­селился, шутил, что, мол, с бельем все очень логич­но выхо­дит - тру­сы́ обна­жи­ли дого­ла свой раз­вра­щен­ный ум. В общем, поэта каж­дый может оби­деть, но Кор­пус гово­рит нам, что та­кой вари­ант был: Фели­цы сла­ва, сла­ва Бога, /​ Кото­рый бра­ни усми­рил, /​ <...> Кото­рый оком луче­зар­ным /​ Шутам, труса́м, небла­го­дар­ным /​ И пра­вед­ным свой свет дарит; [Г.Р. Держа­вин. Фели­ца (1782)]; Что забыв­ших про долг и про честь /​ Бег­ле­цов и пре­да­те­лей мно­го /​ У несчаст­ной их роди­ны есть; /​ Что трусо́в мало­душ­ных не счесть; /​ Но что боль­ше все­го рав­но­душ­ных, /​ Без­за­бот­но наси­лью послуш­ных [М. О. Цет­лин (Ама­ри). Аист (1906)].

Разу­ме­ет­ся, это не ответ на вопрос, поче­му у Демья­на Бед­но­го такое уда­ре­ние: тут надо было бы подроб­нее смот­реть диа­лек­ты, иссле­до­вать его язык, надо изу­чить исто­рию это­го сло­ва. Но мы можем сра­зу ска­зать, что не то что­бы тут поэт пере­ста­вил уда­рение, что­бы сло­во влез­ло в стих, не ста­нем драз­нить его, как у Горь­ко­го Настя Баро­на: «Не было это­го! Ниче­го не было!» Я ужас­но не люб­лю, когда в сети такие Насти авто­ритетно заяв­ля­ют: так, мол, нико­гда не гово­ри­ли, тако­го не быва­ет, да еще и объ­яс­ня­ют поче­му. У меня все­гда в таких слу­ча­ях рука сама так и тянет­ся к заклад­ке «НКРЯ». Хо­рошо, что она есть. В общем, Happy birthday!

Если вы нашли ошиб­ку, пожа­луй­ста, выде­ли­те фраг­мент тек­ста и нажми­те Ctrl+Enter.

Связанные статьи