Юрий Апресян: «Интегральное описание языка я считаю сверхзадачей синхронической лингвистики»

Ю. Апресян. Фото Е. Гурко

Ю. Апре­сян. Фото Е. Гур­ко

Юрий Дере­ни­ко­вич Апре­сян – ака­де­мик РАН, гл. науч. сотр. лабо­ра­то­рии ком­пью­тер­ной линг­ви­сти­ки Инсти­ту­та про­блем пере­да­чи инфор­ма­ции им. А. А. Хар­ке­ви­ча Рос­сий­ской ака­де­мии наук (ИППИ РАН). В отли­чие от преды­ду­щих выпус­ков «Мате­ма­ти­че­ских про­гу­лок», вопро­сы, по прось­бе про­фес­со­ра Апре­ся­на, были состав­ле­ны и зада­ны в пись­мен­ном виде. Вопро­сы под­го­то­ви­ли Миха­ил Гель­фанд и Ири­на Левон­ти­на.

Вместо введения

— Юрий Дере­ни­ко­вич, мы бы хоте­ли начать с самых общих вопро­сов о линг­ви­сти­ке как нау­ке. Ведь язык — неве­ро­ят­но слож­ный объ­ект, очень труд­ный для иссле­до­ва­ния. Язык живет сво­ей жиз­нью, похо­жей на жизнь при­ро­ды, а в то же вре­мя он реа­ли­зу­ет­ся через речь людей. И в свя­зи с этим пер­вый вопрос: линг­ви­сти­ка — это есте­ствен­ная или гума­ни­тар­ная нау­ка?

— Линг­ви­сти­ка слиш­ком неод­но­род­на, что­бы на этот вопрос мож­но было дать одно­знач­ный ответ. Если счи­тать эта­ло­ном есте­ствен­ной нау­ки такую нау­ку, утвер­жде­ния кото­рой могут быть про­ве­ре­ны в экс­пе­ри­мен­тах, то линг­ви­сти­ка ско­рее гума­ни­тар­ная нау­ка. «Ско­рее», пото­му что раз­ные линг­ви­сти­че­ские дис­ци­пли­ны зани­ма­ют раз­ное место на этой шка­ле. Фоно­ло­гия или мор­фо­ло­гия, име­ю­щие дело с конеч­ным чис­лом еди­ниц, бли­же к точ­ным нау­кам. В каче­стве при­ме­ра мож­но при­ве­сти «Грам­ма­ти­че­ский сло­варь рус­ско­го язы­ка» А. А. Зализ­ня­ка, поз­во­ля­ю­щий постро­ить по доста­точ­но про­стым пра­ви­лам все грам­ма­ти­че­ские фор­мы око­ло 110 000 рус­ских слов.

Бес­ко­неч­ность начи­на­ет­ся в син­так­си­се и при­об­ре­та­ет еще боль­шие мас­шта­бы в семан­ти­ке. Даже по пово­ду чис­ла и харак­те­ра зна­че­ний какой-нибудь грам­ма­ти­че­ской фор­мы суще­ству­ют раз­но­гла­сия. Так, в ака­де­ми­че­ской «Грам­ма­ти­ке рус­ско­го язы­ка» 1960 года фор­ме тво­ри­тель­но­го паде­жа при гла­го­ле при­пи­сы­ва­ет­ся семь раз­ных зна­че­ний: ору­дия (резать ножом), про­из­во­ди­те­ля дей­ствия (изоб­ре­тен­ный китай­ца­ми), содер­жа­ния (инте­ре­со­вать­ся живо­пи­сью), вре­ме­ни (уехать ран­ней вес­ной), пути (идти лесом), спо­со­ба (петь басом) и при­зна­ка лица или пред­ме­та (назна­чить кого-либо рек­то­ром) .

В ака­де­ми­че­ской «Грам­ма­ти­ке совре­мен­но­го рус­ско­го лите­ра­тур­но­го язы­ка» 1970 года не упо­ми­на­ет­ся ору­дий­ное зна­че­ние и зна­че­ние содер­жа­ния, но зато есть несколь­ко дру­гих, отсут­ству­ю­щих в Грам­ма­ти­ке-60: объ­ект­ное (рас­по­ря­жать­ся людь­ми), опре­де­ли­тель­ное (родить­ся счаст­лив­чи­ком), кван­ти­та­тив­ное (бол­тать часа­ми). В клас­си­че­ской кни­ге А. М. Пеш­ков­ско­го «Рус­ский син­так­сис в науч­ном осве­ще­нии» нет тво­ри­тель­но­го кван­ти­та­тив­но­го, но зато есть тво­ри­тель­ный уси­ли­тель­ный (кри­ком кри­чит) и тво­ри­тель­ный огра­ни­че­ния (окреп­нуть духом).

Раз­но­гла­сия воз­рас­та­ют, когда мы пере­хо­дим в область лек­си­че­ской семан­ти­ки. Что­бы убе­дить­ся в этом, доста­точ­но посмот­реть, как раз­ные тол­ко­вые сло­ва­ри одно­го и того же язы­ка опи­сы­ва­ют чис­ло, харак­тер и ран­жи­ро­ва­ние зна­че­ний мно­го­знач­ных слов.

До сих пор речь шла о син­хро­ни­че­ской линг­ви­сти­ке. Диа­хро­ни­че­ская линг­ви­сти­ка, име­ю­щая дело с исто­ри­ей язы­ка и, по необ­хо­ди­мо­сти, с конеч­ным, хотя в неко­то­рых слу­ча­ях и очень боль­шим чис­лом пись­мен­ных памят­ни­ков, бли­же к есте­ствен­ным нау­кам.

Тако­во, в част­но­сти, срав­ни­тель­но-исто­ри­че­ское язы­ко­зна­ние, — пожа­луй, един­ствен­ная линг­ви­сти­че­ская дис­ци­пли­на, кото­рая в ряде слу­ча­ев уста­нав­ли­ва­ет зако­ны раз­ви­тия сво­е­го объ­ек­та. При­ме­ром могут слу­жить фоне­ти­че­ские зако­ны, по кото­рым в ходе исто­рии в опре­де­лен­ное вре­мя и на опре­де­лен­ном линг­ви­сти­че­ском про­стран­стве изме­ня­ют­ся зву­ки язы­ка. Назо­ву один из них — пере­дви­же­ние соглас­ных в гер­ман­ских язы­ках, в резуль­та­те кото­ро­го индо­ев­ро­пей­ские глу­хие смыч­ные зву­ки [p], [t] и [k], хоро­шо сохра­нив­ши­е­ся, напри­мер, в латы­ни, пере­хо­ди­ли в спи­ран­ты [f], [θ] и [h] соот­вет­ствен­но; срав­ни­те латин­ское pēs (нога, сто­па)’ и англий­ское foot; латин­ское trēs (три) и англий­ское three; латин­ское cănis (соба­ка) и англий­ское hound.

Жан-Франсуа Шампольон. Портрет работы Леона Конье (1831), Лувр, Париж

Жан-Фран­с­уа Шам­по­льон. Порт­рет рабо­ты Лео­на Конье (1831), Лувр, Париж

В обла­сти диа­хро­ни­че­ской линг­ви­сти­ки есть даже пре­це­ден­ты того, что мож­но было бы назвать науч­ны­ми пред­ска­за­ни­я­ми. Одно из самых зна­ме­ни­тых — дешиф­ров­ка Жан-Фран­с­уа Шам­по­льо­ном в 1824 году еги­пет­ско­го иеро­гли­фи­че­ско­го пись­ма. Пра­виль­ность пред­ло­жен­ной им моде­ли была бес­по­во­рот­но под­твер­жде­на в 1866 году, когда его после­до­ва­тель Карл Рихард Леп­си­ус нашел в Егип­те камень с тек­стом на трех язы­ках (так назы­ва­е­мый Каноп­ский декрет) и, пере­ве­дя еги­пет­ский текст на гре­че­ский язык по мето­ду Шам­по­льо­на, полу­чил пере­вод, сов­пав­ший с гре­че­ским тек­стом декре­та.

Есть и дру­гие фак­ты тако­го рода, напри­мер сде­лан­ное «на кон­чи­ке пера» откры­тие ларин­галь­ных зву­ков Фер­ди­нан­дом де Сос­сю­ром (оно корот­ко опи­са­но в моей книж­ке «Идеи и мето­ды совре­мен­ной струк­тур­ной линг­ви­сти­ки», и я не ста­ну его здесь изла­гать).

— Име­ют ли линг­ви­сти­че­ские постро­е­ния соот­вет­ствия (кор­ре­ля­ты) в дей­стви­тель­но­сти?

— Если име­ют­ся в виду диа­хро­ни­че­ские постро­е­ния, то на этот вопрос я отве­тил выше. Если син­хро­ни­че­ские, то я буду отве­чать на него в пред­по­ло­же­нии, что под «дей­стви­тель­но­стью» в дан­ном слу­чае пони­ма­ет­ся язык.

Здесь надо сде­лать еще одно допу­ще­ние и счи­тать, что вся­кий кон­крет­ный язык, т.е. спо­соб­ность про­из­во­дить тек­сты, выра­жа­ю­щие нуж­ный смысл, и пони­мать такие тек­сты, может быть задан в фор­ме отно­си­тель­но пол­ной грам­ма­ти­ки и отно­си­тель­но пол­но­го сло­ва­ря это­го язы­ка. Тогда кос­вен­ным сви­де­тель­ством того, что «линг­ви­сти­че­ские постро­е­ния име­ют кор­ре­ля­ты в дей­стви­тель­но­сти», явля­ет­ся, напри­мер, воз­мож­ность выучить новый для себя язык по этим двум доку­мен­там и сво­бод­но заго­во­рить на нем.

Я назы­ваю это сви­де­тель­ство «кос­вен­ным», пото­му что глу­бо­ко убеж­ден в том, что мы нико­гда не узна­ем с доста­точ­ной сте­пе­нью деталь­но­сти, как рабо­та­ет мозг/​сознание чело­ве­ка вооб­ще и при усво­е­нии язы­ка в част­но­сти. Эта тема в дру­гой свя­зи обсуж­да­ет­ся и несколь­ко ниже.

«Я глу­бо­ко убеж­ден в том, что мы нико­гда не узна­ем с доста­точ­ной сте­пе­нью деталь­но­сти, как рабо­та­ет мозг/​сознание чело­ве­ка вооб­ще и при усво­е­нии язы­ка в част­но­сти»

— Уточ­ня­ю­щий вопрос. Что зна­чит, что одна линг­ви­сти­че­ская тео­рия луч­ше дру­гой? Доста­точ­но ли, что­бы луч­шее опи­са­ние было более про­стым, удоб­ным, лако­нич­ным и пра­виль­но пред­ска­зы­ва­ло пове­де­ние объ­ек­та? Или всё же если самое про­стое опи­са­ние про­ти­во­ре­чит инту­и­ции и линг­ви­сту кажет­ся, что оно «не похо­же» на опи­сы­ва­е­мое язы­ко­вое явле­ние, то линг­ви­ста такое опи­са­ние не удо­вле­тво­рит?

— По-мое­му, в совре­мен­ном линг­ви­сти­че­ском дис­кур­се утвер­жде­ние, что одна линг­ви­сти­че­ская кон­цеп­ция луч­ше дру­гой, ниче­го не зна­чит, хотя в спе­ку­ля­ци­ях на этот счет недо­стат­ка нет. Сде­ла­ем заве­до­мо фан­та­сти­че­ское допу­ще­ние, что уже согла­со­ва­ны кри­те­рии, по кото­рым мож­но оце­ни­вать каче­ство линг­ви­сти­че­ских тео­рий. Пусть, напри­мер, кри­те­ри­ем будет отно­ше­ние объ­е­мов линг­ви­сти­че­ских опи­са­ний (в печат­ных листах), состав­лен­ных на осно­ве тео­рий Тi и Тj, к одно­му и тому же объ­е­му опи­сы­ва­е­мых язы­ко­вых фак­тов в виде како­го-то мно­же­ства пись­мен­ных тек­стов (тоже в печат­ных листах). Тео­рия Тi луч­ше тео­рии Тj, если эта дробь для нее мень­ше.

Насколь­ко мне извест­но, ни такая, ни какая-либо дру­гая рабо­та ни для одно­го язы­ка не про­во­ди­лась. Реаль­но, как мне кажет­ся, какая-то линг­ви­сти­че­ская тео­рия пред­по­чи­та­ет­ся не на осно­ве стро­гих кри­те­ри­ев оцен­ки и после­ду­ю­щей отбра­ков­ки аль­тер­на­тив­ных тео­рий, а по дру­гим, чисто чело­ве­че­ским осно­ва­ни­ям: она бли­же линг­ви­сту тер­ри­то­ри­аль­но, он луч­ше ее зна­ет, пото­му что зна­ком с ее авто­ром и может обсуж­дать с ним неяс­ные места, и т. п.

— Быва­ют ли в линг­ви­сти­ке про­ве­ря­е­мые утвер­жде­ния? Ведь неверифицируемые/​нефальсифицируемые быва­ют? Не меша­ет ли послед­нее линг­ви­сти­ке быть нау­кой?

— Конеч­но, быва­ют. Тако­вы, напри­мер, фоне­ти­че­ские зако­ны, о кото­рых гово­ри­лось выше. Прав­да, там речь шла о диа­хро­нии и о фоне­ти­че­ских явле­ни­ях. Одна­ко боль­шин­ство «син­хро­ни­че­ских» грам­ма­ти­че­ских пра­вил тоже про­ве­ря­е­мо, хотя и с ого­вор­ка­ми.

Как извест­но каж­до­му школь­ни­ку, в рус­ском язы­ке раз­ли­ча­ют­ся каче­ствен­ные и отно­си­тель­ные при­ла­га­тель­ные. Напри­мер, бед­ный — каче­ствен­ное при­ла­га­тель­ное, а камен­ный — отно­си­тель­ное. Каче­ствен­ным при­ла­га­тель­ным в грам­ма­ти­ках рус­ско­го язы­ка при­пи­сы­ва­ет­ся до шести свойств, из кото­рых я упо­мя­ну четы­ре: а) у них есть пол­ные и крат­кие фор­мы (бед­ный — беден, бед­на); б) они изме­ня­ют­ся по сте­пе­ням срав­не­ния (бед­ный, бед­нее, бед­ней­ший); в) от них обра­зу­ют­ся наре­чия (жил бед­но); г) от них обра­зу­ют­ся суще­стви­тель­ные со зна­че­ни­ем свой­ства или состо­я­ния (бед­ность). У отно­си­тель­ных при­ла­га­тель­ных нет ни одно­го из пере­чис­лен­ных свойств.

Поль­зу­ясь эти­ми при­зна­ка­ми, мы можем с боль­шой долей уве­рен­но­сти уста­нав­ли­вать, явля­ет­ся ли дан­ное при­ла­га­тель­ное отно­си­тель­ным или каче­ствен­ным.

Но вот у Вале­рия Брю­со­ва в сти­хо­тво­ре­нии «Лест­ни­ца» есть такие стро­ки: «Всё камен­ней сту­пе­ни, /​ Всё кру­че, кру­че всход». Отно­си­тель­ное при­ла­га­тель­ное он исполь­зу­ет как каче­ствен­ное, мета­фо­ри­че­ски, и это поз­во­ля­ет ему достичь боль­шей выра­зи­тель­но­сти.

Неболь­шое отступ­ле­ние. Вся­кая мета­фо­ра — напри­мер, пря­жа тума­на, лыси­ны булыж­ни­ка, вол­на судь­бы — явля­ет­ся семан­ти­че­ской ошиб­кой, или, дру­ги­ми сло­ва­ми, нару­ше­ни­ем пра­вил семан­ти­че­ско­го согла­со­ва­ния. Тем не менее речь луч­ших носи­те­лей язы­ка пест­рит таки­ми ошиб­ка­ми, пото­му что они поз­во­ля­ют выра­жать мысль крат­ко и ярко.

Никто не ска­зал об этом луч­ше Бори­са Пастер­на­ка: «Мета­фо­ризм — есте­ствен­ное след­ствие недол­го­веч­но­сти чело­ве­ка и надол­го заду­ман­ной огром­но­сти его задач. При этом несо­от­вет­ствии он вынуж­ден смот­реть на вещи по-орли­но­му зор­ко и объ­яс­нять­ся мгно­вен­ны­ми и сра­зу понят­ны­ми оза­ре­ни­я­ми. Это и есть поэ­зия. Мета­фо­ризм — сте­но­гра­фия боль­шой лич­но­сти, ско­ро­пись ее духа». Обра­ти­те вни­ма­ние на эффект­ные и глу­бо­кие мета­фо­ры само­го Пастер­на­ка.

Воз­вра­ща­ясь к каче­ствен­ным и отно­си­тель­ным при­ла­га­тель­ным: в нача­ле 1960-х годов в Инсти­ту­те рус­ско­го язы­ка Ака­де­мии наук СССР было про­ве­де­но иссле­до­ва­ние свойств каче­ствен­но­сти — отно­си­тель­но­сти на боль­шом мас­си­ве при­ла­га­тель­ных и было обна­ру­же­но, что жест­кой гра­ни­цы меж­ду ними нет. Есть плав­ная шка­ла пере­хо­да от про­то­ти­пи­че­ских каче­ствен­ных при­ла­га­тель­ных (они обла­да­ют все­ми шестью свой­ства­ми каче­ствен­но­сти) к про­то­ти­пи­че­ским отно­си­тель­ным при­ла­га­тель­ным (у них нет ни одно­го тако­го свой­ства) через мно­го про­ме­жу­точ­ных сту­пе­ней. Есть пятерки/​четверки/​тройки и т.п. свойств каче­ствен­но­сти, при­том не обя­за­тель­но одних и тех же у раз­ных при­ла­га­тель­ных.

На самом деле кар­ти­на еще слож­нее. Вполне каче­ствен­ное при­ла­га­тель­ное может не обла­дать ни одним из его про­то­ти­пи­че­ских свойств, если оно раз­ви­ва­ет­ся в струк­ту­ре мно­го­знач­но­сти исход­но отно­си­тель­но­го при­ла­га­тель­но­го. Возь­мем при­ла­га­тель­ные желез­ный и сталь­ной. В сво­их глав­ных зна­че­ни­ях (желез­ная струж­ка, сталь­ная дверь) это, конеч­но, отно­си­тель­ные при­ла­га­тель­ные. Но в зна­че­ни­ях «креп­кий» (желез­ные муску­лы, сталь­ные мыш­цы) и «твер­дый» (желез­ная дис­ци­пли­на, сталь­ная воля) они семан­ти­че­ски ста­но­вят­ся каче­ствен­ны­ми при­ла­га­тель­ны­ми. Одна­ко ника­ких фор­маль­ных свойств каче­ствен­ных при­ла­га­тель­ных (см. выше) они не при­об­ре­та­ют. В част­но­сти, у них нет крат­ких форм (едва ли услы­шишь Его мыш­цы железны/​стальны) , сте­пе­ней срав­не­ния (не гово­рят

А у них дис­ци­пли­на еще желез­нее или Его воля еще сталь­нее) и т. п., при том что их сино­ни­мы креп­кий и твер­дый обла­да­ют все­ми свой­ства­ми каче­ствен­ных при­ла­га­тель­ных.

Хотя, как пока­зы­ва­ют рас­смот­рен­ные фак­ты, меж­ду поляр­ны­ми явле­ни­я­ми в язы­ке есть боль­шая область про­ме­жу­точ­ных явле­ний, дела­ю­щая пере­ход от одно­го полю­са к дру­го­му почти непре­рыв­ным, это никак не отме­ня­ет поль­зы выде­ле­ния полю­сов. Имен­но в этих про­то­ти­пи­че­ских точ­ках про­ве­ря­е­мость син­хро­ни­че­ских линг­ви­сти­че­ских утвер­жде­ний дости­га­ет мак­си­му­ма.

О современном состоянии лингвистики, машинном переводе и системе «Этап»

— Что сей­час наи­бо­лее инте­рес­но­го дела­ет­ся в тео­ре­ти­че­ской линг­ви­сти­ке?

— Всё зави­сит от того, как пони­мать тео­ре­ти­че­скую линг­ви­сти­ку. Если, напри­мер, фун­да­мен­таль­ные иссле­до­ва­ния рус­ско­го вида или лек­си­че­ской мно­го­знач­но­сти чис­лить по ведом­ству тео­ре­ти­че­ской линг­ви­сти­ки, то назвать хотя бы одну деся­тую инте­рес­ных работ, посвя­щен­ных толь­ко этим двум темам (на самом деле таких тем гораз­до боль­ше), в корот­ком отве­те невоз­мож­но. Если же к тео­ре­ти­че­ской линг­ви­сти­ке отно­сить фор­маль­ные систе­мы типа грам­ма­ти­ки Мон­те­гю, то тут я дол­жен при­знать­ся, что за этой обла­стью не сле­жу, а то немно­гое, что я слу­чай­ным обра­зом знаю, кажет­ся мне непри­ме­ни­мым в реаль­ной рабо­те с мате­ри­а­ла­ми есте­ствен­ных язы­ков.

В свя­зи с обсуж­да­е­мым вопро­сом сле­ду­ет упо­мя­нуть еще одно обсто­я­тель­ство, кото­рое при­ве­ло к усо­вер­шен­ство­ва­нию мето­до­ло­гии поис­ка науч­ной исти­ны и тем самым уско­ри­ло тем­пы раз­ви­тия тео­ре­ти­че­ской линг­ви­сти­ки. В послед­ние деся­ти­ле­тия про­шло­го века ста­ла менять­ся эмпи­ри­че­ская база линг­ви­сти­ки. Появи­лись боль­шие элек­трон­ные кор­пу­сы тек­стов, снаб­жен­ные про­грам­ма­ми поис­ка нуж­ной линг­ви­сту инфор­ма­ции, в част­но­сти Наци­о­наль­ный кор­пус рус­ско­го язы­ка. Они на поря­док сокра­ти­ли вре­мя сбо­ра эмпи­ри­че­ско­го мате­ри­а­ла, с одной сто­ро­ны, и ста­ли удоб­ным поли­го­ном для про­вер­ки фак­ти­че­ской обос­но­ван­но­сти тео­ре­ти­че­ских гипо­тез, с дру­гой.

— Еще вопрос — о свя­зи тео­ре­ти­че­ской линг­ви­сти­ки и авто­ма­ти­че­ско­го пере­во­да, вооб­ще задач авто­ма­ти­че­ской обра­бот­ки тек­ста. На началь­ном эта­пе каза­лось, что машин­ный пере­вод вырас­тет непо­сред­ствен­но из семан­ти­че­ско­го пред­став­ле­ния. Но сей­час мы видим, что авто­ма­ти­че­ская обра­бот­ка тек­ста стро­ит­ся преж­де все­го на ста­ти­сти­че­ской обра­бот­ке боль­ших мас­си­вов тек­стов. Так что же, прак­ти­че­ские при­ло­же­ния тео­ре­ти­че­ской семан­ти­ки ока­за­лись более огра­ни­чен­ны­ми, чем виде­лось вна­ча­ле? Или у них есть пер­спек­ти­ва?

— Цити­рую пре­ам­бу­лу Ваше­го вопро­са: «На началь­ном эта­пе каза­лось, что машин­ный пере­вод вырас­тет непо­сред­ствен­но из семан­ти­че­ско­го пред­став­ле­ния».

Чест­но гово­ря, я не знаю, кому так каза­лось. Семан­ти­че­ское пред­став­ле­ние не может быть исход­ным пунк­том машин­но­го пере­во­да по двум при­чи­нам. Во-пер­вых, неяс­но, отку­да оно возь­мет­ся. Во-вто­рых, до сих пор не суще­ству­ет фор­маль­но­го семан­ти­че­ско­го язы­ка, на кото­ром мож­но пол­но­стью отра­зить смысл про­из­воль­но­го пред­ло­же­ния на есте­ствен­ном язы­ке.

Тем не менее и в отсут­ствие семан­ти­че­ско­го пред­став­ле­ния зада­ча машин­но­го пере­во­да сво­дит­ся к тому, что­бы каж­до­му пред­ло­же­нию язы­ка-источ­ни­ка поста­вить в соот­вет­ствие такое грам­ма­ти­че­ски пра­виль­ное пред­ло­же­ние дру­го­го язы­ка, в кото­ром с доста­точ­ной пол­но­той сохра­ня­ет­ся смысл исход­но­го пред­ло­же­ния. Когда мы начи­на­ли свою рабо­ту в этой обла­сти, мы исхо­ди­ли из того, что ука­зан­ную зада­чу мож­но решить толь­ко на осно­ве серьез­ной линг­ви­сти­че­ской тео­рии.

В каче­стве такой тео­рии мы выбра­ли модель «Смысл 1 Текст» И. А. Мель­чу­ка. Наш глав­ный резуль­тат в обла­сти машин­но­го пере­во­да — систе­ма «ЭТАП» и, более кон­крет­но, под­си­сте­мы пере­во­да науч­но-тех­ни­че­ских тек­стов с англий­ско­го язы­ка на рус­ский и с рус­ско­го на англий­ский.

Их основ­ные линг­ви­сти­че­ские ком­по­нен­ты — пол­ные фор­маль­ные грам­ма­ти­ки (мор­фо­ло­гия и син­так­сис) англий­ско­го и рус­ско­го язы­ков, фор­маль­ные сло­ва­ри обо­их язы­ков объ­е­мом более 100 тыс. слов каж­дый и моду­ли пере­хо­да от пред­ло­же­ния вход­но­го язы­ка к пред­ло­же­нию выход­но­го язы­ка.

«В про­цес­се раз­ра­бот­ки систе­мы «ЭТАП» мы выра­бо­та­ли новый тип линг­ви­сти­че­ско­го опи­са­ния — так назы­ва­е­мое инте­граль­ное опи­са­ние язы­ка»

В обе­их под­си­сте­мах пере­ход от исход­но­го тек­ста к его пере­во­ду про­ис­хо­дит не на уровне семан­ти­че­ско­го пред­став­ле­ния, а на уровне син­так­си­че­ской струк­ту­ры (дере­ва зави­си­мо­стей) пере­во­ди­мо­го пред­ло­же­ния. Полу­чен­ное в резуль­та­те син­так­си­че­ско­го ана­ли­за дере­во зави­си­мо­стей вход­но­го пред­ло­же­ния через ряд про­ме­жу­точ­ных шагов (сня­тие осо­бен­но­стей вход­но­го язы­ка, соб­ствен­но пере­вод, порож­де­ние осо­бен­но­стей выход­но­го язы­ка) пре­об­ра­зу­ет­ся в дере­во зави­си­мо­стей выход­но­го пред­ло­же­ния; послед­нее с помо­щью ряда опе­ра­ций, «обрат­ных» опе­ра­ци­ям син­так­си­че­ско­го ана­ли­за, пре­вра­ща­ет­ся в реаль­ное пред­ло­же­ние выход­но­го язы­ка.

При­мер машин­но­го пере­во­да с англий­ско­го язы­ка на рус­ский: In the early sixties, chromatography became an analytical tool (now the most highly used instrumental technique in the chemical laboratory) В нача­ле шести­де­ся­тых годов хро­ма­то­гра­фия ста­ла ана­ли­ти­че­ским инстру­мен­том (в насто­я­щее вре­мя наи­бо­лее широ­ко исполь­зо­ван­ный инстру­мен­таль­ный метод в хими­че­ской лабо­ра­то­рии).

При­мер машин­но­го пере­во­да с рус­ско­го язы­ка на англий­ский: Несколь­ко лет назад ста­ли ком­мер­че­ски доступ­ны пер­вые мик­ро­про­цес­сор­ные схе­мы, что при­ве­ло к созда­нию мно­го­чис­лен­ных вари­ан­тов маши­ны отве­таSeveral years ago became commercially accessible the frst microprocessor chips, which has led to creation of numerous versions of a machine of answer.

Я наме­рен­но при­вел при­ме­ры пере­во­да, содер­жа­щие явные ошиб­ки, зачем — ста­нет ясно чуть ниже.

Когда появи­лись ста­ти­сти­че­ские систе­мы машин­но­го пере­во­да (упо­ми­на­е­мые и в вашем вопро­се), ока­за­лось, что они функ­ци­о­ни­ру­ют ничуть не хуже, чем наша «умная» систе­ма, а ино­гда дают и более пра­виль­ные со всех точек зре­ния пере­во­ды.

В любом слу­чае вне кон­ку­рен­ции оста­ет­ся пере­вод тек­стов про­фес­си­о­наль­ны­ми пере­вод­чи­ка­ми.

Здесь я хотел бы вер­нуть­ся к сде­лан­но­му выше утвер­жде­нию: мы нико­гда не узна­ем с доста­точ­ной сте­пе­нью деталь­но­сти, как рабо­та­ет мозг/​сознание чело­ве­ка. Если бы это зна­ние было нам доступ­но, мы бы смог­ли скон­стру­и­ро­вать машин­но­го пере­вод­чи­ка, спо­соб­но­го кон­ку­ри­ро­вать с чело­ве­ком.

Ска­зан­ное ни в коем слу­чае не зна­чит, что наши уси­лия были напрас­ны.

Во-пер­вых, полу­чен­ные резуль­та­ты цен­ны сами по себе, в част­но­сти, пото­му, что могут ука­зы­вать на ошиб­ки в самой моде­ли язы­ка, поло­жен­ной в осно­ву систе­мы машин­но­го пере­во­да.

Во-вто­рых, что гораз­до важ­нее, в про­цес­се раз­ра­бот­ки систе­мы «ЭТАП» мы выра­бо­та­ли новый тип линг­ви­сти­че­ско­го опи­са­ния, кото­рый, как мне кажет­ся, пред­став­ля­ет обще­тео­ре­ти­че­ский инте­рес, — так назы­ва­е­мое инте­граль­ное опи­са­ние язы­ка.

— Что это такое?

— Пол­ное линг­ви­сти­че­ское опи­са­ние вся­ко­го кон­крет­но­го язы­ка состо­ит из двух основ­ных ком­по­нен­тов — грам­ма­ти­ки и сло­ва­ря. В иде­а­ле эти два ком­по­нен­та долж­ны быть пол­но­стью согла­со­ва­ны друг с дру­гом по типам поме­ща­е­мой в них инфор­ма­ции и по фор­маль­ным язы­кам ее запи­си — в про­тив­ном слу­чае они не смо­гут вза­и­мо­дей­ство­вать друг с дру­гом. Тра­ди­ци­он­ные линг­ви­сти­че­ские опи­са­ния это­му есте­ствен­но­му тре­бо­ва­нию не удо­вле­тво­ря­ют.

Напри­мер, в грам­ма­ти­ках (в том чис­ле в уже упо­ми­нав­шей­ся ака­де­ми­че­ской «Грам­ма­ти­ке рус­ско­го язы­ка» 1960 года) при опи­са­нии срав­ни­тель­ной сте­пе­ни при­ла­га­тель­ных не отме­ча­ет­ся, что она име­ет раз­ные зна­че­ния от раз­ных семан­ти­че­ских клас­сов при­ла­га­тель­ных.

В част­но­сти, срав­ни­тель­ная сте­пень от при­ла­га­тель­ных раз­ме­ра «про­бе­га­ет» всю шка­лу раз­ме­ра: пред­мет Х может быть боль­ше или мень­ше пред­ме­та Y и в том слу­чае, когда Y очень боль­шой, и в том слу­чае, когда он очень малень­кий. Меж­ду тем срав­ни­тель­ная сте­пень от при­ла­га­тель­ных цве­та про­бе­га­ет не всю цве­то­вую гам­му, т. е. поз­во­ля­ет срав­ни­вать не любые цве­та, а толь­ко оттен­ки одно­го и того же цве­та: пред­мет X может быть крас­нее пред­ме­та Y толь­ко в том слу­чае, если оба пред­ме­та крас­ные.

Более того, даже в пре­де­лах одно­го и того же семан­ти­че­ско­го клас­са при­ла­га­тель­ных срав­ни­тель­ная сте­пень может иметь раз­ные зна­че­ния. Так обсто­ит дело с анто­ни­мич­ны­ми оце­ноч­ны­ми при­ла­га­тель­ны­ми типа умный — глу­пый. Чело­век X может быть умнее чело­ве­ка Y и в том слу­чае, когда Y тоже умен, и в том слу­чае, когда он глуп. Если же мы гово­рим, что X глу­пее Y-а, то обыч­но име­ет­ся в виду, что Y тоже глуп.

В свою оче­редь, в сло­ва­ре дают­ся черес­чур общие грам­ма­ти­че­ские поме­ты, не учи­ты­ва­ю­щие грам­ма­ти­че­ских осо­бен­но­стей сло­ва в раз­ных слу­ча­ях его упо­треб­ле­ния даже в рам­ках одно­го и того же зна­че­ния. Тому же при­ла­га­тель­но­му крас­ный в его глав­ном зна­че­нии «цве­та кро­ви» сло­ва­ри при­пи­сы­ва­ют крат­кие фор­мы кра­сен, крас­на и крас­но, но не сооб­ща­ют точ­но, в каких слу­ча­ях они воз­мож­ны, а в каких — нет.

Напри­мер, во фраг­мен­те сло­вар­ной ста­тьи Боль­шо­го ака­де­ми­че­ско­го сло­ва­ря рус­ско­го язы­ка (8-й том), посвя­щен­ной глав­но­му зна­че­нию это­го при­ла­га­тель­но­го, фигу­ри­ру­ют в каче­стве при­ме­ров сло­во­со­че­та­ния крас­ная икра, крас­ная медь, крас­ное золо­то, крас­ное вино, крас­ный гриб и т.п. Ни в одном из этих сло­во­со­че­та­ний срав­ни­тель­ная сте­пень невоз­мож­на, пото­му что в них крас­ный явля­ет­ся, в сущ­но­сти, отно­си­тель­ным при­ла­га­тель­ным. Одна­ко в сло­ва­ре это никак не ого­ва­ри­ва­ет­ся.

Инте­граль­ное опи­са­ние язы­ка я счи­таю сверх­за­да­чей син­хро­ни­че­ской линг­ви­сти­ки. Мы в сво­ей линг­ви­сти­че­ской рабо­те, и в част­но­сти в рам­ках систе­мы «ЭТАП», стре­мим­ся в мак­си­маль­ной сте­пе­ни сле­до­вать прин­ци­пам инте­граль­но­го опи­са­ния, хотя, есте­ствен­но, тоже не застра­хо­ва­ны от оши­бок.

(Окон­ча­ние сле­ду­ет)

Юрий Апре­сян
Вопро­сы под­го­то­ви­ли Миха­ил Гель­фанд и Ири­на Левон­ти­на

Если вы нашли ошиб­ку, пожа­луй­ста, выде­ли­те фраг­мент тек­ста и нажми­те Ctrl+Enter.

Связанные статьи

Оценить: 
Звёзд: 1Звёзд: 2Звёзд: 3Звёзд: 4Звёзд: 5 (1 оценок, среднее: 1,00 из 5)
Загрузка...
 
 

Метки: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *