Към текста

Метаданни

Данни

Включено в книгата
Оригинално заглавие
Разговор с електрическим мозгом, (Пълни авторски права)
Превод от
, (Пълни авторски права)
Форма
Научнопопулярен текст
Жанр
  • Няма
Характеристика
  • Няма
Оценка
няма

Информация

Сканиране, разпознаване и корекция
ckitnik (2012)

Издание:

Василий Захарченко

Разговор с електрическим мозгом

„Детская литература“

Москва 1975

 

Преведе от руски: Русалона Попова

Стиховете преведе: Валентина Радинска

Редактор: Стоянка Полонова

Художник: Фико Фиков

Художествен редактор: Димитър Чадшов

Технически редактор: Георги Кожухаров

Коректор: Елена Иванова

 

Руска Л. Г. V. Год. 1978.

Дадена за набор на 18.I.1978 година.

Подписана за печат на 25.V.1978 година

Излязла от печат на 10.VI.1978 година

Поръчка № 91. Формат 1/32 70×100

Печатни коли 25,50. Издателски коли 16,52

Цена на книжното тяло 0,75 лева. Цена 0,86 лева

„Народна младеж“ — издателство на ЦК на ДКМС

ДП „Митьо Станев“ — Стара Загора

История

  1. — Добавяне

Езикът на хората и езикът на машините

Езикът е онова, което е най-присъщо на човека… Как може тогава да се говори за език на машините?

В най-добрия случай електронният помощник на човека е оръдие на паметта и контактите. Той действува, така да се каже, във времето (паметта) и в пространството (контактите). Пример за това са телефонът и радиото, книгопечатането и фотографията, кинематографът и телевизията, телеграфът и звукозаписът, които отлично се справят със задачите: да запазват и разпространяват информацията.

Но съвременните електронноизчислителни машини са много по-сложни. Те не само запазват и разпространяват информацията, но я и преработват.

И това донася на машините съвсем нови качества. Неслучайно известният английски учен Джон Бернал казва: „Сега изчислителните машини и техните кодове могат материално да въплътят човешката мисъл в съвсем нови форми и донякъде да заменят езика. Дори в своето развитие да отидат и по-далеч от езика.“

Такива думи днес могат да се чуят от устата на авторитетни специалисти.

От гледна точка на точните науки нашият човешки език не е нищо друго освен код за предаване на информация. Той се е родил в периода на очовечаване на полумаймуната-получовек, а днес езикът е най-активната и най-действена сила за общуване между хората.

Колко езици има на Земята? Та нали всеки континент, всяка националност, а понякога и всяко племе говорят на свой собствен език. Затова първият въпрос, който трябва да се постави, е: колко народи живеят на земното кълбо?

Последните, далеч още непълни изследвания, говорят, че в света съществуват около две хиляди народа.

Така например в Европа се наброяват около 50 народа (без народите от европейската част на Съветския съюз), от които 75 милиона германци, 50 милиона италианци, 43 милиона англичани…

В Азия живеят около 800 народа (без народите на Съветския съюз), в Северна и Южна Америка — повече от 300 народа, в Австралия и Океания повече от 200 народа.

В съветската страна има повече от 100 народа. Най-многобройни от тях са руснаците — 120 милиона, украинците — около 39 милиона, белорусите — 8 милиона.

Но езиците и диалектите в света са много повече… Дори в такава малка република като Дагестан, която хилядолетия наред е била като коридор, минаващ през ивицата суша между Черно и Каспийско море, са се създали повече от 60 езика, които не си приличат помежду си.

Сега на Земята се наброяват 6000 езика.

Но сред това огромно множество може да отделим 13 основни. Владеейки тези езици, човек може да общува на практика с всички хора на земното кълбо.

Езикът се състои от думи, думите носят понятия. В сатиричния роман на Илф и Петров е въведена като персонаж людоедката Елочка, която употребява не повече от двадесетина думи. Осмивайки тази глуповата персона, талантливите писатели почти, я лишават от език, докато Шекспир използува 24 000 думи!

Съвременните математически изследвания на езика ни довеждат до поразителни резултати, които никога през живота си не бихме получили, ако на помощ не бяха дошли машините. Те анализираха различните езици — колко често се употребяват отделни думи, характерното построяване на фразата. Именно машините ни дават днес възможност да създадем много интересна статистика за използуването на езика.

Американският учен А. Уест дълго изследвал английския „разговорен речник“. Ето неговите изводи: оказва се, че за примитивен преразказ на основната сюжетна линия на анекдот са нужни само около 450 думи.

Както виждате, всичко това все пак значително надвишава възможностите на людоедката Елочка!

За подробно преразказваме на всяка приказка са необходими не по-малко от 750 думи. Приключенски роман изисква не по-малко от 1400 думи, а за художествената литература са необходими вече 3000 думи.

Колко думи са необходими на практика за общуването на хората помежду им?

Неволно си спомням увлекателния разказ на Аксел Иванович Берг за речниковия баланс.

„През 1916–1917 година плавах на английската подводница «Е–8», една от малкото промъкнали се през немския кордон в Балтийско море — разказва академикът. — На всяка подводна лодка назначаваха за свръзка един руски офицер, който добре знаеше английски език — и аз попаднах в това число.

Обаче скоро ми стана ясно, че на подводницата не съществува английски език — петимата офицери и петдесетината моряци, събрани от различни пристанища и провинции на Англия, Шотландия и Ирландия, с мъка се разбираха помежду си, обяснявайки се на някакъв чудовищен жаргон. Но колкото и да е странно, на този изключително сложен подводен кораб всичко вървеше благополучно. А ние ползувахме речников запас само от някакви си 200 думи! От тях няколко десетки бяха команди, а останалите — морски жаргон, кратки, доста остроумни и научно обосновани морски ругатни, възприети в целия подводен екипаж на Британския кралски флот.“

Разбира се, този разказ е малко пресилен. В обикновения живот нещата са по-сложни. Ето например данни на психолозите:

На практика детето използува 3600 думи, юношата на 14 години вече 9000 думи. Що се отнася до възрастния човек, той употребява повече от 11 000 думи. А човек с по-висок интелект има в запас до 13 500 думи: Това е вече добре! Но е все още много далече до пълното използуване на речниковото богатство, създадено от човешката култура.

В езика има думи, които се употребяват по-често и по-рядко. Именно с помощта на кибернетичните машини бил извършен този анализ.

През машината, както се казва, прекарват огромно количество разнообразни текстове. Машината автоматично пресмята какъв обем обхващат най-употребяваните думи на различните езици. Станало ясно, че в английския език например 75 процента от текста заемат 736 най-употребявани думи. А какво значи това? Ако сте научили тия 736 думи, три четвърти от текста вече е разбираем за вас.

Нека увеличим запаса от думи до 1000. Какво ще получим? 80,5 процента от английския, 83,5 процента от френския и 81 процент от испанския текст. С други думи, знанието на 1000 думи ви дава възможност напълно да се ориентирате в чуждия език.

Нека увеличим нашия словесен багаж до 2000 думи. Тогава те ще съставят съответно в английския език 89 процента яснота в текста, при 3000 думи — 90 процента, при 5000 думи — 93,5 процента. Ще рече, че като знаете 5000 думи, вие ще можете свободно да четете текст на английски език, защото само 19 думи от 300 ще ви бъдат непознати.

Но тук откриваме интересно явление.

Вие сте изучили 10 000 думи, а процентът от познаването на текста нараства само до 96,4 процента. Колко труд, колко зубрене само, за да спечелите някакви си 2,9 процента!

Това изследване е много интересно, особено за онези, които се готвят да изучават чужди езици. Но в дадения случай ние говорим на речниковия състав на обикновен текст. Езикът на писателя е област, в която той се прилага в още по-разнообразни нюанси.

Ето защо най-напред правим математически анализ на езиковите особености на нашия велик поет А. С. Пушкин. Било изчислено с машини, че пълното издание Събрани произведения на Пушкин включва приблизително 600 хиляди различни, нееднократно повтарящи се думи. От тях 21 200 думи са съвсем различни. Какъв огромен речников резерв владее поетът! Повече от 100 пъти се употребяват само 720 думи, а един път се срещат 6440 думи от всичките 600 хиляди думи, два пъти — 2830 думи, три пъти — 1800 думи.

Нима този анализ не е поразително математическо доказателство за безценното богатство на езика и за умението да се ползува този език, за да се предаде на читателя „поетическа информация“.

Някои биха казали: да, но това е Пушкин! А как стой въпросът при другите писатели?

Имаме на разположение някои данни. В „Божествена комедия“ на Данте се употребяват 5860 думи, в произведенията на древния римски поет Хораций — 6084 думи, в стиховете на Омир — около 9000 думи. Вече споменахме, че у Шекспир според различни източници броят на употребяваните думи е между 15 000 и 24000.

Съвременните кибернетични машини проверяват особеностите на писателите и в други насоки.

Каква е дължината на фразата? Средният брой на думите в едно изречение от произведението например на Алексей Толстой „Сестри“ се равнява на 11,9 думи, от „Двубой“ на Куприн — на 9,5 думи.

Машините помагат при съставянето на така наречения честотен речник. Това е речник списък от най-често срещаните думи до онези, които се срещат изключително рядко. Английският честотен речник включва в себе си 30 000 думи. Той започва от думи, които се срещали само 4 пъти. Били съставени речници: испански език — 400 000 думи, чешки — 1 200 000 думи, полски — 7 000 000 думи, френски — 1 500 000 думи, немски — 11 000 000 думи.

Иска ми се да кажа нещо и за анализа на езика от гледна точка на заимствуването му от други народи. Машините са пресметнали, че в албанския език от 5140 думи само 430 са незаимствувани. В арменския език от 1500 думи 1140 са заимствувани от персийски, гръцки, сирийски, арабски и други източни езици. Може да се каже, че арменският език включва в себе си всички особености на източните езици.

Но нали този процес засяга и такива езици като английския. В него от 55 до 70 процента от всички думи са заимствувани от френски, латински, и други романски езици.

Даваме тези цифри не за да обвиним хората в заимствуване. Ние чудесно разбираме, че всеки език се е създавал в зависимост от историческите условия.

Обаче нека се върнем към анализа на езиковите особености.

Думите се състоят от букви. А как се употребяват отделните букви в думата? С кибернетична машина направили анализ на произведенията на редица съветски писатели като Гайдар, Паустовски, Горбатов — общо с 88 000 звука от руската реч. Оказало се, че на 100 букви от текста се падат девет „о“, шест „а“, също толкова „и“, пет „н“. Колкото до такива редки букви като „ю“ — на всеки 100 букви тя се среща 0,6 пъти.

Анализът на сричките показал, че думата в руския език има средно 2,2 срички. Изключително редки са думите, които се състоят от 5 срички — те представляват само 3,5 процента от всички думи.

Читателят ще попита: а защо, след като се интересуваме от кибернетиката и от мозъка на човека, отделяме толкова много внимание на проблема за словообразуването? Но нали именно този анализ ни дава възможност да разберем какво представлява езикът на машините и как машината може да превежда текст от един език на друг.

Някога, преди сто години, в целия свят излизаха не повече от 1000 научни списания, а сега излизат повече от 100 хиляди. Ако един химик например употребява 40 часа на седмица, за да чете със скорост четири статии на час всичко, което се публикува в съвременната преса, за цяла година той не би прочел и една десета част от онова, което би трябвало да прочете. Това ни довежда до пряката необходимост да използуваме машините. Съвременната наука трябва да преработва колосално количество информация. Например в Държавната библиотека „В. И. Ленин“ в Москва сега се пазят около 21 000 000 книги, а към края на века те ще бъдат повече от 100 000 000. В нашата страна има 400 000 библиотеки, в които се пазят един милиард и половина книги.

За една година Институтът по информация в Москва обработва 11 000 чуждестранни издания, 3000 съветски периодични, 90 000 патенти, публикувани на 65 езика. За да се обработи цялото това огромно количество материали, е необходимо използуването на кибернетични машини.

Проблемът за превода много отдавна е интересувал изобретателите и учените. Първите машини за превод от един език на друг обработвали строго научен текст. Това е естествено — речниковият запас в научните текстове е сравнително по-беден, отколкото в художествените.

Преводът от английски език на френски и в обратен ред минавал гладко, защото строят на езиците бил много близък. Но когато се сблъскали с преводите от немски на руски, пред учените възникнали необикновени трудности. Граматиката на двата езика е съвсем различна — в немския глаголът минава в края на изречението. И машината моментално получила двойка по граматика, а учените изпаднали в затруднение.

Тогава започнали да създават машина, която предварително се програмирала съобразно тези правила.

Езиковедите давали своите съвети, но сега започнали да недоумяват кибернетиците.

— Та вие лишавате машината от универсалност! — говорели те. — Това е много скъпо — да се създават единични машини. Кибернетичното устройство на всяка цена трябва да бъде универсално.

Обаче вариантите от граматически правила станали много за една универсална машина. За 10 езика се получавали 90 правила за превод. Как всичко това да се програмира в машината?

В началото кибернетиците имали някакви успехи, но в края на краищата стигнали до задънена улица. И тогава възникнала мисълта да се създаде език посредник. Машината ще превежда на този език, а вече след това от езика посредник ще се осъществяват преводи на всички останали езици. Това рязко ще намали броя на междинните процеси: вместо 90 варианта от правила ще са нужни само 20, от тях 10 правила за превод на езика посредник и 10 — за превода на съответния език.

Идеята се оказала извънредно плодотворна. Но кой е този език посредник и какъв трябва да бъде той?

Отначало взели първия попаднал им език — латинския. Латинският не бил подходящ — липсвала му универсалност, необходима за езика посредник. Тогава лингвистите предложили да се използуват езикът есперанто и неотдавна създаденият език интерлингва. Граматиката на есперанто се състои само от 16 правила, при това не много сложни.

Но работата отново не потръгнала — езикът есперанто се оказал твърде различен от живите езици. И след няколко несполучливи опита езиковедите стигнали до необходимостта от създаването на собствен, специален език за кибернетичните машини. На този език никой никога няма да говори. Той ще бъде скрит от нас в недрата на електронната преводаческа машина. Над създаването на такъв език днес работят учени от много страни на света. Например в Ленинград с това се занимава голяма група лингвисти. Те вземат за основа 26 западноевропейски и източни езици, като се съобразяват каква част от населението на земното кълбо ползува тоя или оня език, и подбират нещо средно аритметично от тези езици, вземайки предвид разпространението им.

Днес е още рано да говорим за резултатите от създаването на език на кибернетичните машини, но все пак някои правила могат да представляват интерес.

Например в този език прилагателното на всяка цена трябва да стои пред съществителното, подлогът се разполага винаги пред сказуемото, наречието трябва да стои до глагола. Определителният и неопределителният член, които съществуват в някои европейски езици, били признати за абсолютно ненужни. Но може би и този език, който сега се разработва, ще се окаже несъвършен и ще трябва и от него да се откажем.

Езикът на машините е съвършено условен език. Той ще представлява мрежа от съответствия между елементите на езиците, които се подлагат на превод. Московските учени настояват за създаване именно на такъв език.

Трябва да признаем, че засега се работи все още над машини преводачи само в областта на техническите текстове. Никой не поставя сериозно въпроса за машинен превод на художествена литература.

Работата на лингвистите и на кибернетиците в областта на превода дава понякога забележителни резултати. На времето цялата световна преса писа, че досега нито един учен в света не е можал да разшифрова древната писменост на маите. Същата съдба е сполетяла и писмеността ронго-ронго от Великденските острови.

Йероглифите на маите са нанесени върху кожа и върху кора от фикус, а йероглифите ронго-ронго са издълбани върху късове дърво. Езиците и на двата народа са отдавна забравени.

Съветският учен Ю. Кнорозов успял да установи, че писмеността на маите представлява йероглифи. Но с разшифроването им се заели младите учени от Сибирския филиал на Академията на науките. Пред тях стояла невероятна, почти неразрешима задача — да разкрият тайната на 400 йероглифа, повече от половината съвсем непонятни, а по отношение на другата половина имало само твърде смътни догадки.

Възложили работата по превода на машината. Била съставена специална програма за статистическото изследване на езика. В машината въвели данни от търсенето на речника, цифрови обозначения за всички йероглифи. Били въведени и всички букви от латинската азбука. Увлекателният, сложен процес на разшифроване на мъртвия език продължил два дни. През това време машината извършила повече от един милиард операции. И успех! 40 процента от текста вече можел да се разчете 130 години учените се опитвали да разшифроват ръкописите на маите. И едва днес с помощта на машината успели да надникнат в тайната на древния език. За разшифроването на целия текст на маите ще бъдат необходими още 200 часа работа, по време на които машината ще трябва да направи 11 милиарда операции.

Езикът ронго-ронго също чака своите изследователи. И вероятно мислите на народа, населявал някога Великденските острови, ще станат известни на човечеството с помощта на машина, която умее да анализира най-прекрасното, най-удивителното, което е създал човекът — езика.

Съвсем по друг начин се решава въпросът за създаването на език за машините информатори. Тук не трябва никакъв логически език — трябват само абстрактни знаци и условни символи.

Пример за такива абстрактни знаци може да служи известната на всички азбука на Морз, която се състои от точки и тирета и за първи път е намерила приложение в телеграфните предавания.

Броят на знаците е сведен до минимум — те са само два.

Но може да има и друг вид „икономия“. Ето нещо, записано на езика на математиката: а+в=в+а. И същото на обикновен език: „Сумата от събираемите не зависи от последователността на тяхното събиране“. Както виждате, във втория случай знаците са почти десет пъти повече.

Пример за символичен език може да служи и езикът на химията. Сярна киселина и H2SO4. Едно и също понятие, обаче в единия случай дума, а в другия — символи.

Съвременните електронноизчислителни машини не само трябва да съхраняват информация, но са длъжни и да я преработват. За тези машини е нужен техен език — нов код.

С разработването му се занимават много изчислителни центрове.

Програмистите от Изчислителния център към Сибирския филиал на Академията на науките сега създават нов език — посредник между човека и машината. Този език е наречен „алфаезик“ или „сибирски език“. Той е значителен принос във взаимното им разбиране.

А тия взаимоотношения са още много сложни. С помощта на специални програми транслатори програмистът преобразува текста задание в език, разбираем за машината. В този случай програмистът се превръща в своеобразен „жрец посредник“ между света на машините и човечеството.

По такъв начин възниква задачата да се направи езикът на машината достъпен не за единици, а за широк кръг от хора.

На времето Андрей Ершов, млад учен, завеждащ отдела за програмиране към Изчислителния център на Сибирския филиал на Академията на науките, си представяше този процес като своеобразно обучение на машината. Човекът дава задача на машината, тя, ако не разбира, поставя въпрос. Нов отговор — и отново въпрос на машината. И така до пълното взаимно разбиране.

— Във взаимоотношенията на човека и машината — говори Ершов — трябва да се постигне такова състояние, че след всяка нова задача машината да разбира все повече и да може, получавайки други аналогични задачи, да не задава едни и същи въпроси. С други думи, тя трябва да пази в електрическата си памет „протоколите“ от разговорите си с човека и да прилага новите знания в по-нататъшната си работа. Това не е нищо друго освен обучение на машината на човешкия език.

— Ще настъпи ли време, когато машината ще разбира човека от половин дума?

— Да, това време не е много далеч — отговори младият учен. — Същността е в натрупването на „речников запас“ от машината. Отначало човекът учител се приспособява към ограничения език на машината ученик. А когато тя започне да го разбира, разширявайки баланса на езика и познанията си, учителят приближава машината ученик до своето равнище на знания. Неволно си спомням машината в японския павилион на световното изложение, която изпълнява 40 команди, казани на шест езика. Не са ли това първите успехи?

Та нали на практика е възможно непрекъснато да разширяваме количеството и характера на информацията, която машината може да възприеме чрез гласа. Принципът е усвоен — същността е в обема на машинната памет и в умението й да разпознава получаваните сигнали. Ще дойде време и машините от новите поколения ще ни поразяват с широтата на възможностите си.

И нека смятаме, че електронноизчислителната машина е седнала вече на училищния чин!