Google Tulkotājs runā arī latviski

Redaktors post on maijs 13th, 2010
Posted in Google jaunumi Tags: , ,

Google pētnieku komandas izstrādātais Google Tulkotājs iegūst aizvien lielāku popularitāti. Tā ir statistiskās tulkošanas sistēma, kura līdzīga ir citām plaši izplatītām mašīntulkojuma sistēmām, tomēr pilnīgi cita.

Atšķirība ir tā, ka standarta automātiskā tulkojuma sistēma veidota definējot vārdnīcas un valodu proceduras, taču Google speciālisti pielietojuši pilnīgi citu pieeju.

Veidojot Google Tulkotāju sistēmā tika ievadīti miljardi vārdu, kuri lietoti teikumos. Tika ievadīti teksta materiāli gan pamatvalodā, gan šī teksta tulkojumi uz citām valodām, kurus tulkojuši cilvēki. Lai izveidotu tulkošanas modeli, tika izveidotas statistiskās apmācības tehnikas. Šāds risinājums deva augstus rezultātus.

Google Tulkotāja veidotāji atzīst, ka izveidotā sistēma nav ideāla. Ārkārtīgi grūti automātiskajā tulkošanā ir sasniegt rezultātu, kas varētu līdzināties tulkojumam, kuru veic cilvēks. Lai tas būtu iespējams ir nepieciešams iemācīt sistēmu lietot tuvas nozīmes vārdus atbilstoši kontekstam, ko pagaidām spēj vienīgi cilvēks. Google tomēr uzskata, ka tas ir laika jautājums un liela daudzuma divvalodu tekstu ievadīšanas jautājums sistēmas kodolā.

Google Tulkotājs piedāvā vēl vienu ļoti interesantu funkciju – valodas sintezatoru jeb open source eSpeak. Līdz šim šī funkcija bija pieejama tikai angļu, franču, spāņu, vācu, hindi un itāļu valodās. Tagad šī funkcija ir pieejama 34 valodās, tai skaitā arī latviešu.

Jaunās funkcijas kvalitāte atkarīga ir no izvēlētās valodas. Ja angļu vai franču valodā izruna ir diezgan laba, tad tomēr citās valodās, tai skaitā arī latviešu, izrunas kvalitāte ir vāja vai pat ļoti vāja, spēcīgi jūtams, ka runā mašīna.

Google atzīst, ka strādā pie izrunas kvalitātes uzlabošanas arī citās valodās. Darba rezultātiem noteikti sekosim.

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *

*

Jūs varat izmantot šādas HTML birkas un atribūtus: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>