Sunday, December 25, 2011

Tuesday, December 13, 2011

«GOOGLE TRANSLATION»-Д МОНГОЛ ХЭЛИЙГ ОРУУЛАХ БОЛЛОО



Монгол Улсын ерөнхий сайд С.Батболд, Батлан Хамгаалахын сайд Л.Болд, МШХХТГ-ын дар­га Ж.Бат-Эрдэнэ нар манай улсад анх удаа ирсэн “Google” кор­порацийн гүйцэтгэх захирал ноён Эрик Шмидттэй уулзалт хийж, Монгол Улс “Google” кор­­порацитай хэрхэн хамтарч ажил­лах талаар хэлэлцсэн байна. «Google» корпорацийн гүйцэт­гэх захиралтай хийсэн уулзалтын гол үр дүнд дэлхийн 50 гаруй орны хэлийг орчуулдаг “Google translation”-д Монгол хэлийг оруулахаар бол­сон байна. Уг программыг оюутан залуус, сурагчид гээд интернет орчинд ажиллаж чаддаг хэн бүхэн ашигладаг бөгөөд өмнө нь монгол хэл байгаагүй учир өөрсдийн мэддэг бусад хэлнээсээ давхар орчуулах гэх мэт хүндрэл тулгардаг байсан юм. Мөн уулзалтын хүрээнд анд­роид маркет дээр Монгол прог­раммистуудын боловсруулсан ап­пликэйшнийг борлуулах нөхц­лийг бүрдүүлж уг тогтолцоог бий болгоход дэмжлэг үзүүлэх болом­жийн талаар санал солилцжээ. Мөн Монголоос андроид маркет руу хандалтыг нээснээр манай улсын хэрэглэгчид гар утсаа бүрэн дүүрэн ашиглах боломж бололцоотой болохыг дурдсан бай­на. “Google Earth” хэмээх интернэт хэрэглэгчдийг байлдан дагуулж чадсан аппликэйшн программ хан­гамжинд улсын нийслэл болон то­моохон хот суурин газрыг “Street view” үйлчилгээнд хамруулан Мон­голын зургийг тогтмол шинэчилж байх асуудлыг энэ удаагийн уул­залтаар хэлэлцжээ. Мөн манай улсад Google data center байгуулах саналыг МШХХТГ-ын дарга Ж.Бат-Эрдэнэ тавьсан байна. Үүнийг “Google”-ийн гүйцэтгэх захирал ноён Эрик Шмит судалж үзэн хамтарч ажиллах боломжтой гэдгийг онцолжээ. Мөн МШХХТГ-ын зүгээс “Google” компанид богино, дунд хугацаараар тодорхой чиг­лэлээр мэргэжилтнүүд бэлтгэх талаар санал тавьсан байна. Монголд анх удаа ирсэн ноён Эрик Шмидтийн хувьд манай улсад Мэдээллийн технологийн салбар эрчимтэй хөгжих бололцоог буйг онцлоод, цаашид идэвхтэй хамтран ажиллахаар болсноо мэдэгдлээ.

Monday, December 12, 2011

Steve Norvig

http://www.stonetemple.com/search-algorithms-with-google-director-of-research-peter-norvig/

Google-н орчуулгын алгоритм

statistical translation techniques -н талаар дэлгэрүүлж судалнаа.


Computer scientists from Sweden and the United States have applied modern-day, statistical translation techniques -- the sort of which that are used in Google Translate -- to decode a 250-year old secret message.

The original document, nicknamed the Copiale Cipher, was written in the late 18th century and found in the East Berlin Academy after the Cold War. It's since been kept in a private collection, and the 105-page, slightly yellowed tome has withheld its secrets ever since.

But this year, University of Southern California Viterbi School of Engineering computer scientist Kevin Knight -- an expert in translation, not so much in cryptography -- and colleagues Beáta Megyesi and Christiane Schaefer of Uppsala University in Sweden, tracked down the document, transcribed a machine-readable version and set to work cracking the centuries-old code.

The book's pages -- bound in gold and green brocade paper -- contained about 75,000 characters in very neat handwriting. Outside of two words -- an owner's mark ("Philipp 1866") and a note in the end of the last page ("Copiales 3") -- the rest was encoded.

Some of the letters were obviously Roman and others were plainly Greek, while the rest were abstract symbols and doodles.

At first, Knight and his team isolated the Roman and Greek characters, figuring that they might be the real message, and attacked it with a home-made translation project. 80 different languages, and many hours later, and nothing happened. "It took quite a long time and resulted in complete failure," says Knight.

The team realised that the known characters were just there to mislead. So they booted them out and looked at the symbols. They theorised that abstract symbols with similar shapes might represent the same letter, or groups of letters. They tested this with different languages and when German was used, some meaningful words emerged -- "Ceremonies of Initiation", followed by "Secret Section".

A little computation later and a good chunk of the book had been decoded and transcribed. The document revealed the rituals and political leanings of a German secret society, and one that had a strange obsession with eyeballs, plucking eyebrows, eye surgery and ophthalmology. You can read the entire, weird, manifesto in English here.

Buoyant from his success, Knight is now planning on using his techniques and programs to tackle other codes including ones from the Zodiac Killer, a Northern Californian serial murderer from the 60s; "Kryptos," an encrypted message carved into a granite sculpture on the grounds of CIA headquarters; and the Voynich Manuscript, a medieval document that has baffled professional cryptographers for decades.

Номууд


зарим нэг хэрэг болж магадгүй номууд




Machine Translation: A View from the Lexicon (Artificial Intelligence)
Translation Engines: Techniques for Machine Translation
Learning Machine Translation (Neural Information Processing series)
Statistical Machine Translation


http://www.veryebooks.org/machine-translation-its-scope-and-limits_192692.html

2

Энд Google Translation хэрхэн ажилладаг тухай ерөнхийд нь тайлбарласан байна.

http://animshare.hubpages.com/hub/How-Google-Translate-Works

Эхний пост

Англи хэлнээс Монгол хэл рүү орчуулах орчуулагч програм хөгжүүлэх зорилгоор энэ блогыг нээлээ.