Сэтгүүлч бидэнд тулгамддаг нэг бэрхшээл нь дуу хураагуураас ярилцлага буулгах буюу хүний яриаг кирилл бичгийн файл болгох үйл явц байдаг. Тиймээс манай салбарынхан “Монгол хүний яриаг таньж, кирилл бичиг болгодог программ зохион бүтээсэн нэгэнд алтаар хөшөө босгох сон” хэмээн хошигнодог юм.
Тэгвэл энэхүү мөрөөдөл биеллээ олсныг мэдээллийн технологийн инженер Д.Моондой гуайтай уулзаж, нүдээр үзэхээс нааш итгэсэнгүй. Тэрбээр “Миний төрсөн нутаг Монголын сайхан орон” шинэ мөр, “Монгол Улс мандтугай” шинэ мөр, “Хүн болох багаасаа, хүлэг болох унаганаасаа” шинэ мөр, “Эрхийг сурахаар бэрхийг сур” гэхчлэн зөөврийн компьютерт залгасан чихэвчтэй жижиг микрофон дээр уншихад тэр дор нь кирилл бичигт буулгачих юм.
Өнөөх нь зөвхөн эзнийхээ дууг таних бус, миний уншсаныг ч кириллээр буулгав. Тэр байтугай, хүүхэд, хөгшдөөс авхуулаад, казах, дөрвөд хүн уншсан ч ялгаагүй даалгавраа биелүүлнэ гэхээр жигтэйхэн “дуулгавартай” программ аж.
Ярих бус, унших гэсний учир нь дээрх программ хангамжийн өгөгдлийн санд одоогоор нэг А4 бичгийн цаас дүүрэн текст оруулсан бөгөөд тэр үг, өгүүлбэрүүдийг “баруун, солгойгүй” хувиргаж байна. Тиймээс цаашид энэхүү өгөгдлийн санг монгол хэлнийхээ арвин баялаг үгийн сангаар баяжуулж, нэг бус, хэдэн арав, зуун сая хуудас текст оруулах шаардлагатай байгаа аж.
-Монгол хүний яриаг таньж, кирилл бичгийн файл болгон боловсруулах программ хангамж бүтээх туршилтын ажил амжилттай дууссан тухай дуулаад таныг ярилцлагад урьсан юм. Энэхүү судалгааны ажлыг хэзээ, яаж эхлүүлсн юм бэ?
-Үүнийг ярихаас өмнө дэлхий дахины туршилт, судалгааны хөгжлийн түүхээс дурдаад, ерөнхий ойлголт өгөх нь зүйтэй гэж бодож байна. Хүний яриаг таних (speech recognation), тэгсний үндсэн дээр бичгийн текст болгон хувиргадаг үйлдэл нь одоогийн хэллэгээр хиймэл оюун ухааныг зохион бүтээх ажил бөгөөд онолын хувьд математик загварчлалын тусламжтайгаар өргөн хүрээний судалгаа, туршилт хийж, асар их хэмжээний өгөгдлийн сан бүрдүүлдэг программ хангамж юм.
Хүний яриа таньдаг төхөөрөмжийг дэлхийд анх 1952 онд зохион бүтээсэн бөгөөд тэр нь зөвхөн тооны цифрүүдийг таньдаг “шидэт хар хайрцаг” нэртэй байжээ. 1980 онд Америкийн Засгийн газрын санхүүжилтээр байгуулсан Батлан хамгаалахын тэргүүлэх чиглэлийн төслийн газар Defense аdvanced research projects agency (DARPA)-аас компьютер технологийн хөгжлийг батлан хамгаалах салбарт ашиглах томоохон судалгааны ажил эхлүүлсэн нь яриаг бичгийн текст болгоход тулгарсан онолын олон асуудлыг шийдэхэд ихээхэн нэмэр болсон гэж үздэг.
Тухайлбал, 1982 онд “Dragon systems” компани 10 000-150 000 үгтэй систем зохион бүтээсэн бөгөөд тэр нь ярианы 10 хувийг л таньж байсан тул яриа болон текстийн өгөгдлийн сангийн багтаамжаа асар том болгож өргөжүүлсний ачаар энэ үзүүлэлт 50 хувь болтлоо өссөн байдаг. Өдгөө Америк болон Европын холбооны олон улс орны сансар судлал, батлан хамгаалах, шүүх, прокурор, хууль хяналтын байгууллагынхнаас эхлээд чухал хэлэлцүүлэг, хурал зөвлөгөөн, мэтгэлцээний үеэр хүний хэлсэн, ярьсныг автоматаар бичгийн файл болгох программ хангамжийг түгээмэл ашиглаж эхэлсэн.
Энэ судалгааны ажлын хамгийн хүндрэлтэй зүйл гэвэл, тухайн ард түмний хэл яриа болгон өөр өөр дуудлагатай, авиа зүйн бүтэц, язгуур, хэлний дүрэм бүр харилцан адилгүй тул өдгөө дэлхий дээр хэрэглэж буй бүх хэлэнд тохирсон түгээмэл хэлбэрийн программ хангамж зохион бүтээх боломжгүй. Тухайн улс гэхэд л дотроо олон үндэстэн ястантай учраас нэг үгийг хэдэн янзаар дууддаг, тэр болгоныг программ хангамждаа бүрэн оруулсан байх шаардлагатай байдаг.
Монгол хүний яриаг таньж, кирилл бичгийн файл болгон боловсруулдаг программ хангамж (Mongolian speech recognition to cyrillic text software) бүтээх туршилт судалгааг бидний хэдэн эрдэмтэн онолын түвшинд хийж, амжилттай гүйцэтгээд байна. Энэ бол 1986 оноос улбаатай ажил л даа.
-Олон жилийн судалгааны үр дүн байх нь. Ач холбогдлыг нь тодруулж ярина уу?
-1970-аад онд манай төр, засаг бодлогоор залуусаа ЗХУ, Болгар, Унгар, Чехословак зэрэг оронд сургаж эхэлсэн юм. Биднийг их сургуулиа төгсөөд ирэхэд ШУА-д ажиллуулж, эрдэм шинжилгээ, туршилт судалгааны байгууллага “Монел”-ыг байгуулан, анхны компьютер, өнгөт зурагт угсрах үүрэг даалгавар өгсөн. Миний хувьд Болгарын Софи хотын Техникийн их сургуулийг инженерээр төгссөн.
Дараа нь биднийг Зөвлөлтийн эрдэм шинжилгээний хүрээлэнгүүдэд дахин дадлагажуулж, сургасан. Тухайлбал, тэр үед миний ажиллаж байсан Новосибирскийн ШУА-ийн лабораторид хүмүүс микрофонд “система” гэх мэтээр үг хэлээд, өнөөхөө кирилл бичгийн файл болгон боловсруулах туршилт хийж байсан юм. Тэндээс энэ системийн талаар анх мэдэж, сонирхоцгоосон хэрэг. 1988 онд нэг нөхөр минь Словакт очсоноосоо хойш өнөөг хүртэл хүний яриаг кирилл бичгийн файл болгож боловсруулах ажлаа хийсээр байгаа.
Тэгэхдээ бүр Европын холбооны 31 улсын шинжилгээ судалгааны төрийн болон аж ахуйн 47 байгууллагыг хамруулсан, Словакт төвтэй, Европын орнуудын албан ёсны 23 хэлний судалгааг боловсруулж буй хүрээлэнгийн захирлаар ажиллаж байна. Доктор Д.Сахиа гэхээр хүмүүс андахгүй дээ. Тэрбээр “Хэдүүлээ одоо монгол хэлнийхээ яриа таних программ хангамжийн туршилт, судалгааг үргэлжлүүлэн, нэг мөр дуусгая” гээд тэндхийн ажлынхаа хажуугаар манай багийг ахалж ажилласнаар бид өнөөдрийн үр дүнд хүрлээ.
Тухайн улсын программ хангамжийн хөгжлийг хэмждэг нэг чухал үзүүлэлт нь хүний яриаг таних систем боловсруулж, нэвтрүүлсэн үү гэдэг асуудал байдаг. Учир нь энэ системийг зөвхөн батлан хамгаалах гэлтгүй, сайн засаглалыг жинхэнэ утгаар нь нэвтрүүлэх, төрийн үйлчилгээг ил тод нээлттэй болгохоос эхлээд харилцаа холбоо, банк санхүү, эрүүл мэнд, боловсрол, прокурор, шүүх, ахуйн хэрэглээний тоног төхөөрөмжийг ухаалгаар удирддаг болгох гээд бүхий л салбарт ашигладаг.
Сайн засаглалаар дэлхийд манлайлдаг Балтын болон Скандинавын орнууд энэ системийг нэвтрүүлснийхээ үр шимийг хүртэж байгаа хэрэг. Ирээдүйд ч олон төрлийн хэрэглээ, хэрэгцээ шаардлага бий болох учраас улс орон болгон үүнд маш их анхаардаг.
-Одоо тэгвэл энэ онолын судалгааг амьдралд нэвтрүүлэхэд хамгийн түрүүнд юу шаардлагатай байна вэ?
-Энэ бол ганц хүн, эсвэл нэг хүрээлэн дангаараа ажиллаад, бүтээчих зүйл биш. Улс орон, төр, засаг нь бодлогоор чиглүүлдэг, олон нийт ч эрвийх дэрвийхээрээ оролцож ард нь гардаг. Тийм ч учраас дэлхийн улсууд энэ ажилд ихээхэн хөрөнгө мөнгө зарцуулдаг, бодлогоор дэмжин анхаарч байна.
Жишээ нь, Японд энэ чиглэлийн судалгааны эрдэм шинжилгээний 40 гаруй хүрээлэн ажилладаг. Болгар улс гэхэд энэ чиглэлээр болгар хэл судлалын үндэсний хөтөлбөр хэрэгжүүлж байгаа. Тэд болгар хүний яриа таних программ зохион бүтээх зорилгоор 1945-2009 оны хооронд тус улсад хэвлэгдсэн олон нийтийн хэвлэл мэдээллийн хэрэгслүүдийн материалыг цахим хэлбэрт оруулж, 28.5 сая үгтэй өгөгдлийн сан бий болгосон.
Исландад дөрвөн том компани оролцоод, улсынхаа зохиолчдын сүүлийн үед бичсэн уран зохиолын 100 романыг цахим хэлбэрт оруулаад байна. Эдгээр номыг уншиж, исланд хүний ярианы өгөгдлийн сан бий болгоход 3000 хүн оролцсон байдаг. Гэтэл манайд энэ чиглэлээр ажиллаж байгаа нь бидний үеийн хэдхэн эрдэмтэн л байна. Бид сайн дураараа үүнийг хийдэг.
Хүний хэл яриаг таних програм хангамж зохион бүтээсэн орнуудын туршлагаас хараад тооцоход, монголчуудын яриаг таньж, кирилл бичгийн эх болгон боловсруулахын тулд наад зах нь 1990 оноос хойш хэвлэгдсэн бүх сонин, сэтгүүл, уран зохиолын ном, гарсан хууль тогтоомж, дүрэм журмуудыг ярианы болон бичгийн файл хэлбэрээр бэлдэх шаардлагатай байна. Бид эхний ээлжинд хүний амьдралд өдөр тутам хэрэглэгддэг идэвхтэй үгийн өгөгдлийн сан бий болгох үүднээс уран зохиолын романууд, өдөр тутмын сонинуудын текстийг цахим хэлбэрт оруулаад, дараа нь түүнийгээ яриа байдлаар бичих зорилт тавьсан.
Одоогоор бид “Түшээ” дээд сургуулийн нэг танхимд байрлаад, “Тунгалаг Тамир”, “Цаг төрийн үймээн” гэх мэт романыг оюутнуудаа гуйж уншуулдаг. Нэг хүнээр өдөрт 200-250 өгүүлбэр орсон текст уншуулдаг. Гэвч зөвхөн залуу хүний хоолойгоор уншаад системд оруулчихвал дараа нь тэр үгийг хүүхэд, эсвэл хөгшин хүн, идэр насныхан уншихаар танихгүй шүү дээ.
Дээрээс нь казах, дархад, буриад, дөрвөд тэргүүтэй үндэстэн, ястнуудын авиа дуудлагаар нь давхар бичүүлэхгүй бол танихгүй гээд хүндрэл бэрхшээл их. Тиймээс бидний хувьд юуны түрүүнд хийсэн ажлаа олон нийтийн анхааралд оруулж, зохиолчид, хэвлэл мэдээллийн байгууллага текстээ бариад ирдэг болоосой, өнөөхийг нь олон янзаар уншиж, хоолойгоо бичүүлэх хүсэлтэй хүмүүс зориод ирээсэй гэж хүсэх байна. Нөгөөтээгүүр, улс орон болгон ийшээ зорьж байхад манайх ч бас тэр замаар явах нь тодорхой учраас энэ ажлыг хурдтай урагшлуулахын тулд төр, засгийн бодлого их чухал.
-Монгол хэлийг маш арвин, баялаг үгийн сантай гэдэг. Нэг үгийг л тийм олон янзаар ярьж, бичүүлнэ гэхээр нүсэр ажил болох нь ойлгомжтой юм байна.
-Тэгэлгүй яах вэ. Монгол нэг үг л гэхэд таван насны ангиллаар, хүйсээр, 20-иод үндэстэн, ястны авианы онцлогоор, найман тийн ялгалаар гээд маш олон янзаар хэлж, бичигддэг. Хүмүүс тухайн үг, өгүүлбэрийг хэлж ярихдаа насны онцлогоос хамааран, янз бүрийн өнгө аясаар дууддагийг дэлхий дахинд судалгаагаар тогтоосон. Жишээ нь, 16 хүртэлх насныхан нийт ярианы хоёр хувийг эзэлдэг бол 16-30 насныхан 30, 31-45 насныхан 34, 46-60 насныхан 30, 60-аас дээш насныхан дөрвөн хувийг эзэлдэг юм байна.
Эндээс үзэхэд, бидний тооцоогоор нэг монгол үгийг 1120 янзаар хэлж, бичдэг юм билээ. Гэтэл тультраа хүн царцаа гэдэг үгийг бас нэг өөрөөр хэлнэ ээ дээ. Энэ мэтээр цааш салбарлаад л байна. Монгол хэл гурван сая орчим үгтэй гэж Хөдөлмөрийн баатар, Ардын уран зохиолч Б.Лхагвасүрэн нэгэнтээ хэлснээс үзэхэд гурван тэрбум үгээс бүрдсэн өгөгдлийн санг бид бий болгох шаардлагатай гэсэн үг.
Тиймээс би залуусыг улс төр сонирхохоосоо өмнө иймэрхүү зүйлд идэвх санаачилгатай оролцож, шинжлэх ухаанаар “оролдоосой” гэж чин сэтгэлээсээ хүсэж, захимаар санагддаг. Шинжлэх ухаан сонирхсон хүн наад зах нь аливаа зүйлд ул суурьтай хандан, олон талаас нь эргэцүүлж бодсоны үндсэн дээр шийдвэр гаргадаг.
Хэдий болтол бид нүүрс экспортлох тухай ярьсаар байх вэ. Өнөөгийн монгол залуус энэтхэг, сингапурчууд шиг программ хангамж үйлдвэрлээд, түүнийгээ борлуулах бүрэн боломжтой болсон шүү дээ. Алтай язгуурын хэлтэй орнуудад энэ программыг зарах ч боломжтой. Бидний залуугийн үеийг бодоход одоо Монголд интернэтийн сүлжээ хаа сайгүй нэвтэрсэн.
Миний хувьд 1996 оноос мэдээлэл холбооны салбарт ажиллахдаа “Миком” гээд Монгол дахь интернэтийн сүлжээний анхны компанийг үүсгэн байгуулсан түүхтэй. Хэдхэн секундийн дотор өчнөөн тэрбум үйлдэл хийдэг программ хангамж нэвтэрсэн энэ сайхан боломжийг манай залуус бүрэн утгаар нь ашиглахгүй байгаад үнэндээ сэтгэл дундуур л явдаг.
-1980-аад онд өнгөт зурагт, компьютер угсрах ажлыг Монголд эхлүүлж, олон нийтийн хэрэглээ болгох эхлэлийг тавьсан хүний нэг нь та. Дараа нь өнөөхөө интернэт сүлжээнд ашиглах боломжийг хангаж өгчээ. Гэтэл манайхны хэрэглээ фэйсбүүк “ухах” төдийгөөр хязгаарлагдаж байна гэж үү?
-Нуулгүй хэлэхэд тийм. Зах хязгааргүй хэрэн сүлжилдсэн интернэтийн том орон зайг дүүргэх хэрэглээ бий болгоход төр, засаг ч анхаарах ёстой. Мэдээллийн технологийн салбарын хөгжил гэхээр шилэн кабелийн утас татах төдийхнөөр манайхан ойлгодог. Гэтэл угтаа тэр хязгааргүй орон зайг юугаар, ямар контентоор дүүргэх вэ гэдэг л хамгийн чухал. Үүний нэг жишээ нь монгол хүний яриаг кирилл бичгийн файл болгон боловсруулах ажил юм.
Кирилл бичгийн текстийг халх хүний яриа болгож боловсруулах программ хангамжийг бид аль эрт зохиосон шүү дээ. Харааны бэрхшээлтэй иргэд л үүнийг хэрэглэж байсныг одоо харин зарим хэвлэл мэдээллийн хэрэгсэл ашиглаад эхэлж. Өнөөдөр бид “Ийм мундаг программ хангамж хийсэн” гээд энд тэндгүй зарлаж, хэдэн сэтгүүлчийн яриаг буулгаж үзүүлээд “Хараач, болж байгаа биз дээ” гэж алдар гавьяа хөөцөлдөж болох л доо. Гэхдээ энэ бол нэг хэсэг хүрээнийхэнд хамаатай асуудал бус, хөгшин залуу, эрэгтэй эмэгтэй, яс үндэс харгалзахгүй бүх нийтээрээ зайлшгүй оролцох шаардлагатай ажил.
1990-ээд онд интернэтийг бүх нийтийн хэрэглээ болгох гэж бид зовдог байлаа. Нэг жишээ татахад, би дотнын найзыгаа ятгаж байгаад компьютер авхуулаад, интернэт холбож өгсөн юм. Гэтэл удалгүй нөгөөх маань утасдаад “Энэ компьютерээс утасны тавиур шиг нэг юм гарч ирээд байна. Үүн дээр нь аягатай кофегоо тавьчих уу” гэж байна. Гайхаад очтол CD уншигч нь гараад ирсэн байж билээ. Энэ мэтээр хөглөж монголчууд интернэт орчинтой танилцаж байлаа.
Харин одоо өнөөхөө буруугаар ашиглах нь их болжээ. Ямар сайндаа л цөөнгүй хүн биднийг “Та нараас болоод хүүхдүүд цахим тоглоомонд донтлоо” гэж буруутгадаг. Угтаа бол технологийн хөгжлийг яаж ашиглахаа хэн хүнгүй бодолцох учиртай. Стив Жобсын гэрт өөрийнх нь босгосон компанийн утас, таблет нэг ч байхгүйг ойр дотнынхондоо хэлсэн байдаг шүү дээ.