Хэлийг ерөнхийлөн ойлгож хэрэглэх хиймэл оюуны судалгааны чиг хандлагыг тодорхойлжээ
Хиймэл оюун сүүлийн хэдхэн жилд үсрэнгүй хөгжиж байна. Үүний нэг тод жишээ нь хүнтэй эх хэлээр нь харилцаж төрөл бүрийн асуултад хариулдаг, мэдээллийг боловсруулж учир шалтгааныг тайлбарладаг, тоо бодож, эсээ зохиодог, программын код бичдэг “ChatGPT” хэмээх чатбот юм. Хүмүүс энэхүү хиймэл оюунтай хэрхэн харилцаж, яаж хамтарч ажиллах зэрэгт суралцаж эхэлжээ. Онлайн сургалт, хичээлүүд ч олон болж. Энэ хиймэл оюуны цаана нь хүний хэлийг ойлгож, бас яриа, өгүүлбэр үүсгэж чаддаг хиймэл оюунаар бүтсэн хэлний загварт программ ажилладаг. Яг л хүний тархи шиг ажиллаж, өмнө сурсан зүйлээ дараа нь сайжруулж явдаг зарчимтай. Гэхдээ ийм хиймэл оюун яг хүн шиг сэтгэж бас асуудлыг шийдвэрлэж чаддаг уу гэсэн асуулт шинжлэх ухаанд тавигдаад байна. Машинаас ялгарах хүний гол онцлог бол ерөнхийлчлөл (generalization) буюу нэг орчинд олж авсан мэдлэгээ өөр, өмнө нь хэзээ ч харж байгаагүй шинэ орчинд маш хурдан ашиглаж дасан зохицох чадвар юм.
Дээрх судалгааны өнөөгийн байдал, чиг хандлагыг МУИС, Мета (Фэйсбүүк), Амазон компани, Амстердам, Эдинбург, Кэмбридж, Харвард, ETH Цюрих их сургууль, Макс Планк, Массачусеттсын судалгааны институт гэх зэрэг байгууллагын судлаачид хамтран тодорхойлжээ. Тэд нийтдээ 540 гаруй эрдэм шинжилгээний өгүүллийн 700 гаруй судалгааны туршилтыг судалж өөрсдийн боловсруулсан ерөнхийлчлөлийн ангилал зүйгээр ангилсан байна. Судлаачдад энэ судалгааны асуудлын талаар илүү гүнзгий ойлголт өгөх, цаашдын судалгааны чиг баримжаа олгох зорилготой “GenBench” программыг бүтээжээ. Мөн цаашид юуг анхаарах, туршилтаа хэрхэн зөв хийх талаар зөвлөгөө өгчээ. Энэ ажлынхаа үр дүнг компьютерийн ухаан – хиймэл оюуны салбарыг тэргүүлдэг, 23.8 импакт фактортой “Nature Machine Intelligence” сэтгүүлд хэвлүүлээд байна. МУИС-иас Мэдээллийн Технологи, Электроникийн Сургуулийн Мэдээлэл, компьютерийн ухааны тэнхимийн дэд профессор Б.Хуягбаатар судалгааны багт орж ажиллажээ.
Хиймэл оюуны хөгжилд тухайн хэлээр, жишээ нь, Монгол хэлээр илэрхийлсэн мэдлэг, түүний хэмжээ, хадгалж үлдээсэн хэлбэр бичвэр, яриа, дүрс нь маш чухал нөлөөтэй. Жишээ нь, “ChatGPT”-д яг ижил даалгаврыг англи, итали, монгол хэлээр өгөхөд үр дүн харилцан адилгүй, хэлний цахим нөөц багатай монгол хэлний хувьд бүр хангалтгүй гарч байна. Учир нь монгол хэлний загвар нь нөгөө хоёр хэлтэйгээ харьцуулахад хамаагүй бага хэмжээтэй. Өөрөөр хэлбэл бага мэдлэг шингээсэн юм. Ирээдүйд бид монгол хэлээрээ компьютер, машинтай харилцаж ажилладаг байхын тулд хэлний цахим нөөцийг сайн бүрдүүлэх хэрэгтэй байгаа юм.
Дижитал ертөнцөд хэлний цахим нөөц – өгөгдөл бол гол түүхий эд, зүйрлэвэл байгалийн нөөц болдог. Дахин хуулбарлаж ашиглаж болдог, нэг үүссэн бол мөнх оршдог өвөрмөц онцлогтой түүхий эд юм. Монгол хэлээр ярьж, бичиж буй хэн бүхэн энэ түүхий эдийг бэлтгэгч, боловсруулагч байж дижитал баялаг бүтээгч болох хэрэгтэй байна. Энэ нь эргээд тухайн хэлээр харилцагчдад шууд болон дам байдлаар маш их тус хүргэнэ.