Қазақстанның ЖИ нарығында жетекші елдердің қатарына енуіне әлеуеті жеткілікті

168

Қазақстан жасанды интеллект саласындағы әлемдік додаға кеш қосылғанымен, қазіргі уақытта осы салада түрлі жобаларды, оның ішінде қазақ тіліне қатысты жобаларды қарқынды түрде жүзеге асыруда. Ғылым және жоғары білім министрлігінің мәліметінше, бүгінде 6 жоғары оқу орны қазақ тілі корпусын әзірлеу бойынша жобаларды жүргізіп жатыр.

Cонымен қатар көптеген отандық IT компаниялар мен стартаптар өнімдеріне ЖИ-ді қосып, қызметтерді жетілдіруде. Сондай компанияның бірі – «Infinity Enterprises». Олар әлеуметтік медиа кеңістігіндегі деректер жариялана салысымен, дәл «сол сәтте» мониторинг жасап, сізге қажетті ақпараттарды жинайтын «Scano – Media Monitoring» бағдарламасын жасаған.

Біз алғашқыда әлемдегі үздік система авторларымен келісімшарт жасасып, сол жүйелердің лицензиясы арқылы қызметтерімізді ұсынатынбыз. Бір өкініштісі ол системаларда қазақ тіліндегі ақпараттардың санаттық анализдері өте нашар жұмыс істейтін. Осы мәселелерді ескере келе, сонымен қатар нарықта қазақ тіліне арнайы бағытталған жүйелердің болмауына байланысты 2022 жылдың желтоқсан айында өзіміздің 100% отандық өнім «Scano» жүйесін құруға кірістік. Бұл – жасанды интеллектке негізделген әлеуметтік медианы талдауға арналған бірнеше микропроцесстерден құралған автоматтандырылған жүйе, – дейді компания директоры Аслан Әбілқас.

Scano жүйесі компания үшін клиенттердің, ал мемлекеттік мекемелер үшін тұрғындардың әлеуметтік медиа кеңістігіндегі көңіл-күйіне, пікірлері мен реакцияларына мониторинг жасап, сол арқылы жылдам маркетингтік және стратегиялық шешімдер қабылдауына мүмкіндік береді. Жоба жетекшісі ЖИ мүмкіндіктерін Scano жүйесіне сәтті енгізген.

Біздің құрастырған алгоритмдер ақпараттарды түрлі санаттарға бөліп, трендтерді анықтайды, сонымен қатар материалдарды мәтін бойынша ғана емес, суреттердегі сөздер бойынша да іздейді, табылған ақпараттардың тоналдылығын анықтайды және көптеген басқа мүмкіндіктерге жол ашады, – дейді ол.

Алайда қазақ тіліндегі деректерді талдау процесіне ЖИ-ді енгізу барысында көптеген қиындықтардың болғанын да жасырмайды.

Scano қазақ тіліндегі деректерді талдау үшін арнайы әзірленген алгоритмдерді қолданады, олар ақпаратты әртүрлі тақырыптар бойынша категорияларға бөліп, трендтерді анықтап, табылған деректердің құндылығын бағалап, жан-жақты аналитикалық қорытындылар жасай алады. Дегенмен, жоба басталған кезде біз қазақ тілігдегі базаның жоқтығынан және осы тілге арналған арнайы модульдерді әзірлеу қажеттілігінен қиындықтарға тап болдық. Бұл мәселені шешу үшін біз интернеттен деректерді өзіміз жинауға мәжбүр болдық, бұл көп уақыт пен ресурстарды талап етті. Содан кейін біз осы деректерді өңдеу және құрылымдаумен айналысып, қазақ тіліндегі мәтіндерді талдауға арналған арнайы алгоритмдер әзірледік. Жұмыс барысында қазақ тілін тілдік интеллект үшін анықтау кезінде кейбір қиындықтар туындады. Атап айтқанда, қазақ тілінің ерекшеліктері мен идиомалары нақты талдауды қиындатуы мүмкін, және біз алгоритмдердің дәлдігін арттыру үшін осы мәселелерді белсенді түрде шешуге тырысамыз. Бүгінде қазақ тіліндегі материалдарды талдау барысында анализ жасау дәлдігін 90%-ға жеткіздік, – дейді Аслан Әбілқас.

P/S: Осы зерттеуді жүргізу барысында OpenAI компаниясы жаңадан ChatGPT 4o (omni) моделінің іске қосылғанын хабарлады. GPT-4o — GPT-4-тің жаңартылған моделі, ол интернеттегі үлкен көлемді деректер негізінде жасалған. Бұл модель 50 түрлі тілді, оның ішінде қазақ тіліндегі мәтінді, аудионы және бейнені тез арада өңдей алады. Жаңа модель аудио-аудармашы ретінде жұмыс істей алады, эмоцияларды қабылдап, бет-әлпетті талдай алады және пайдаланушылардың дыбыстық нұсқауларына жауап бере алады.  Алайда қазақ тіліндегі сұраныстар ағылшын немесе орыс тілінде берілетін ақпараттар деңгейіне жете қойған жоқ. Бірақ Қазақстанның ЖИ нарығында жетекші елдердің қатарына енуіне әлеуеті жеткілікті және алғышарттар да бар.

Мәселен, еліміз Oxford Insights жүргізген Үкіметтің 2023 жылға арналған жасанды интеллектке дайындық индексінде 193 елдің арасында 72 орынды,  2021 жылғы DSGI цифрлық дағдылар деңгейі бойынша 134 елдің рейтингінде 43 орын, азаматтардың электрондық қатысу рейтингінде (E-Participation Index) 15 орын, БҰҰ зерттеулері бойынша «Электрондық үкіметті дамыту» индексі бойынша 28 орын және «Онлайн қызметтер» индексі бойынша 8 орынды алады. Сонымен қатар биыл «Жасанды интеллектті дамытудың 2024-2029 жылдарға арналған тұжырымдамасы» бекітілді. Тұжырымдамада нейрондық желілер негізінде ұлттық тіл моделін әзірлеу, деректер орталығы мен суперкомпьютерді қосу сияқты индикаторларға басымдық берілген. Бұл технологияларды қазақ тілінде сөйлету үшін Алтынбек Мұрат ұсынған нақты жұмыстарға кіріскен жөн.

Мемлекет басшысы Қасым-Жомарт Тоқаев Ғылым және технологиялар жөніндегі ұлттық кеңестің отырысында қазақ тіліндегі ЖИ моделін әзірлеу цифрлық дербестігімізді қамтамасыз етіп қана қоймай, мемлекеттік тілді дамытуға мықты серпін беретінін айтқан болатын.

Осылайша, қазақ тілі мен жасанды интеллекттің үйлесуі еліміздің мәдени және ғылыми потенциалын арттырып, халықаралық деңгейде танымал болуына септігін тигізеді. Бұл бағыттағы жұмыстар әрі қарай да жалғасын тауып, жаңа жетістіктерге жетуге мүмкіндік беретіні сөзсіз.