Қазақша аудионы мәтінге айналдыратын жасанды интеллектке негізделген қосымша бар

20.04.2024

369

Түркістан облысының тұрғындарының назарына жасанды интеллекттің артықшылығы жөнінде ақпараттарды ұсынамыз. Тіл тек адамзаттың коммуникация құралы болған күн – тарих қойнауында, енді темір де адамша сөйлеуді үйрене бастады. Жасанды интеллект өміріміздің түрлі аспектілеріне сыналап еніп, қарым-қатынас пен байланыс тәсілін өзгертіп жатыр. Алгоритмдер мен лингвистиканың тоғысуы тіл мен жасанды интеллект арасындағы күрделі байланысты бекіте түсуде. Қазақ тілі де көштен қалмай жаңа дәуірге ақырындап қадам басып барады. Жақында Kazakh Named Entity Recognition атты қазақша аудионы мәтінге айналдыратын жасанды интеллектке негізделген қосымша шықты. Бұған дейін, керісінше мәтінді оқып беретін функция қолданысқа енген еді. Жобаларды Назарбаев университеті жанындағы Жасанды интеллект пен ақылды жүйелер институтының ғалымдары әзірлеген.

Kazakh Named Entity Recognition жобасына тоқталар болсақ, қазақ тіліндегі атаулы мәндерді анықтауда (АМА) бұл алғашқы зерттеулер емес. Бұған дейін елімізде басқа ғылыми топтар мен зерттеу ұйымдары табиғи тілді өңдеудің бұл түріне өз күш-жігерін салғанын атап өткен жөн. Қазақ тілінде дыбысталған сөздерді мәтінге айналдыру бойынша аннотацияланған корпустар құрастырылды. Алайда, осыған қарамастан, біздің білуімізше, құрастырылған корпустардың ешқайсысына ашық түрде қол жеткізу мүмкін емес еді. Бұған қоса, қазақ тілінде АМА зерттеулерінің ешқайсысында қазақ тілінің ерекшелігі ескерілген аннотациялау нұсқаулығы болмады. Осыған байланысты жұмыс кезінде мәселе туындады. Сөйтіп, аннотацияланған корпустардың жоғын ескеріп, зерттеуіміз арқылы осы салада бар олқылықтың орнын толтыруға және осылайша одан әрі дамытуға үлес қосуға үміттенген болатынбыз. Нәтижесінде, қазақ тіліндегі АМА-ға арналған KazNERD корпусын құрдық. Ол 25 атаулы мән түрін, 112 мыңнан астам сөйлемді және 136 мыңнан астам аннотацияны қамтиды. Корпусты құрастыру үшін АМА-ға арналған қазақ тіліндегі тұңғыш нұсқаулық әзірленді. Осы корпус пен соның негізінде дыбысталған атаулы мәндерді анықтай алатын автоматтандырылған модель жобасымен былтыр Францияның Марсель қаласында өткен LREC атты сөйлеу және табиғи тілді өңдеу технологияларына арналған әлемдегі танымал және беделді конференция өтті.

Қазақша аудионы мәтінге айналдыратын жасанды интеллектке негізделген қосымша бар

РЕДАКТОРЛАР

ТАНЫМАЛ ХАБАРЛАМАЛАР

“Жасөспірімдер арасындағы аутодеструктивті мінез-құлқының алдын алу” тақырыбында семинар өтті

ТҮРКІСТАНДА ҚОЛӨНЕРШІЛЕР ҚАЛАШЫҒЫ САЛЫНАДЫ

“ЫНТЫМАҚ, ҮЛГІ ІЗДЕСЕҢ, ҚАРИЯСЫ БАСШЫ ТОПҚА БАҚ!”

ТАНЫМАЛ САНАТЫ