Теңгерiлмеген аудио және мәтiндiк деректердi топологиялық талдау
Қаралымдар: 108 / PDF жүктеулері: 176
DOI:
https://doi.org/10.32523/2616-7263-2022-141-4-116-126Кілт сөздер:
бақыланбайтын сөйлеудi өңдеу, вариациялық автокодерлер, сөздердi енгiзу, топологиялық деректердi талдау, тұрақты гомология және диаграммаларАңдатпа
Бiз бақылаусыз сөйлеудi өңдеу үшiн аудио және мәтiндiк деректердi топологиялық талдау бойынша алдын ала жұмыс жасадық. Жұмыс фонема жиiлiктерi мен контекстiк қатынастар бiр тiлдiң акустикалық және мәтiндiк салаларында ұқсас болады деген болжамға негiзделген. Тиiсiнше, бұл олардың геометриялық құрылымын ескере отырып, осы кеңiстiктер арасында кескiн құруға мүмкiндiк бередi. Бiрiншi қадам ретiнде аудио және мәтiндiк деректердi екi жасырын векторлық кеңiстiкте салыстыру үшiн вариациялық автокодерлерге негiзделген генеративтi әдiстер таңдалды. Келесi кезеңде екi кеңiстiктiң топологиялық құрылымын талдау үшiн тұрақты гомологиялық әдiстер қолданылады. Алынған нәтижелер екi кеңiстiктiң ұқсастығы туралы идеяны қолдаса да, акустикалық және мәтiндiк кеңiстiктердi дұрыс кескiнге түсiру үшiн, сонымен қатар топологиялық ақпаратты автокодерлердi оқыту процесiне қосудың нақты әсерiн бағалау үшiн қосымша зерттеулер қажет.