Лента новостей

Все новости

Популярное

Ученые рассказали об ошибках и галлюцинациях искусственного интеллекта в «Тотальном диктанте»

 Татьяна Дейс   Фото: nsu.ru

Ученые рассказали об ошибках и галлюцинациях искусственного интеллекта в «Тотальном диктанте»

Новосибирские ученые рассказали, что не ожидали подобного результата проверки грамотности от системы «Писец».

Разработчики открытой системы «Писец» поделились, что результат, достигнутый на «Тотальном диктанте» 20 апреля, превзошел ожидания. «Писец» был разработан научным сотрудником Лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ и сооснователем стартапа «Сибирские нейросети» Иваном Бондаренко. Предполагалось, что в первом состязании в грамотности с человеком искусственный интеллект допустит минимум орфографических ошибок, но проиграет в пунктуации.

Целью ученых было узнать о совершаемых «Писцом» ошибках и неточностях для дальнейшего совершенствования. Неожиданно программа смогла удовлетворительно расставить запятые и выделить абзацы с помощью выученных «кодовых фраз» вроде «пишем с красной строки» или «переходим на новый абзац».

Проверила написание диктанта искусственным интеллектом старший преподаватель кафедры источниковедения литературы и древних языков Гуманитарного Института НГУ Людмила Буднева.

«Писцу» вполне можно было бы поставить твердую «тройку», если бы не несколько обстоятельств. Из 276 слов диктанта он пропустил 6, пять из которых стояли в конце предложения, причем в этих случаях он не ставил точку, но следующее предложение начинал с заглавной буквы. В одном месте пропустил предлог «в», шедший предпоследним в предложении. Еще 7 слов им было услышано неверно. Например, вместо «наивысшего» искусственный интеллект написал «наявившего». Другой пример словотворчества – «кальиончатых» вместо «клеенчатых, – разобрала ошибки Людмила Буднева.

Таким образом, в верно услышанных моментах «Писец» справился с задачей хорошо – между «тройкой» и «четверкой». По словам разработчиков, результат оказался выше прогнозируемого. «Писец» создавался для автоматического стенографирования звукозаписей интервью или защит диссертаций. И 20-30 % ошибок в расшифрованных текстах позволяют значительно экономить время по сравнению с записью текста с нуля. Но для диктанта такой процент – это «двойка».

Поэтому в последнюю неделю перед «Тотальным диктантом» мы занимались адаптацией «Писца» к специфике диктанта, а также вносили в него принципиальные улучшения, основанные на результатах наших исследований за последний год. Одно из таких улучшений — применение метода минимизации байесовского инвариантного риска вместо обычного в таких случаях метода минимизации эмпирического риска, – объяснил Иван Бондаренко.

Разработчики наметили направление изменений, в частности, повышение устойчивости Whisper-Podlodka к шумам различного рода, которые искусственно добавляются в сигнал с помощью системы аугментатора аудиофайлов, а также дальнейшее погружение в исследование метода минимизации байесовского инвариантного риска, исследование ограничений и слабых мест этого подхода, создание более эффективной модели среды с точки зрения акустики и лингвистики.
 

Новосибирские ученые рассказали, что не ожидали подобного результата проверки грамотности от системы «Писец».

Разработчики открытой системы «Писец» поделились, что результат, достигнутый на «Тотальном диктанте» 20 апреля, превзошел ожидания. «Писец» был разработан научным сотрудником Лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ и сооснователем стартапа «Сибирские нейросети» Иваном Бондаренко. Предполагалось, что в первом состязании в грамотности с человеком искусственный интеллект допустит минимум орфографических ошибок, но проиграет в пунктуации.

Целью ученых было узнать о совершаемых «Писцом» ошибках и неточностях для дальнейшего совершенствования. Неожиданно программа смогла удовлетворительно расставить запятые и выделить абзацы с помощью выученных «кодовых фраз» вроде «пишем с красной строки» или «переходим на новый абзац».

Проверила написание диктанта искусственным интеллектом старший преподаватель кафедры источниковедения литературы и древних языков Гуманитарного Института НГУ Людмила Буднева.

«Писцу» вполне можно было бы поставить твердую «тройку», если бы не несколько обстоятельств. Из 276 слов диктанта он пропустил 6, пять из которых стояли в конце предложения, причем в этих случаях он не ставил точку, но следующее предложение начинал с заглавной буквы. В одном месте пропустил предлог «в», шедший предпоследним в предложении. Еще 7 слов им было услышано неверно. Например, вместо «наивысшего» искусственный интеллект написал «наявившего». Другой пример словотворчества – «кальиончатых» вместо «клеенчатых, – разобрала ошибки Людмила Буднева.

Таким образом, в верно услышанных моментах «Писец» справился с задачей хорошо – между «тройкой» и «четверкой». По словам разработчиков, результат оказался выше прогнозируемого. «Писец» создавался для автоматического стенографирования звукозаписей интервью или защит диссертаций. И 20-30 % ошибок в расшифрованных текстах позволяют значительно экономить время по сравнению с записью текста с нуля. Но для диктанта такой процент – это «двойка».

Поэтому в последнюю неделю перед «Тотальным диктантом» мы занимались адаптацией «Писца» к специфике диктанта, а также вносили в него принципиальные улучшения, основанные на результатах наших исследований за последний год. Одно из таких улучшений — применение метода минимизации байесовского инвариантного риска вместо обычного в таких случаях метода минимизации эмпирического риска, – объяснил Иван Бондаренко.

Разработчики наметили направление изменений, в частности, повышение устойчивости Whisper-Podlodka к шумам различного рода, которые искусственно добавляются в сигнал с помощью системы аугментатора аудиофайлов, а также дальнейшее погружение в исследование метода минимизации байесовского инвариантного риска, исследование ограничений и слабых мест этого подхода, создание более эффективной модели среды с точки зрения акустики и лингвистики.
 


Новости партнеров

В России и мире

5 знаков Зодиака, которые отталкивают людей и заставляют их чувствовать себя виноватыми
Удивляются даже врачи: почему костный бульон называют «источником вечной молодости»
Признаки женщины, которая запросто согласится на интим без обязательств хоть с первым встречным
Как омолодить печень на несколько лет: следуйте этим 4 правилам, и она вас отблагодарит
Дополнительная строчка расходов может появиться в квитанциях ЖКХ
Мужчины этих 3 знаков Зодиака не женятся раньше 40 лет
Секреты опытных хозяек: зачем класть в цветочные горшки скорлупу грецких орехов?
Как снять зуд от комариных укусов: 3 проверенных метода
Не делите таблетки на части: в каких случаях это может сделать лекарство ядом
Спят и видят страдания своего обидчика: какие 4 знака Зодиака самые мстительные и злопамятные?