Компьютер научился отличать сказку от были
Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов, а именно рассказов. Алгоритм, придуманный авторами научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали.
Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта National Public Radio, и 400 случайных рассказов из базы электронной библиотеки проекта "Гутенберг". Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века.
Для новостных заметок точность угадывания составила 69,1 процента с погрешностью 1,22 процента, а для рассказов - 73,8 процента с погрешностью 5,15 процента.
В Николаеве прошел концерт для матерей, воспитывающих детей с инвалидностью: фото и видео мероприятия
Экс-главе Офиса президента Ермаку продолжают избирать меру пресечения (трансляция)
В Николаеве на реке Ингул поселилась стая лебедей: фото и видео птиц
Андрею Ермаку избирают меру пресечения в ВАКС: трансляция заседания
В Канаде мотоцикл после ДТП оказался на перекладине светофора: фото и видео последствий
Экс-главе ОП Ермаку вручили подозрение
Мэр Николаева прокомментировал задержание начальницы городского управления спорта
Видел я этих профессионалов: мэр после скандального видео раскритиковал сотрудников «Николаевводоканала»
Палитра эмоций в музыке: для николаевцев выступил Дмитрий Смирнов (фото, видео)













