Разработка фреймворка автоматического анализа текста на русском языке и его применение для решения прикладных задач
- Programming / Tools
- Voice Interfaces / Natural lang. processing
- Принят
14 ноября, 13:30
Room III|III зал
Добавить в gCal Добавить в iCal/Outlook
Обсудить доклад
Применение лингвистического анализа, основанного на использовании накопленного опыта в области компьютерной лингвистики, позволяет упростить работу с огромными объемами текстовой информации и открывает новые возможности для автоматизации обработки текстовых документов.
Проблема поиска подходящих инструментов, адаптация их для работы с текстами на русском языке и интеграция друг с другом затрудняет их применение в исследовательских целях и делает практически невозможным их использование в прикладных системах, поэтому в докладе предлагается новый разработанный Java-фреймворк с открытым исходным кодом TAWT, предоставляющий удобные готовые инструменты и структуры данных основных этапов анализа текста на русском языке и отвечающий современным требованиям к производительности, надежности, механизмам сборки проектов и т.д.
Демонстрируется применение фреймворка на примере автоматизации некоторых задач при подготовке технической документации, TAWT может быть полезен разработчикам исследовательских инструментов для улучшения качества обработки текстов путем применения методов лингвистического анализа, командам разработки прикладного ПО для реализации новых функций в продуктах и разработчикам автоматизированных средств для сокращения рутинных действий при работе с разного вида документацией.
Екатерина Полицына
Доцент, Московский авиационный институт
Выпускник МАТИ-РГТУ им. К.Э. Циолковского, кафедры “Проектирование вычислительных комплексов”, кандидат технических наук. Более 10 лет опыта разработки программного обеспечения, проектирования систем, управления процессом разработки в ряде компаний. Областью научных исследований на протяжении 14 лет является компьютерная лингвистика, занимается разработкой алгоритмов и инструментов автоматического анализа текстов на русском языке. Участник российских и международных конференций и конкурсов.
Сергей Полицын
Доцент, Московский авиационный институт
Выпускник МАТИ-РГТУ им. К.Э. Циолковского, кафедру “Проектирование вычислительных комплексов”, кандидат технических наук. Более 10 лет опыта разработки программного обеспечения, автоматизации тестирования и управления проектами. Занимается исследованиями в области автоматизированного анализа текста. Участник российских и международных конференций и конкурсов.
Александр Поречный
Аспирант, Московский авиационный институт
Аспирант НИУ МАИ кафедры “Системы интеллектуального мониторинга”. Разработчик серверной части ПО, имеет практический опыт разработки приложений на микросервисной архитектуре и проведения нагрузочного тестирования ПО. Занимается научно-исследовательской деятельностью и разработкой ПО в области компьютерной лингвистики более 3 лет. Участник российских и международных конференций.