Дисциплини

3, 4, 5 б Обработка на естествени езици - избираема

Седмичен хорариум 2+0+2
Форма на контрол Изпит

Анотация


Дисциплината „Обработка на естествени езици“ цели запознаване на студентите с приложението на основни методи и алгоритми от машинното обучение за класификация на текст.

Съдържание


В лекциите се разглеждат теми като: езиково моделиране, индексация на документи, редуциране размерността на пространството от признаци, морфологичен анализ, модели на семантично сходство, приложение на основни методи и алгоритми от машинното обучение за класификация на текст, метрики и методи за оценка на качеството на класификация на текст.
По време на упражненията ще бъдат разработвани приложения за решаване на някои типични задачи от областта на обработка на естествени езици като класифициране на документи, анализ на настроения и извличане на мнения, проверка на правопис, откриване на дубликати, разпознаване на имена и на пол.