Дисциплини

16 Моделиране и анализ на данни

Седмичен хорариум 2+0+2
Форма на контрол Изпит

Анотация


Дисциплината "Моделиране и анализ на данни" има за цел да даде на студентите от специалност "Компютърни системи и технологии" познания в областта на принципите на изграждане и управление на системи за бизнес информационен мениджмънт. Разглеждат се проблеми на моделирането на данни, включително релационни и дименсионални модели, управление на качеството на данните, организационни аспекти на управлението на ключови данни, архитектура и процеси за интеграция на информация, бизнес анализи, жизнения цикъл на информационните системи, както и се анализират устойчивите трендове в областта. Подчертава се връзката между организационните аспекти на управлението на информационни технологии и техническата реализация на системи за информационен мениджмънт.Дисциплината се основава на предхождащите я дисциплини: "Програмиране и използване на компютри", "Програмни езици", "Бази от данни" и др. Обучението се провежда от специалисти от фирма "ADASTRA" в техни офиси в гр.Варна.

Съдържание


Основни раздели на съдържанието:
• Организационни аспекти и класификация на бизнес приложенията за информационен мениджмънт.
• Въведение в релационното моделиране на данни. Обекти, атрибути, връзки. Ключове. Кардиналост. Супер/суб-типове
• Дименсионално моделиране на данни. Складове с данни (data warehousing). Факти, дименсии и кубове. Бавно променящи се дименсии. Дизайн на факт таблици. Практически примери и индустриали модели.
• Качество на данните. Критерии за качество. Източници на лоши данни. Стратегии за почистване на данни.
• Качество на данните. Методи и софтуер за профилиране.  
• Управление на ключови данни (master data management). Подходи и архитектури за управление на ключови данни. Управление на референтни данни. Организационни процеси за information governance
• Интеграция на данни. Бизнес и техническа обосновка. Подходи към интеграцията на данни. Процеси и архитектура. Extract-Transform-Load - структури от данни и оператори.
• Дизайн на процеси за интеграция на данни. Екстракти, делти и CDC. Трансформация, почистване, и обогатяване.
• Интеграция на данни за факти и дименсии. Зареждане на данни и бързодействие. Интеграция в реално време – проблеми и архитектури. Преглед на софтуера за интеграция.
• Business Intelligence. Анализ на нуждите. Откриване на информация (information discovery). Аналитични модели. Визуализация на информация. Инфографики.              
• Data mining. Алгоритми и типични проблеми.
• Изграждане на информационни системи. Подходи към изграждането на системи за информационен мениджмънт. Процес за разработка на системи. Жизнен цикъл.  
• Big Data. Технологии и архитектури
• Трендове. Internet of Things. Тъмни данни. Cloud computing. Анализ на потоци от данни (data streams). Анализ на сложни събития (complex event management).