Повышение качества данных в контексте современных аналитических технологий

Владимир Николаевич Любицын

Аннотация


Производится идентификация понятия «качество данных» применительно к информационно-аналитическим системам. Осуществляется деление методов повышения качества данных на группы и виды. Делается акцент на оценке качества данных как ключевом звене IT-технологий, связанных с управлением качеством данных. С целью формирования эффективной методики оценки данных предлагается классификация этапов процесса оценки качества данных и проводится их краткий сравнительный анализ, а также систематизация проблем качества данных на основе трех уровней с указанием для каждого из них специфики, включая соответствующие факторы, проявления и места борьбы с выявленными проблемами.

Ключевые слова


информационно-аналитическая система; хранилище данных; качество данных; ETL-процесс; очистка данных; предобработка данных; обогащение данных; методика оценки качества данных

Полный текст:

PDF

Литература


Ханк, Д.Э. Бизнес-прогнозирование: пер. с англ. / Д.Э. Ханк, Д.У. Уичерн, А.Д. Райтс. – 7-е изд. – М.: Издат. дом «Вильямс», 2003. – 651 с.

Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян и др. – 2-е изд., перераб. и доп. – СПб.: БХВ-Петербург, 2007. – 384 с.

Паклин, Н.Б. Бизнес-аналитика: от данных к знаниям / Н.Б. Паклин. – СПб.: Питер, 2009. – 624 с.

Прикладная информатика: учеб. пособие / под ред. В.Н. Волковой и В.Н. Юрьева. – М.: Финансы и статистика: Инфра-М, 2008. – 768 с.

Ревякин, С.А. О важности качественной информации для принятия управленческих решений. – http://www.global-katalog.ru/cncat_jump.php?13146


Ссылки

  • На текущий момент ссылки отсутствуют.