Publisher's Synopsis
Нас захлестывает поток данных научных, медицинских, демографических, финансовых, маркетинговых. У людей нет времени на изучение этих данных, поэтому со временем они забываются, отсюда и термин "темные данные". Человеческое внимание стало драгоценным ресурсом. Поэтому мы должны найти способы автоматического анализа данных, автоматической классификации, автоматического обобщения, автоматического обнаружения и определения тенденций, а также автоматического выявления аномалий. Это одна из самых активных и интересных областей в сообществе исследователей баз данных. Исследователи в таких областях, как статистика, визуализация, искусственный интеллект и машинное обучение, вносят свой вклад в эту область темных данных. Широта области затрудняет понимание необычайного прогресса, достигнутого за последние несколько десятилетий. В книге дается краткое введение в концепции темных данных, больших данных и добычи данных с особым акцентом на анализ данных. Затем в ней по главам рассматриваются концепции и методы, лежащие в основе классификации, предсказания, ассоциации и кластеризации.