Подробнее о конференции SmartData:
https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData —
https://jrg.su/RdJwSa
Стандартная практика при работе с аналитическими данными — это предоставление пользователям возможности создавать собственные ETL и ставить их на регулярное выполнение. Если этот процесс не контролировать, то вычислительный кластер, вне зависимости от конкретной технологии, начнет деградировать и комфортное кооперативное обслуживание станет невозможным. Александр рассказывает про испытания, которые преодолевала компания при выстраивании многоцелевой вычислительной платформы на Vertica. В докладе освещены как организационные, так и технологические аспекты достижения «клиентского счастья».
Технологический упор сделан на «дефекты» (неоптимальный дизайн) структур данных и запросов. Эти нюансы объяснены на примере конкретно Vertica, однако являются применимыми также и к другим системам класса MPP.
#etl #vertica