Как не утонуть в data lake?

Не так давно мы упоминали тренды этого года в сфере digital. Data lake – один из них. Так вот дабы быть на гребне волны остановимся на этом понятии отдельно.

В управлении данными data lake уже уверенно завоевывает позиции, как эффективный инструмент менеджмента данных.

Что же это такое?

Data lake – это платформа для хранения и управления данными разного формата, которая позволяет искать новые способы применения существующих данных.

Звучит, как штука определенно удобная. Но перед тем, как нырять в омут с головой, обратите внимание на 4 шага, которые стоит совершить.

Шаг 1. Четкое определение целей.

Америку никто не открывает, да. Но все-таки перед тем, как научиться ходить, мы должны понять как ползать. Лучше всего четко выбрать 2-3 цели, которые будут основополагающими во время принятия любого бизнес-решения. Начиная работу с data lake возьмите в оборот 2-3 кейса, на которых вы будете учиться работать в новой плоскости. Это может быть кейс, который ориентирован на быстрый рост показателя ROI, задействующий только одно подразделение компании. Другой кейс может быть побольше и охватывать несколько юнитов.

Добавление большого количества кейсов на первоначальной стадии может привести к появлению осложнений и проблем, которые замедлят процесс принятия решения с помощью data lake.

Шаг 2. Архитектура.

Мы постоянно повторяем, что big data растет и развивается каждую секунду. Под такой непостоянный продукт очень важно разработать изначально простую структуру хранения, которая будет отвечать запросам вашего бизнеса.

Вопросы, которыми стоит задаться при выборе конструктора платформы:

  • Какой тип хранения: стационарный или в облаке;
  • Если стационарный, то какое железо нужно для этого;
  • Система будет открытого или закрытого доступа;
  • Что на счет защитного софта.

И это только верхушка айсберга вопросов. Потому неплохо будет обратиться к специалистам по разработке data lake или полностью отдать это дело на аутсорс.

Шаг 3. Ресурсы.

Оформлением и наполнением data lake все не закончится, вы же понимаете. Дальше эту машину надо двигать, а для этого нужны ресурсы. И тут у вас есть несколько опций:

  • Инвестиции в тренинги своего персонала. Научите их поддерживать, управлять и стать просто-таки перунами этого озера. Хороший перспективный выбор, особенно если вы не хотите распространять свою инсайдерскую информацию направо и налево.
  • Нанять специалиста по работе с big data. Он сможет направить и будет спасателем Малибу все время, пока вы будете учиться работать в озере. Такой специалист будет саппортить до тех пор, пока вы не возьмете на себя полный контроль над ситуацией. Удобно, ведь поддержка практически 24/7 – это всегда надежнее. Но и затратненько.  
  • Нанять целую группу специалистов, которые будут мейнтейнить весь процесс работы с big data и параллельно учить ваш персонал. Еще более надежно и затратно.
  • Аутсорсинг – все мы любим смотреть, как работают другие, правда?

Все варианты по-своему хороши, но не универсальны. Всегда учитывайте свои показатели ROI перед тем, как принять решение, как вариант применить на своем бизнесе. К примеру, сколь не затратным может выглядеть первый вариант изначально, не забываем о постоянном развитии сферы. Так что и тренинги для персонала нужно будет проводить с появлением каждой новинки в сфере, иначе пользы от озера не будет.

Возможности безграничны в начале заплыва, так что наслаждайтесь.

Шаг 4. Данные.

Их много, они разные, они необъятные. Выбрав несколько кейсов на первое время, вы уже сократите круг необходимой информации. Потом отсеется та, что не подходит по структуре и ресурсам выбранным для data lake. Однако, особо данными не разбрасывайтесь, все-таки помните о качестве.

Ну все, теперь мы со спокойной душой отпускаем вас в свободное плаванье. Swim safe!

Источник: www.ngdata.com

Facebook Comment

Еще не знаете о MAD?

Давайте знакомиться! Мы скинем вам интро-материалы о нас и Data-продуктах. Обещаем - никакого спама ;)