[주말판] 지금 모든 회사들이 육성해야 하는 건 ‘데이터 리터러시’
나라가 본격적인 산업화와 근대화를 겪을 무렵 문맹 퇴치 운동이 대대적으로 벌어졌었다. 데이터가 폭발적으로 늘어나고 활용되는 데이터 경제 시대의 초입에서 다시 한 번 문맹 퇴치 운동에 대한 이야기가 나오고 있다. 다만 여기에서의 문맹은 글자를 못 읽는 사람이 아니라 데이터를 잘 모르는 사람들을 말한다.
데이터를 수집하고 처리하는 인류의 능력은 지난 20년 동안 기하급수적으로 발전했다. 그러한 급격한 발전의 중심에는 클라우드 기술이 있다. 이제 기업들은 큰 용량의 정보도 쉽게 저장하고, 언제 어디서나 열람하거나 처리할 수 있다. 어느 새 데이터라는 거, 누구나 손끝으로 자유롭게 다룰 줄 아는 흔한 것이 되었다. 그런데 아직 데이터를 다 정복했다고 말하기는 어렵다. 데이터는 물론 데이터를 다룰 수 있게 해 주는 기술들에 대한 일반 대중의 이해도가 높다고 말하기 어렵기 때문이다. 즉 데이터 리터러시라는 것이 충분한 수준에 이르지 않았다는 뜻이다.
데이터 리터러시란 무엇인가?
데이터를 적극적으로 활용하는 조직들에는 데이터 과학자라는 사람들이 있다. 이들은 365일 내내 데이터를 씹고 뜯고 맛본다. 하지만 이런 데이터 과학자가 아무리 많아도 조직 전체가 데이터 리터러시를 갖추고 있다고 말하기 힘들 수 있다. 왜냐하면 진정한 데이터 리터러시는 데이터 과학자가 아닌 직무의 일반 임직원들 모두에게 요구되는 소양이기 때문이다.
사실 지금까지는 그렇지 않았는데, 데이터의 중요도가 올라가면 올라갈수록 누구나 데이터에 능숙해져야 하는 상황이 되어 가고 있다. 생각해 보면 이는 낯선 현상이 아니다. 90년대 중후반만 하더라도 스프레드시트를 사용할 줄 아는 것이 특별한 기술이었는데 지금은 어떤가? 직무와 직급에 상관없이 거의 모든 사람이 기본적인 기능은 다룰 줄 안다.
조직 내 데이터 리터러시 수준을 높이기 위해서는 당연히 교육부터 시작이 되어야 한다. 하지만 일괄적인 교육은 그리 큰 도움이 되지 않는다. 각 사람이 어느 정도 수준의 데이터 교육을 필요로 하는지를 파악하는 게 중요하다. 이 때 피교육자의 맡은 일이 어떤 것인지는 크게 상관이 없다. 순수하게 데이터에 대해 얼마나 이해하고 있는지에 따라 교육 수준을 정해야 하는데, 1) 이해, 2) 접근, 3) 분석의 항목을 가지고 평가할 수 있다. 조금 더 풀어서 설명하겠다.
1) 이해 : 오늘 날의 디지털 환경에서는 모두가 일정 수준의 ‘데이터 이해도’를 갖춰야 한다. 데이터가 최초 어디에서 생성되었고, 어디에 어떻게 보관해야 안전하며, 어떤 과정으로 어떤 가치를 갖게 되는지를 알아야 한다는 것이다. 이것이 데이터란 것을 다룰 때 기본적으로 생각해야 하는 내용이다. 그리고 이런 내용들을 파악하도록 해 주는 도구들에 대한 이해도도 갖춰야 한다. 스프레드시트, 표, 시각화 등이 대표적이다. 한 마디로 데이터에 대한 접근 방식과 태도가 일정 수준에 도달해야 한다는 것인데, 이는 마치 현대 사회에서 활동하려면 최소한 글을 읽을 줄 아는 것과 비슷한 수준의 전제 조건이다.
2) 접근 : 데이터를 보유하고 있다는 건 대단한 일이다. 하지만 적절한 사람들이 그 데이터에 접근하여 활용함으로써 또 다른 가치를 만드는 게 아니라면 그 대단한 일은 아무 것도 아닌 게 되어버린다. 사용자들은 필요한 일을 하기 위해 어떤 데이터에 접근해야 하는지, 그 데이터가 어떤 방식으로 구조화 되어 있고, 어떤 도구를 활용해야 안전하게 데이터로부터 가치를 뽑아낼 수 있는지를 이해해야 한다.
3) 분석 : 데이터 리터러시의 가장 이상적인 형태라면 모든 사람이 비판적 사고로 데이터를 학습하고, 가장 알맞은 통찰을 끌어내는 것이라고 할 수 있다. 이 때 약간의 통계학적 혹은 분석학적 방법론을 갖춰둔다면 더없이 좋을 수도 있다. 하지만 이는 말 그대로 이상론에 불과하다. 누구나 다 그 정도 수준에 도달하리라고 기대하기는 힘들다. 그렇다면 그런 수준에 먼저 도달한 사람들이 통찰에 다다르게 된 경과를 투명하고 쉽게 설명할 수 있어야 한다. 그걸 듣고 나머지 사람들이 타당하다거나 이상하다는 생각을 할 수 있으면 충분하다. 분석의 능력이 필요하지만 모두가 분석가가 될 필요는 없으니, 분석가의 설명을 듣고 이해할 정도면 된다는 것이다.
데이터 거버넌스의 필요성
데이터 교육을 충분히 제공해 조직 전체가 ‘데이터 리터러시’를 갖추게 되었다고 하자. 즉 모든 사람이 일정 수준으로 데이터를 이해하고 있고, 다룰 줄 알며, 분석까지 가능하다고 치자. 그렇다면 모두가 모든 데이터에 접근할 수 있어야 할까? 정답은 ‘아니오’이다. 아무리 모든 사람이 데이터 과학자 수준의 능력을 갖췄다 하더라도, 일단 현대 사회에서 생성되고 처리되는 데이터의 양 자체가 너무나 많다. 그 출처도 지나치게 다양하다. 그래서 보안과 프라이버시를 생각하지 않을 수 없다. 아무리 구성원 하나하나가 뛰어나도 조직 차원에서 혹은 중앙에서 담당해야 할 통제와 통솔의 몫이라는 게 존재한다.
그런 맥락에서 튀어나오는 개념이 바로 데이터 거버넌스다. 데이터 거버넌스란, 한 조직이 어떤 방식으로 데이터를 관리하고, 활용하고, 보호하는지를 결정하고 적용하는 것을 말한다. 데이터는 생성돼서 폐기되기까지의 모든 과정에서 통제와 관리가 필요한 자산이다. 생성될 때, 수집될 때, 저장될 때, 처리할 때, 활용할 때, 공개될 때, 폐기될 때 모두 누군가의 간섭과 제어가 필요하다. 그리고 이를 다루는 법과 규정들이 대부분 국가에서 존재하거나, 생겨나는 중이다. 회사 차원에서 이런 부분의 정보를 부지런히 습득하고 최신화 하는 게 필요하다.
데이터 거버넌스를 확립하려면 다음 다섯 가지가 중요하다.
1) 데이터 감독을 위한 내부 구조가 갖춰져야 한다. 아마 이 말 자체가 어렵다고 느끼는 사람이 있을 텐데, 주로 조직 전체적으로는 데이터 거버넌스 정책, 표준, 절차, 평가 방법 등을 규정하고, 각 부서에서는 중앙에서 규정한 내용을 부서 상황과 특성에 맞게 적용할 방법을 구체적으로 찾아내 도입하는 것을 말한다. 이것이 각 개인별로 수립되는 경우도 점점 늘어나고 있다.
2) 데이터가 어떤 상태로, 어디에 저장되어야 하는지를 분명하게 지정해야 한다. 이는 보안과 관련된 항목이기도 하다. 많은 기업들이 이른 바 ‘데이터 레이크’라고 하는 것에 데이터를 부어놓는데, 보안을 강화하려면 이 데이터 레이크에 어떤 방식으로, 어떤 사람이, 어떤 조건에서 접근할 수 있는지 결정해야 하고, 암호화 여부, 전송 가능성 같은 것도 정의되는 게 바람직하다. 이 내용은 각 지역과 나라마다 이미 정해진 규정이 있을 수 있으니 관련 정보를 미리 접하는 게 도움이 될 것이다.
3) 데이터 접근 가능한 사람과 권한을 명확히 정의한다. 모든 사람이 모든 데이터를 필요로 하는 건 아니다. 이는 사장과 회장에게도 적용되는 이야기다. 각자의 업무를 수행하기 위해 필요한 데이터가 정해져 있고, 딱 그만큼만 허용해주는 것이 중요하다. 주로 역할과 근무지에 따라 접근할 수 있는 데이터를 지정하거나, 맡고 있는 프로젝트에 따라 고려되는 게 보통이다. 중요한 건 이러한 구분이 주기적으로 검토되고 변경되어야 한다는 것이다. 또, 민감한 정보에 접근하려면 누구나 여러 겹의 인증과 승인을 거쳐야 하도록 구조를 짜는 것도 필요하다.
4) 목적성과 방법의 적절성을 평가해야 한다. 누군가에게 데이터 접근 권한을 주려면 그 사람의 직무와 책임도 알아야 하지만 먼저 데이터가 어떤 목적으로 활용되는지도 알아야 한다는 뜻이다. 분석과 평가를 위한 것인지, 제품을 개발하기 위한 것인지, 폐기를 위한 것인지, 고객 응대를 위한 것인지 알고 있어야 한다. 회사 대표가 특정 직원의 개인정보에 접근할 수 있도록 요구하는 사람에게 목적을 물었더니 폐기를 하려 한다고 답하면, 다시 한 번 생각해봐야 한다는 뜻이다. 그리고 이런 걸 묻고 답하는 과정에서 올바른 방향을 제안할 수도 있고, 그것이 교육 효과를 창출할 수도 있다.
5) 모든 임직원이 데이터 담당자가 되어야 한다. 위에 적은 것처럼 정책과 표준, 내부 구조를 정하는 모든 과정이 전부 중요하다. 반드시 있어야 할 것들이다. 하지만 그러한 표준과 내부 구조와 정책을 직접 현장에서 지켜내고 살아야 하는 건 사람들이다. 내부 임직원들이 ‘데이터와 나는 상관없어’라고 느끼면 아무리 단단한 구조에서라도 구멍이 생긴다. 데이터의 관리가 모두의 몫이라는 걸 인지시키는 것이 중요하다.
데이터 리터러시의 가치
임직원들이 데이터를 이해하지 못하고, 접근하지도 못하며, 활용하지도 못한다면, 세상 모든 데이터를 다 가지고 있다해도 아무런 소용이 없다. 너무 당연한 얘기라고? 그런데 아직까지도 너무나 많은 조직들에서 데이터가 사실상 아무 쓸모를 찾지 못해 그냥 버려진다. 수집하고 저장하는 건 잘 하는데, 그걸 이해하고, 안전하게 접근/분석/활용하게 하려는 노력은 간과되고 있다. 데이터가 페타바이트 단위로 만들어지는 때라지만 큰 의미를 갖지 못하는 게 바로 이 때문이다.
데이터 리터러시를 키운다는 건 데이터의 가치를 살리는 방법을 빠르게 익힌다는 뜻이 된다. 버려진 데이터들 속에서 남다른 통찰을 찾아내고, 이를 바탕으로 새로운 서비스와 제품을 개발하여 가치를 창출한다는 뜻도 된다. 그러므로 데이터 리터러시는 곧 데이터를 통한 수익 상승과도 직결된 전략이라 볼 수 있다. 데이터 리터러시를 모든 임직원들에게 강조해야 하는 건 바로 이 점 때문이다.
이 게시글이 문제가 될 시, 삭제하겠습니다
댓글 없음:
참고: 블로그의 회원만 댓글을 작성할 수 있습니다.