[시선뉴스 박진아, 정지원 / 디자인 이연선] 빨간색 치마가 필요했던 A 씨. 선글라스가 필요했던 B 씨. 보스턴백을 찾고 있었던 C 씨까지. 이들은 모두 비슷한 경험을 했다. 모두 인터넷을 사용할 때면 과거 그들이 검색했던 상품과 유사한 상품이 광고로 보여 지는 것이다.

어떻게 이런 일이 가능한 것일까? 그 이유는 바로 ‘데이터마이닝’ 때문이다. 데이터마이닝은 ‘데이터’와 채굴을 뜻하는 ‘마이닝(mining)’을 합친 말로 많은 양의 데이터 속에서 유용한 정보를 캐내어 이용하는 것을 말한다. 여기서 ‘마이닝’이라는 말이 들어간 이유는 데이터 속에서 정보를 추출하는 과정이 탄광에서 광물을 캐거나 대륙붕에서 원유를 채굴하는 작업처럼 숨겨져 있던 유용한 것을 찾아낸다는 유사점 때문이다.

데이터마이닝은 다른 말로 KDD(Knowledge-discovery in Databases)라고도 하는데, 영어의 의미 그대로 ‘데이터베이스 속의 지식 발견’이라는 뜻이다.

고객의 패턴과 성향을 어렵지 않게 알 수 있는 이유 때문에 데이터마이닝은 기업의 마케팅 기술에서 핵심으로 꼽힌다. 축적된 대량의 데이터를 분석해 일정한 규칙성을 찾아내어 기업 경영 활동의 중요한 의사 결정에 활용할 수 있기 때문이다.

예를 들어 백화점에서는 주말에 어떤 상품들이 잘 팔리는지 또 상품 간에는 어떤 상관관계가 있는지를 파악해 고객 맞춤형 상품을 개발할 수 있다. 이뿐만이 아니다. 통계학의 분석방법을 기반으로 한 데이터마이닝 기술은 의학 분야에서 유전체 데이터를 통해 질병을 예방하고 진단, 처방하는 것을 가능하게 하기도 한다. 또, 금융업에서는 과거 사기행위로 판명된 신용카드 거래와 행동 패턴을 분석하여 사기 적발 시스템을 구축할 수 있게 도와준다.

하지만 데이터마이닝 항상 올바른 결과를 도출해 내는 것은 아니다. 의미 있는 결과를 산출하기 위해서는 전제되어야 할 조건이 있는데, 그 중 가장 중요한 것은 분석될 자료의 신뢰도가 높아야 하며 양이 충분해야 한다는 것이다. 하지만 지나치게 많은 자료는 오히려 데이터마이닝 기술의 예견 능력을 떨어뜨릴 수 있다는 점도 유의해야 한다.

또 자료를 기반으로 현상을 분석하고 개선하고자 하는 기술이기 때문에 자료에 의존해 자칫 자료가 현실을 충분히 반영하지 못하면, 도출해내고자 하는 결과에서 벗어나는 결과를 얻을 수도 있다. 즉 현실을 반영한 결과여야 한다는 뜻이다.

그러나 이렇게 보완되어야 할 점이 있음에도 불구하고 데이터마이닝의 중요성은 점점 더 부각되고 있다. 데이터의 형태와 범위가 다양해지고 규모가 방대해짐에 따라 정보를 분별력 있게 찾아내고 활용하는 능력이 요구되기 때문이다.

정보가 가치의 대부분을 차지하게 될 시대를 맞이하고 있는 우리에게 데이터마이닝은 마케팅 기법 그 이상의 의미를 지닌다. 빅데이터를 관리할 수 있는 기술로도 주목받고 있는 데이터마이닝. 인공지능과 로봇기술 등 첨단분야의 여러 기술과도 결합한다면 한층 더 성장한 기술이 될 것으로 보인다. 온라인 속이 아닌 오프라인 상에서도 나에게 맞춤의 광고와 삶의 필요충족이 완성되는 것. 아마도 발전된 데이터마이닝이 있다면 가능할 수 있지 않을까. 

SNS 기사보내기