Konan BI는 정형·비정형 빅데이터에 대한 비즈니스 인텔리전스(BI) 분석 툴입니다.
스튜디오에서 단계별 전처리로 손쉬운 데이터 준비가 가능하고, 대화식 쿼리와 분석 모델로 편리한 분석이 제공됩니다.

Konan BI를 사용하는 이유

신속한 대응

고객의소리(VOC) 분석을 통해 기간별, 지역별, 카테고리별로 주요 이슈를 제공하여 고객 민원에 대한 확인과 대응을 신속하게 할 수 있습니다. (소비자, 공공 분야)

줄어드는 비용

수작업으로 오랜 시간을 들여 상품 데이터를 분류했던 것을 내부 상품 데이터를 매핑하여 상품 카테고리를 자동으로 분류함으로써 노동력과 비용을 절감할 수 있습니다. (온라인 쇼핑 분야)

늘어나는 매출

대용량의 거래 로그를 분석하여 정형 분석으로는 잡히지 않던 고객 프로파일 데이터를 구축하여 고객 맞춤형 상품과 서비스를 추천하고 마케팅에 활용함으로써 매출을 증대시킬 수 있습니다. (금융 분야)

숨어있는 결함의 탐지

제조불량, A/S 로그로부터 불량원인, 불량증상 등을 이슈분석, 패턴분석을 통해 시각화된 분석 결과를 제공받아 증상별 대처방안, 불량의 원인 분석에 의해 숨어있는 결함을 탐지하여 개선함으로써 제품의 불량률을 낮출 수 있습니다. (제조 분야)

가벼워지는 업무 부하

콜센터에서는 전화 상담 데이터로부터 상담 유형을 분류하고 제품명, 문의, 조치에 대한 분석 결과를 생성해 다시 상담 기본 데이터로 활용함으로써 신속한 응답이 가능해져 상담원의 업무 부하를 줄일 수 있습니다. (소비자 상담 업무)

예측 못한 부작용의 최소화

의료 관련 논문을 분석하여 치료 방법에 따른 부작용 예측 모델을 구현함으로써 치료 중 발생될만한 부작용을 최소화할 수 있으며, 의료 서비스 품질 향상과 신뢰도를 가질 수 있습니다. (의료 분야)

낮아지는 취소·반품률

취소/반품 상품평에 대한 텍스트 분석을 통해서 상품의 문제를 조기에 감지하여 적시에 조치를 취함으로써 고객 불만을 최소화하고 취소/반품을 줄일 수 있습니다. (유통 분야)

보이지 않는 위기의 감지

언론 기사, 소셜미디어 등에 기업에 관한 부정적 버즈가 유포되는 것을 초기에 감지해 대응할 수 있게 함으로써 보이지 않는 위기를 예방할 수 있다. (위기관리 업무)

장점

풍부한 비정형 데이터 분석 기능

현장 데이터의 상당 부분은 비정형 데이터입니다. Konan BI는 비정형 데이터 분석에 탁월한 분석 도구입니다. 업무 문서, 부품 매뉴얼, 사규, 규정, 게시글, 상담기록, 소비자 후기, 서적, 논문, 대본, 정비 일지, 뉴스, 이미지내 문자 등 일반 정형 분석 도구에서는 잘 다루지 못하는 각종 비정형 데이터에 대해서 풍부한 분석 기능을 제공합니다.

쉽고 직관적인
전처리 기능

현장 데이터는 정해진 형식으로 구조화되어 있지 않습니다. 때문에 먼저 분석에 적합한 형태로 변환시키는 전처리를 거칩니다. 그러나 데이터 분석은 8할이 전처리라고 하듯 전처리 과정 자체는 정형화 하기 어렵고 난이도가 높은 작업입니다.
Konan BI는 단계별로 잘 정의된 직관적인 전처리 프로세스를 제공합니다. 데이터의 가져오기·병합·정제는 물론 추출·변환까지 전 범위의 전처리 기능을 GUI를 통해 제공합니다. 분석 데이터의 준비가 쉽고 간편해 집니다.

쿼리를 통한
탐색적 데이터 분석

Konan BI는 단순한 시각화 툴이 아닙니다. 이것은 완전한 대화식 쿼리 엔진입니다. 쿼리 조건을 수정해 가며 검색과 분석을 반복해 점차적으로 인사이트에 접근하는 탐색적 데이터 분석(EDA)에 가장 적합한 도구입니다.

진정한
빅데이터 분석 능력

Konan BI는 180억건 문서에 대한 분석 레퍼런스를 보유한 진정한 의미의 빅데이터 분석 엔진입니다. 수억건의 업무 문서, 수십억건의 고객 의견, 수십년간 누적된 시계열 데이터 등 일반 분석 툴로는 처리 불가능한 대량의 데이터도 스케일아웃 기반 분산 아키텍처를 통해 분석이 가능합니다.

딥러닝
인공지능 모델에 의한
심층 의미 분석

형태소분석으로 대표되는 전통적 규칙 기반 알고리즘으로도 이슈어, 연관어 같은 기본 키워드 통계 분석은 가능합니다. 그러나 글에 내포된 감정, 글의 주제 파악, 유사한 내용의 문서 판별 등 문맥에 따른 미세한 의미 차이까지 분석하기에 전통적 방법은 한계가 있습니다.
Konan BI는 딥러닝 인공지능 모델을 탑재해 글에 내재된 깊은 의미까지 분석이 가능한 심층 의미 분석 엔진입니다. 문서 내용에 따른 주제별 분류, 섬세한 감정 분석, 의미역 분석에 의한 자동 요약, 기계독해 기반 질의-응답, 의미 키워드 태깅 등 전통적 방법으로는 제공하기 어렵고 사람이 하기엔 너무 많은 인력과 시간이 소요되는 대량의 지능적 문서 분석 작업에 탁월한 효과를 보입니다.

커스텀 분석
프로그래밍 언어
지원

기성 분석 기능만으로는 충족이 안되는 커스텀 분석 니즈가 있을 수 있습니다. 이를 위해 데이터를 구조화된 형식으로 내려 받은 후 R, Pandas 또는 그밖의 분석 도구로 가져가 별도의 ETL 및 코딩을 거쳐야 한다면, 불편하기도 하고 두번 작업을 하는 셈이어서 시간과 비용이 더 들 수밖에 없습니다.
Konan BI는 커스텀 분석을 위한 자체 프로그래밍 언어 K를 지원합니다. 코드는 간단하고 실행은 즉시 됩니다. 커스텀 분석이 빠르고 간편해 집니다.

분석 모델의
구독 서비스

Konan BI의 구독을 통해 새로 출시되는 모델을 지속적으로 추가 서비스 받으실 수 있습니다. 모델들은 미리 학습되어 있어 별도의 훈련 없이 업데이트 받는 즉시 실행 가능합니다. Pytorch 설치, Python 코딩 등 부가적 설치나 추가 작업도 필요 없습니다. 모델들은 Konan BI에 내재된 가상머신과 뉴럴넷 머신에서 직접 실행이 됩니다.

특징

데이터 커넥터

각종 데이터 저장소로부터 분석 대상이 되는 원천 데이터를 가져옵니다. 원천 데이터는 MS엑셀, CSV, 워드 같은 문서 파일이나 데이터베이스에 있는 데이터 레코드일 수 있습니다.

파일에 포함되어 있는 텍스트를 추출하여 가져옵니다. 지원하는 파일 포맷은 아래와 같습니다.

  • · 압축 포맷: Zip, Tar, Gzip, BZIP, Alzip, 7zip, RAR
  • · txt, rtf, html, xml, mht, eml
  • · pdf
  • · MS 오피스: word, excel, powerpoint
  • · hwp, 한셀, 한쇼
  • · Openoffice: word, calc, impress
  • · MS outlook: msg, PST
  • · iWork: keynote, pages, numbers

MS 엑셀이나 CSV 파일에 있는 텍스트 데이터를 가져옵니다. GUI 상에서 가져올 영역을 선택할 수 있습니다.

다양한 DBMS로부터 데이터를 가져올 수 있습니다. 분석 엔진 자체의 데이터도 가져올 수 있습니다.

지원하는 DBMS:
Oracle, MySQL, MariaDB, Microsoft SQL Server, DB2, Altibase, CUBRID, Tibero, Informix, PostgreSQL

사용자가 데이터를 직접 입력하거나 붙여 넣기한 데이터도 사용 가능합니다.

기계 학습에 바로 사용할 수 있는 샘플 데이터를 제공합니다.

데이터 정제

분석 대상 데이터의 레코드에는 널(NULL)값인 필드가 있을 수 있고, 유효하지 않은 타입의 데이터도 있습니다. 분석 도중 오류를 방지하고, 분석 목적에 맞게 데이터를 정제할 수 있는 기능을 제공합니다.

NULL 값을 그냥 둘 수도 있고, 해당 NULL값을 포함하는 레코드 전체를 삭제하거나, NULL값을 기본값으로 대체할 수 있습니다.

숫자 타입 값에 대해서 최소, 최대 범위를 지정할 수 있습니다. 범위를 벗어나는 값에 대해서는 최소 또는 최댓값으로 치환할 수 있습니다.

데이터 병합

두 개 이상의 데이터 소스에 데이터들이 나누어져 들어 있을 수 있습니다. 데이터가 정규화(normalization)되어 있을 때 각 데이터를 반-정규화(de-normalization)시켜서 단일 분석 데이터 뷰(view)로 만들 수 있습니다. 조인(join)이나 병합(union) 등의 다양한 뷰 구성 방식을 제공합니다.

테이블 간에 조인키(join key)를 지정하여 하나의 뷰 데이터로 만들 수 있습니다. 지원하는 조인 방식은 inner join, left/right join, full outer join 입니다.

수평 분할된 레코드들을 하나의 테이블 데이터로 합칠 수 있습니다.

데이터 변환

실질적인 분석에 앞서 대상 데이터 필드의 타입을 지정하고, 기존 필드 값을 바탕으로 분석에 필요한 새로운 필드를 추가할 수 있습니다. 필드에서 키워드·개체명 등을 추출할 수 있는 내장함수와 기계학습 모델 함수들을 제공합니다. 사용자 정의 함수 기능을 이용해서 추출·변환 작업을 수행할 수도 있습니다.

빠르고 정확한 한글 형태소분석을 기반으로 키워드를 추출합니다.
복합명사 레벨, 키워드 길이 제한, 품사에 따른 배제 옵션 등 다양한 추출 옵션을 제공합니다.

형태소 단위가 아닌 문자 단위의 키워드, 즉 n-gram 키워드를 반환합니다. 1~5 사이의 최대 글자수를 지정할 수 있습니다.

문맥의 편향성(polarity)을 바탕으로 어떤 사안에 대해 긍정적인지 부정적인지 또는 희로애락과 같은 감정 등을 분석합니다. 딥러닝 기반과 룰기반 모델을 제공하고 있습니다.

텍스트에서 언급된 인명, 단체, 장소 등의 이름을 가진 개체(named entity)를 인식합니다. 학습한 개체 종류 및 학습데이터에 따라 다양한 딥러닝 모델을 제공합니다.

문서를 분석하여 중요한 문장을 추출하거나 축약된 형태의 문장을 생성합니다. 딥러닝, 머신러닝, 룰기반 모델을 제공합니다.

텍스트에 불법, 광고, 음란성 내용이 포함된 경우 스팸으로 걸러냅니다.

분류 알고리즘을 이용하여 뉴스를 주제에 따라 자동 분류합니다.

문맥을 바탕으로 방송심의에 적합한지 분석합니다. 딥러닝과 부스팅 기반의 앙상블 모델을 제공합니다.

딥러닝 모델로 주어진 문장들을 분석하여 코사인 유사도 (Cosine Similarity)기반의 유사 문장 검색기능을 제공합니다.

딥러닝 기반의 띄어쓰기 모델을 제공합니다.

문장에서 술어-논항 관계에 적합한 의미역을 결정합니다(Semantic Role Labeling).

텍스트에서 시맨틱 룰에 매칭되는 시맨틱 키워드를 추출합니다. 시맨틱 키워드는 (주제,속성,값)의 트리플 형태입니다.

텍스트에서 시간(time),장소(place),상황(occasion)별 키워드를 추출합니다. 추출된 키워드로 TPO 마케팅에 활용할 수 있습니다.

텍스트에서 형용 키워드와 키워드가 속한 형용 카테고리를 추출해 줍니다. 형용 카테고리에는 감각, 척도, 감정, 양태 등이 있습니다.

뉴스 등의 텍스트로부터 화자(speaker)와 발언(statement)을 추출합니다.
특정 이슈를 자주 언급한 화자(=전문가)를 확인할 수 있습니다.

데이터 적재

변환 단계에서 지정된 스키마에 따라서 데이터를 분석 엔진으로 적재합니다. 이때 바로 적재를 즉시 실행할 수도 있고 스케줄을 지정해서 정해진 시간에 적재를 할 수도 있습니다.

"적용" 버튼을 누르는 즉시 데이터 적재를 실행합니다.

매 시간 주기(e.g. "30분마다")나, 매일/매주/매월 단위로 적재 시간을 예약해서 실행할 수 있습니다.

데이터 분석

기존 보고서를 수정하는 경우든 처음부터 시작하는 경우든, 데이터 스튜디오는 데이터를 매력적인 스토리로 구성해 관심을 이끌어내고 설득하는 데 도움이 되는 시각화 및 맞춤설정 솔루션을 제공합니다.

복잡한 쿼리 구문을 직접 입력하지 않아도 됩니다. 쿼리 빌더 UI를 통해 데이터로부터 유용한 값들을 추출하여 그리드(Grid)에 바로 출력해 줍니다.

그리드에 출력된 값들에 대해 합계, 평균, 최대, 최소, 분산, 표준편차, t-검정, ANOVA 등의 통계 함수들을 적용할 수 있는 기능을 제공합니다.

데이터변환 단계로 다시 돌아가지 않고도 추가로 필드를 생성하는 등의 즉시(on-the-fly) 변환 기능을 제공합니다.

바차트, 라인차트, 파이차트, 도넛차트, 트리맵, 스캐터플롯, 클라우드차트, 덴드로그램, 네트웍차트, 레이더차트, GIS맵 등 데이터 표현에 적절한 차트를 선택하여 다양하게 표현할 수 있게 지원합니다.

보고서 생성과 공유

부가적인 이메일 보고가 필요하지 않습니다. 분석 보고서를 조직 내의 동료들과 편리하게 공유할 수 있는 기능을 제공합니다.

보고서는 기본적으로 작성자 본인만 열람 가능합니다. 추가로 열람할 수 있는 권한을 부여하거나 회수할 수 있습니다.

레퍼런스

기술지원/문의

Konan BI 사용 중에 발생하는 애로 사항, 교육/컨설팅 지원 등에 대해
문의하시려면 아래 이메일로 연락해 주세요.