[61]빅데이터와 스마트 팩토리의 고도화

[박정수 성균관대 스마트팩토리 융합학과 겸임교수] 제조 산업의 뉴 노멀(New Normal), 새로운 경영 질서는 맞춤 제품과 서비스를 제공하기 위한 스마트팩토리 구현이며, 지속 가능한 제조 역량 고도화의 핵심은 빅 데이터 관리 역량이다. 제조 산업의 고도화를 위한 빅 데이터 기반 의사 결정을 실현시키기 전에 빅 데이터의 범위, 개념 및 특성을 재정립해야 한다. 그것이 빅 데이터에 대한 새로운 시각(視角)이자 고도화의 출발이기 때문이다.

빅데이터를 구성하는 요소의 다양한 정의는 관점(觀點)별로 제품 지향 관점(product-oriented perspectives), 프로세스 지향 관점(process-oriented perspectives), 인지 지향 관점(cognition-oriented perspectives) 및 사회 운동 관점(social movement perspectives), 그리고 별개의 관점(distinct perspectives)으로 분류하여 생각할 수 있다.

제품 중심의 관점은 크기, 속도 및 구조와 관련된 데이터의 속성(attribute)으로 과거 관점에 기초하여 제시된 데이터의 양과 최근의 볼륨을 비교하는 것이다. 즉 계기, 센서, 인터넷 거래, 이메일, 비디오, 클릭 스트림(click streams) 또는 현재와 미래에 이용 가능한 모든 디지털 소스에서 서로 다르게 생성된 크고, 다양하고, 복잡하고, 분산된 데이터 세트를 뜻한다.

게다가, 큰 것은 단지 크기만이 아니다. 데이터가 너무 많거나, 너무 빠르게 이동 중이거나, 사용 가능한 방식으로 구성되지 않았기 때문에 데이터가 크다고 생각하는 경우가 있다. 이러한 제품으로써 빅 데이터는 제조업의 업무 역량을 강화시키기 위한 스마트 팩토리 고도화 구현을 위해서 인공지능과 함께 필수적인 핵심 관점이자 4차 산업혁명의 필수적인 기술이다.

프로세스 지향적인 관점은 빅 데이터의 저장, 관리, 집계, 검색 및 분석에 필요한 프로세스의 새로운 패턴(pattern)을 강조한다. 빅데이터 처리 프로세스를 이해하기 위해 필요한 기술 인프라, 특히 기술 도구, 프로그래밍 기술, 컴퓨팅, 통계 및 기술 발전이 이러한 관점에서 강조되고 있고, 또한 기술의 정상적인 응용도 필요하다. 사용자는 데이터 중심 질문에 맞춰, 적절한 시간에 비용면에서 효과적이고 품질 좋은 답변을 얻을 수 있어야 하기 때문이다.

인지 기반 관점은 빅 데이터 속성 자체가 인지 능력의 한계성을 갖고 있기 때문에 인공지능을 활용하여 한계성을 해결하고, 인공지능 기반 스마트팩토리를 실현하기 위해 제조 산업의 현안과 과제에 초점을 맞추고 있다. 빅 데이터는 일반적으로 사용되는 하드웨어 환경 및 소프트웨어 툴의 범위를 초과하여, 사용자 집단의 허용 가능한 시간 내에 캡처, 관리 및 처리할 수 있어야 하기 때문이다.

이와 반대로 크기가 일반적인 데이터베이스 소프트웨어 도구로는 데이터 세트를 캡처, 저장, 관리 및 분석할 수 없다. 따라서 이러한 관점은 해석 가능성을 높이기 위한 조정의 필요성으로 귀결되는 인적 능력을 초과하여 빅 데이터를 개념화해야 한다. 특히 머신러닝(ML)을 제조 현장에 적용할 때, 산업별, 제조업별, 다양하고 독특한 개별 소스(many distinct sources)에서 생성된 빅 데이터 속성과 특성을 상세하고 치밀하게 개념 설계해야 한다. 그것이 한계성을 풀어내는 출발이기 때문이다.

마지막으로, 사회운동의 관점은 비전과 현실의 차이, 특히 빅 데이터 존재의 기초가 되는 사회경제적, 문화적, 정치적 변화에 주의를 집중시킨다. 이러한 관점은 과학적 발견, 환경 및 생물의학 연구, 교육 및 국가 안보에 대한 빅데이터의 미래 비전으로 인식되고 있다. 또한 비정형적인 속성과 다양한 측면을 정형화하여 개념 설계를 근간으로 인공지능을 적용시켜 사회 전반에 혁신의 가능성이 4차 산업혁명과 함께 부각되고 있으며, 더 나아가 생활문화 속으로 확산되어 인공지능 기반 스마트시티가 구현될 것으로 기대된다.

네 가지 관점을 통해 빅 데이터를 개념화하기 위한 유용한 통찰력과 예지력(Insight & Foresight)을 얻을 수 있으며, 그 다음 몇 가지 특성을 요약할 수 있다. 그러므로 아래 그림처럼 빅 데이터는 독립적인 개별 소스에서 생성되는 대용량(볼륨), 다양성, 속도, 가시성, 진실성, 가변성, 가치 및 증가하는 데이터와 함께 7 V로 정리된다

볼륨(Volume)은 데이터 세트의 크기에 초점을 맞춘다. 빅데이터의 양은 테라바이트 또는 페타바이트 수준에 이를 수 있으며, 이는 기존의 제한 용량인 메가바이트 또는 기가바이트를 훨씬 넘어서는 수준이다. 이것이 빅 데이터의 주요 특징이다. 여기서 볼륨이라는 용어는 빅 데이터를 “BIG”으로 정의한다. 매일 엄청난 양의 데이터가 생성되는 상황에서, 예를 들어, 거의 50시간 분량의 비디오가 매 분마다 유튜브에 업로드된다. 제조업의 고도화 과정도 마찬가지다. 판매, 물류, 생산 데이터 증가는 상상을 초월한다.

속도는 데이터의 입력 및 출력 속도를 나타낸다. 여기서 속도는 얼마나 빨리 데이터를 처리하고 액세스할 수 있는지를 나타낸다. 예를 들어, 소셜 미디어 게시물, 유튜브 동영상, 오디오 파일, 매초 수천 개씩 업로드되는 이미지들은 가능한 한 빨리 접근할 수 있어야 한다. 특히 스마트 팩토리 고도화는 속도관리이다. 이는 제조 현장의 데이터 생성 빈도, 데이터의 동적 특성 및 실시간으로 결과를 생성할 필요성을 의미함과 동시에 데이터 기반 활동(Internet of Behaviors) 영역이 고도화의 범위이기 때문이다.

다양성은 데이터 원본의 유형을 의미한다. 위에서 설명한 것처럼 빅 데이터는 정형, 반 정형 및 비정형 등 다양한 유형일 수 있다. 오늘날의 제조 환경에서 대량으로 생성되는 데이터는 오디오 파일, 비디오, 이미지, 텍스트 파일 등과 같은 비정형 데이터이다. 다양한 정보 소스와 각 소스의 고유한 데이터 스키마를 기준으로 데이터 유형 및 소스의 범위를 설명한다. 예를 들어, 교통 데이터 세트에는 도로의 차량 트래픽에 대한 숫자 정보, 활성 이벤트 및 예정된 이벤트(예: 스포츠 이벤트, 음악 이벤트)에 대한 텍스트 정보가 포함되어 있다. 또한, 가치, 진실성, 가변성 및 가시성과 같은 위 그림에서 언급한 V7도 빅데이터의 보완적 기능으로 사용된다.

빅 데이터의 변동성은 가변성과 다르다. 변동성은 지속적으로 변화하는 데이터를 나타낸다. 변동성은 주로 원시 데이터의 정확한 의미를 이해하고 해석하는 데 초점을 맞춘다. 예를 들어, 생산 라인에서 제품을 생산하고 있는데, 매일 생산된 제품의 품질이 매일 다른 품질이라면 그것은 가변성이다. 데이터의 경우에도 마찬가지다. 데이터가 지속적으로 변경되면 데이터의 품질에 영향을 미칠 수 있기 때문이다.

빅 데이터의 진실성은 데이터가 정확하지 않으면 아무 소용이 없으며, 이 모든 것은 사용자가 수집한 데이터가 정확한지 확인하고 잘못된 데이터가 시스템에 닿지 않도록 하는 것이 스마트 팩토리 고도화를 위해서 매우 중요하다. 그것은 또한 제조업이 수신하고 유용한 통찰력을 도출하기 위해서 처리하는 데이터의 신뢰도 또는 품질이기 때문이다.

빅 데이터의 시각화는 의사결정을 위해 데이터를 경영진에게 제시할 수 있는 방법이다. 우리 모두는 데이터가 엑셀 파일, 워드 문서, 그래픽 차트 등과 같은 여러 가지 방법으로 제시될 수 있다는 것을 알고 있다. 형식에 관계없이 데이터를 쉽게 읽을 수 있고 이해할 수 있으며 액세스할 수 있어야 하며, 그렇기 때문에 데이터 시각화가 중요하다.

빅 데이터의 가치는 최종적인 게임으로 알려져 있다. 모든 사용자는 위에서 언급한 V7에 리소스를 사용하고 노력을 기울인 후 조직의 가치가 어느 정도 필요하다는 것을 이해해야 한다. 그러므로 가치는 조직에서 빅데이터를 처리함으로써 얻을 수 있는 금전적 가치를 의미한다. 여기에는 두 가지 측면, 즉 큰 잠재적 가치와 극도로 낮은 가치 밀도가 포함된다.

이는 데이터의 출처에 대한 신뢰도를 고려할 때, 어느 정도까지 신뢰할 수 있는지가 해당된다. 예를 들어 센서에서 데이터를 수신할 때 일부 장치가 손상되어 데이터 가치에 영향을 줄 수 있기 때문이다. 또한 빅데이터는 분산 및 분산 제어 기능을 갖춘 대규모 이기종 자율 소스에서 시작하여 데이터 간의 복잡하고 진화하는 관계를 탐색하는 프로세스이기 때문이다.

제조 산업의 경쟁력 향상을 위한 스마트팩토리 고도화는 기본적으로 빅 데이터 관리 기술 및 개발 원칙에 대해서 새로운 정립이 선결과제이다. 왜냐하면 빅 데이터는 인공지능 기술, 통신 네트워크 기술, 클라우드 컴퓨팅 기술을 적용하고, 활용하기 위한 필수적인 요소이기 때문이다.

빅데이터 처리가 기존 데이터 분석보다 더 복잡하다는 것은 필연적인 사실이다. 빅 데이터 활용을 위해 새로운 기술과 기능, 또는 새로운 사고 방식을 개발해야 한다. 데이터 집약적 애플리케이션의 핵심은 실시간으로 메모리 내 처리를 지원하는 기능과 확장성뿐이다. 이에 대해 빅데이터에 새로운 기술을 도입하기 위한 지침으로 몇 가지 특징을 제시한다.

첫번째 원칙, 빅 데이터 처리의 거의 모든 단계에서 불확실성이 존재한다는 것은 명백한 사실이다. 인공지능과 빅 데이터 관리 기술은 제조 현장의 불확실성을 처리하여 운영 관리하는 능력을 보유하고 있다. 예를 들어 원시 데이터 자체는 다양한 범주의 불확실성을 포함할 수 있다.

특정 플랫폼과 알고리즘에 의해 생성된 데이터의 특성으로 인해 불확실성을 생성할 수도 있다. 퍼지와 러프 집합과 같은 대표적인 세분화 컴퓨팅(GrC) 기법은 불확실성을 취급하기 위한 인기 있는 도구가 될 것이다. 참고로 세분화된 컴퓨팅 기술(Granular Computing)의 능력과 장점은 지능적인 데이터 분석, 패턴 인식, 기계학습 및 눈에 띄는 데이터 크기에 대한 불확실한 추론에 활용되고 있다.

특히 섬세한된 컴퓨팅(GrC)의 컴퓨팅 패러다임은 정보 세분화와 추상화의 개념에 기초한다. 이러한 개념은 가장 성공적인 도구인 퍼지 집합과 러프 집합(fuzzy sets and Rough sets)과 같은 섬세화된 컴퓨팅(GrC)에 내재되어 있다. 빅 데이터 속성이 정형 데이터(Structured Data)와 다르게 미세한 데이터로부터 퍼지 집합과 러프 집합과 같은 기법을 활용하여 취득한 정보와 추상적인 정보의 집합을 통해 제조 경영의 지식 혹은 룰(Rules)과의 매핑(Mapping)이 가능하다.

그러므로 데이터가 다른 세분성으로 표현될 경우 다양한 특징과 패턴이 나타난다. 결국 이러한 기능을 바탕으로 세분화된 컴퓨팅(GrC)는 다중 세분화(multi-granularity)및 다중 뷰 데이터 분석(multi-view data analysis)을 강력하게 지원하여 빅데이터의 복잡성을 잘 이해할 수 있도록 지원하기 때문에 빅 데이터 관리 기술의 고도화에 적합하다.

두번째 원칙, 빅 데이터는 만족스러운 확장성을 갖는다. 확장성은 대규모 데이터 세트를 처리할 때 빅 데이터 기술이 충족해야 하는 가장 중요한 속성 중 하나다. 예를 들어, 가장 유명한 기계 학습(ML) 프레임워크 중 하나인 앙상블 학습(EnL)은 많은 특정 패턴 인식 알고리즘에서 잘 작동한다.

세번째 원칙, 메모리 내 시스템 구현을 활성화한다. 다시 말해, 좋은 기술은 항상 간단하다. 우선, 실시간 처리를 위해서는 복잡한 알고리즘이 적절하지 않을 수 있다. 또 다른 예로, 단순한 알고리즘은 보통 복잡한 알고리즘보다 성능이 나쁘지 않다는 것이 입증되었다.

네번째 원칙, 모든 것에 맞는 사이즈는 없다. 모든 도구는 그 장점뿐만 아니라 한계도 가지고 있다. 따라서, 어떤 하나의 크기도 모든 솔루션을 맞출 수 없다. 빅데이터에 대한 일반적인 이론에 도달하지 않는 한 다양한 데이터 집약적 애플리케이션에 적합한 툴을 선택하여 더 많은 이점을 얻어야 한다.

빅 데이터에 새로운 기술을 도입하기 위한 지침으로 몇 가지 원칙을 살펴봤다. 제조 산업의 고도화를 위해서 빅데이터 관리기술과 데이터 카탈로그를 이해하는 것은 기본이다. 데이터 카탈로그를 이해하는 첫 번째 개념은 데이터 카탈로그가 전체 기업이 데이터 소스를 중심으로 학습하고 협업하는 툴이라는 것이다.

데이터 기반이라는 속성을 더 강화하고자 하는 조직, 데이터 과학자가 머신러닝을 테스트하는 조직을 비롯해 기타 고객 대면 및 비대면 애플리케이션에 분석 기술을 포함하는 기업이라면, 데이터 카탈로그가 매우 중요하다. 왜냐하면 대부분의 기업의 데이터 자산과 상호작용하는 데이터 카탈로그는 유일한 공급원(single source of truth)이라고 할 수 있으며, 데이터 카탈로그는 어떤 데이터가 있는지, 최적의 데이터 소스를 어떻게 찾을지, 데이터를 어떻게 보호할지, 전문 기술을 가진 사람이 누구인지에 대한 질문에 대한 답을 찾는 데 도움이 될 뿐만 아니라, 데이터 카탈로그에는 데이터 소스를 찾고 소스에 대한 메타데이터를 캡처하고 검색하고 몇 가지 메타데이터 관리 기능을 제공하기 위한 툴이 포함되어 있기 때문이다. 또한 전문화된 데이터 카탈로그는 마스터 데이터 관리와 데이터 계보(data lineage) 기능을 활성화하거나 이러한 기능과 상호작용한다.

차별화된 의사결정 역량을 갖추는 것이 제조 산업 고도화의 기본이다. 의사결정 수준은 데이터 관리 기술, 더 나아가 빅 데이터 관리기술 역량에 의해서 결정된다. 스마트 팩토리 고도화 단계에서는 기계 학습이 점점 더 활용되고 있어서 일반 관리자보다 더 나은 의사결정을 내릴 수 있게 될 것이다.

인공지능을 탑재한 컴퓨터가 고객의 주문 패턴을 기반으로 자동으로 주문을 접수하여 배송 시간을 최소화시키는 최적화 작업을 수행한다. 여기에 인공지능을 대중화해서 소비자와 공급자의 소통 경로를 바꾸고 있으며 수집한 데이터는 정확하게 개별 맞춤 고객 수준의 수요를 감지하는 데 도움이 되고 있다. 그러나 납품을 예측하는 것은 단순히 제조 및 배송 일정을 앞당기는 것 이상이다. 인공지능 기반 스마트 공급망(Supply Chain) 관리 기술을 통해 기업은 과거의 배송 시간과 제조 세부 사항을 살펴볼 수 있으며, 이를 일기 예보와 같은 외부 데이터와 결합할 수 있다.

빅 데이터 관리기술이 도입된 인공지능 기반 스마트팩토리는 “계획된 재고 수준이 아닌 예측 재고 수준”에 대해 약속을 지킬 수 있어야 한다. 또한 앞으로 일어날 일이 아니라, 일어날 가능성이 높은 일에 기반을 둔 유망한 고객을 찾을 수 있어야 하며, 피드백(Feedback: 자동조율원리) 기능을 활용하기 위해 디지털 트윈 기술 기반으로 CPS(Cyber Physical System)를 구현하여 실감형 제조(AR, XR-based Manufacturing)의 실현 가능성(Feasibility)을 극대화하고, 궁극적으로 지속가능한(Sustainability) 제조 산업 경쟁우위(Competitive-Edge)를 이끌어내는 것이 스마트팩토리 고도화이다. 그 핵심에 인공지능과 빅 데이터 관리기술이 있다. 왜냐하면 그것이 뉴 노멀(New Normal)이기 때문이다.