서비스 향 AI 모델 개발하기 EP.1 AI 모델 개발 환경에서 오는 차이

2022/03/04

⏱ 5mins 
  • 이활석 (업스테이지 CTO)

    (전) 네이버 클로바 Visual AI/OCR Head, (현) 업스테이지의 CTO & AI 리서치 엔지니어

    제이미 (콘텐츠 마케터)

  • 현업 AI 현장에서 고객 지향적인 AI 모델을 개발하는 방법에 대해 알고 싶은 분에게 추천합니다.

  • EP. 1을 통해 학교, ‘연구 환경에서의 AI 개발 프로세스’와 ‘실제 산업 현장에서의 프로세스’의 차이와 그 차이가 발생하는 이유들을 확인해보세요.

  • ✔️  연구 환경과 실제 현장에서의 AI 모델 개발

    1.AI 개발 프로세스에서 모델링(모델 개발)은 무엇인가요?

    2. AI 모델 개발 시, 연구 환경과 실제 현장에서의 차이는 무엇인가요?

 
서비스 향 AI 모델 개발하기 EP.1 AI 모델 개발 환경에서 오는 차이

EP.1 들어가며

안녕하세요. 이번 에피소드의 주제는 ‘서비스 향 AI 모델 개발하기’입니다.

최근 혼자서, 커뮤니티 등을 통해 삼삼오오 모여 취미, 연구와 공부 목적으로 AI 모델 개발을 하는 분들을 점차 늘어나고 있죠. 그만큼 AI에 대한 관심이 나날이 증가하고, AI 기업으로의 커리어를 그리고 계신 분들이 늘어간다는 하나의 사인 같습니다. 그래서 첫 번째 ‘UP Tech’를 통해 ‘실제 현장에서 고객지향적인 AI 모델을 개발하는 방법’을 소개하고 합니다.

이번 주제는 총 네 편의 에피소드로 구성되었습니다.

본격적으로 주제에 들어가기에 앞서, EP. 1에서는 간략하게 💡‘학교/연구 환경 등의 통제된 상황에서의 AI 모델 개발’과 ‘실제 현장에서의 AI 모델 개발’이 어떤 차이를 가졌는지 소개하겠습니다. 그 후 세 편에 걸쳐 AI 모델 개발 프로세스와 AI 조직 구성 방법에 대해 자세히 다뤄보겠습니다.

연구 환경과 실제 현장에서의 AI 모델 개발

📍AI 개발 프로세스에서 모델링(모델 개발)은 무엇인가요?

👉 AI 모델 학습을 위한 주어진 학습 데이터셋을 활용, 정해진 테스트 데이터셋을 여러 테스트 단계에 거쳐 검증함으로써 최고 성능의 AI 모델을 확보하는 일입니다. 아래의 [그림 1]을 참고해 보세요.

✔️ 데이터셋이란? ‘특정 작업을 위해 데이터를 관련 구성단위로 모아 놓은 것’이며, 데이터 파일 또는 데이터베이스로 부르기도 합니다.

[그림 1] AI 모델링 프로세스

📍AI 모델 개발 시, 연구 환경과 실제 현장에서의 차이는 무엇인가요?

👉 결론부터 이야기하면, 통제된 상황과 비 통제된 상황에서 발생하는 차이입니다.

연구 환경에서의 AI 모델 개발은 통제된 상황에서 학습 데이터셋와 정해진 테스트 데이터셋, 테스트 방법이 주어집니다. 즉, AI 모델을 실서비스에 적용 시 발생할 수 있는 예기치 못한 돌발 상황으로부터 다소 자유롭습니다.

그러나 실제 현장에서는 데이터셋이 주어지지 않는 경우가 다수입니다. 모델 개발을 위해선 직접 데이터셋 구축부터 시작해야 하며, 통제되지 않은 상황 속 예기치 못한 돌발 상황들을 마주하게 됩니다. 또한, AI 모델 개발을 의뢰한 고객사의 요구사항을 세세히 반영해야 하기 때문에 AI 모델 개발 과정이 더욱 복잡하고 까다로워집니다.

예를 들어, 엔지니어는 고객사로부터 이런 ‘서비스 요구사항'을 받게 됩니다. “우리의 유저에게 XXX 경험을 전달하는 서비스를 만들고 싶습니다. AI로 이런 서비스가 구현 가능하나요?” 그럼 엔지니어는 이런 추상적인 요구사항을 개발 가능한 수준으로 구체화하여 AI 모델 개발에 착수해야합니다.

EP.1 나가며

간략하게 연구 환경과 실제 현장에서 AI 모델링 프로세스가 다른 이유를 알아보았습니다.

✔️ 연구 환경에서의 모델링 : 주어진 학습 데이터셋, 정해진 데이터셋과 테스트 방법을 통해 더 좋은 성능의 AI 모델을 제작하는 일

✔️ 실제 현장에서의 모델링 : 고객사의 서비스 요구사항에 부합하는 AI 모델을 만들어 내는 일, 이때 학습 데이터셋, 테스트 데이터셋, 테스트 방법은 상황에 따라 주어질 수 있고 없을 수도 있습니다.

다음 편에는 고객사의 추상적인 요구사항을 토대로 엔지니어들이 학습 데이터셋을 준비하는 법을 자세히 소개하겠습니다. 주어진 학습 데이터셋이 없을 경우, 어떤 조건과 과정을 통해 학습 데이터셋을 확보해서 AI 모델 학습을 할까요? 생생한 현장의 목소리를 듣고 싶으시다면 다음 화를 놓치지 마세요!


  • 업스테이지는 AI로 세상을 더욱 이롭게 만들어가는 글로벌 AI 기업입니다. 업스테이지는 세계 최고의 AI 기술과 노하우를 토대로 고객들의 비즈니스 성공을 위한 AI Pack(AI 솔루션)을 제공합니다. AI Pack은 OCR Pack, 추천 시스템 팩(Recommender System Pack)을 주축으로 다양한 비즈니스 문제 해결은 물론 고객사의 AI 혁신을 지원합니다. 업스테이지는 AI 기술로 고객들을 세계 무대에 올려드립니다.

    업스테이지 홈페이지 바로가기

 
Previous
Previous

서비스 향 AI 모델 개발하기 EP.2 AI 모델 개발을 위한 학습 데이터셋 준비