BACH AI DATABetter AI data and Commercializing with High performance


일반 유저가 참여하는 크라우드 소싱 방식은 양은 많아도 품질이 떨어지기 마련입니다.
품질이 떨어지면 상품화하기 불가하며 결국 정크(Junk) 데이터가 됩니다.
BACH AI DATA는 양보다 질을 우선시하며, 7년간의 AI 서비스 상품화 경험과 데이터 라벨링 설계 노하우를 바탕으로,
고품질 데이터를 생산하여 상품화 및 상품의 High Perfomance를 목표로 합니다.

input image
1. 입력

상품화를 위한 주제가 선정되면 자사의 AI 엔진과 전문 에디터들이 자체 설계 방식에 따라서 주제에 적합한 데이터를 생산합니다.

learn image
2. 학습

수집한 데이터를 머신러닝 기술을 통해 확장시키며, AI는 한 주제에 여러 아웃풋을 제시하고 전문 에디터가 그 중 적합한 아웃풋을 선택하여 학습시킵니다.

check image
3. 검수

AI 학습 과정을 거친 후, 객관화된 지표와 자체 개발한 검수 시스템으로 전문 에디터들과 교차검증을 하며 철저히 검수하고 수정합니다.



BACH만의 데이터 확장성


하나의 입력에 하나의 아웃풋을 지원하는 일반적인 데이터셋과 달리,
BACH는 하나의 입력에 여러 가지 아웃풋을 제공하기 때문에 학습 데이터가 방사형으로 확장됩니다.

NODES
nodes image
Cumulated data (elements)

-

CELL (CORPUS)
cell image
Cumulated data (cells)

-

CELLARIUM (DATABASE)
cellarium image
Cumulated data (cellariums)

-

※위의 수치는 매월 15일, 30일 주기로 업데이트됩니다.



왜 BACH AI DATA여야 하나요?


상품화에 초점을 맞춰 양보단 질을 추구함으로써 BACH만의 고품질 AI 솔루션을 제시합니다.
또한 언어 교육용 코퍼스 수집 및 가공 또한 제공합니다.



BACH만의 차별점


실제로 표를 통해 비교해 보면 데이터량, 품질, 확장성에서 차이를 느낄 수 있습니다.
특히, 대화 데이터셋 가공에서는 독보적인 확장성을 갖고 있습니다.

bachtable image


다음은 해외 기업을 대상으로 한 비교 그래프입니다.
세계 수준을 능가하는 퍼포먼스를 실현하고 있음을 알 수 있습니다.

발화문의 총 개수 bachgraph1 image
어휘의 다양성 bachgraph2 image
고유한 대화의 총 개수 bachgraph3 image



맞춤형 코퍼스 솔루션 예시


컨설팅을 통해 고객사의 니즈에 맞춰 알맞은 AI 데이터 솔루션을 제공합니다.
언어 교육 분야에서는 다음과 같이 솔루션을 제시한 바 있습니다.

bachsolution image

각국의 국제적으로 인증된
지수로 평가하여 진행
ex) Toefl Junior, Lexile, CEFR 등


학생 수준별로 적합한
데이터 가공

기존 커리큘럼 및 교재, 수업
방식 등을 데이터화 및 분석



각 고객사의 맞춤
코퍼스 제공

온오프라인에서 지속적으로
활용 가능한 환경 제공



언제 어디서든 모든
회화 학습 가능

실시간으로 추천 문장을
제시하는 기능 제공



누구나 쉽고 다채롭게
회화 학습 가능



솔루션 적용 예시


위의 예시 솔루션을 토대로 실제 앱에 활용한 사례입니다.

반복 학습 코퍼스

특정 커리큘럼이나 난이도에 맞춰 반복 학습용 단어 및 문장 코퍼스를 제공합니다. muse image

롤플레잉 코퍼스

한 문장에 답변해야 할 때, AI가 여러 추천 문장을 제시할 수 있는 코퍼스를 제공합니다. muse image

자유대화 코퍼스

특정 주제에 대해 자유롭게 대화할 수 있는 대화 코퍼스를 제공합니다. muse image



데이터 라벨링 사업 유형


앞서 예시를 든 텍스트 라벨링(대화셋 가공)뿐만 아니라
이미지 및 영상 라벨링, 음성 라벨링 등 다채로운 데이터 라벨링이 가능합니다.

텍스트 라벨링

자체 NLP 기술을 기반으로 주제별 텍스트를 수집하고 분류 및 분석하여 라벨링하거나 TTS 기술이나 VoC 텍스트 분석 등에 필요한 다채로운 솔루션을 제공합니다.

이미지 및 영상 라벨링

이미지 또는 영상을 상황별 및 사물별로 촬영 수집하여 분류하며, Bounding Box 기술이나 Segmentation에 필요한 데이터를 가공하여 제공합니다.

오디오 라벨링

주제별 음성을 수집하여 편집을 통해 분류 및 분석하며, STT 기술이나 음성 안내 챗봇 기술 등 다방면으로 활용될 수 있도록 다양한 솔루션을 제공합니다.

라벨링 데이터 상품화


가공한 데이터를 다음과 같은 분야에서 활용하여 상품화할 수 있습니다.

AI 로봇

언어교육

챗봇

헬스케어

자율주행분야

스마트 시티



BACH 사업 현황


이미 여러 기관의 의뢰를 받아 최적화된 솔루션을 공급한 실적이 있습니다.
현재는 코퍼스뿐만 아니라 VQA(Visual Question Answering), GQA(Question Answering on Image Scene Graphs) 등
핵심 영역을 넓히며 파트너사를 유치하고 있습니다.

bachbusiness image



BACH 프로세스


AI 컨설팅을 거쳐 체계적인 가공 및 검수 시스템으로 빠르고 쉽게 데이터를 제공해드립니다.

가공 업무 개요

언어 전문 에디터들과 함께하는 AI 플랫폼 데이터 라벨링 서비스를 통해 머신러닝 모델에서 사용할 데이터 컬렉션의 라벨을 정확하게 생성할 수 있습니다.

bach process outline
가공 검수 절차

AI 검수 엔진과 이중 전수 검수 시스템으로 산출물은 높은 정확도 고퀄리티를 자랑합니다.

bach inspect image



CONTACT

문의하기

양식에 따라 작성해 주시기 바랍니다.

02-537-7201
info@akaintelligence.com
서울 중구 을지로 50, 스파크플러스 을지로점 17층
Example invalid feedback text

1. 개인정보 수집 및 이용 목적
  - 이용자 식별 및 문의 대응

2. 수집하는 개인정보 항목
  - 소속, 성함
  - 전화번호, 이메일

3. 개인정보의 보유 및 이용 기간
  - 대응 완료 시 삭제
  - 수집 후 최대 1년