일반 유저가 참여하는 크라우드 소싱 방식은 양은 많아도 품질이 떨어지기 마련입니다.
품질이 떨어지면 상품화하기 불가하며 결국 정크(Junk) 데이터가 됩니다.
BACH AI DATA는 양보다 질을 우선시하며, 7년간의 AI 서비스 상품화 경험과 데이터 라벨링 설계 노하우를 바탕으로,
고품질 데이터를 생산하여 상품화 및 상품의 High Perfomance를 목표로 합니다.
상품화를 위한 주제가 선정되면 자사의 AI 엔진과 전문 에디터들이 자체 설계 방식에 따라서 주제에 적합한 데이터를 생산합니다.
수집한 데이터를 머신러닝 기술을 통해 확장시키며, AI는 한 주제에 여러 아웃풋을 제시하고 전문 에디터가 그 중 적합한 아웃풋을 선택하여 학습시킵니다.
AI 학습 과정을 거친 후, 객관화된 지표와 자체 개발한 검수 시스템으로 전문 에디터들과 교차검증을 하며 철저히 검수하고 수정합니다.
하나의 입력에 하나의 아웃풋을 지원하는 일반적인 데이터셋과 달리,
BACH는 하나의 입력에 여러 가지 아웃풋을 제공하기 때문에 학습 데이터가 방사형으로 확장됩니다.
-
-
-
※위의 수치는 매월 15일, 30일 주기로 업데이트됩니다.
상품화에 초점을 맞춰 양보단 질을 추구함으로써 BACH만의 고품질 AI 솔루션을 제시합니다.
또한 언어 교육용 코퍼스 수집 및 가공 또한 제공합니다.
실제로 표를 통해 비교해 보면 데이터량, 품질, 확장성에서 차이를 느낄 수 있습니다.
특히, 대화 데이터셋 가공에서는 독보적인 확장성을 갖고 있습니다.
다음은 해외 기업을 대상으로 한 비교 그래프입니다.
세계 수준을 능가하는 퍼포먼스를 실현하고 있음을 알 수 있습니다.
컨설팅을 통해 고객사의 니즈에 맞춰 알맞은 AI 데이터 솔루션을 제공합니다.
언어 교육 분야에서는 다음과 같이 솔루션을 제시한 바 있습니다.
각국의 국제적으로 인증된
지수로 평가하여 진행
ex) Toefl Junior, Lexile, CEFR 등
학생 수준별로 적합한
데이터 가공
기존 커리큘럼 및 교재, 수업
방식 등을 데이터화 및 분석
각 고객사의 맞춤
코퍼스 제공
온오프라인에서 지속적으로
활용 가능한 환경 제공
언제 어디서든 모든
회화 학습 가능
실시간으로 추천 문장을
제시하는 기능 제공
누구나 쉽고 다채롭게
회화 학습 가능
위의 예시 솔루션을 토대로 실제 앱에 활용한 사례입니다.
앞서 예시를 든 텍스트 라벨링(대화셋 가공)뿐만 아니라
이미지 및 영상 라벨링, 음성 라벨링 등 다채로운 데이터 라벨링이 가능합니다.
이미 여러 기관의 의뢰를 받아 최적화된 솔루션을 공급한 실적이 있습니다.
현재는 코퍼스뿐만 아니라 VQA(Visual Question Answering), GQA(Question Answering on Image Scene Graphs) 등
핵심 영역을 넓히며 파트너사를 유치하고 있습니다.
AI 컨설팅을 거쳐 체계적인 가공 및 검수 시스템으로 빠르고 쉽게 데이터를 제공해드립니다.
언어 전문 에디터들과 함께하는 AI 플랫폼 데이터 라벨링 서비스를 통해 머신러닝 모델에서 사용할 데이터 컬렉션의 라벨을 정확하게 생성할 수 있습니다.
AI 검수 엔진과 이중 전수 검수 시스템으로 산출물은 높은 정확도 고퀄리티를 자랑합니다.
양식에 따라 작성해 주시기 바랍니다.