사례 연구: MyShell이 Sahara AI로 음성 모델을 개선하기 위해 데이터 수집 및 라벨링을 확장하다
2024. 9. 26.
과제: 다양한 오디오 데이터에 대한 높은 수요 충족
MyShell Al은 소비자, 제작자 및 오픈 소스 연구자를 연결하는 분산 AI 플랫폼으로, 최첨단 텍스트 음성 변환(TTS) 및 음성 클론 모델을 만들기 위해 나섰습니다. 이를 위해 MyShell은 고품질의 다국어, 억양 다채로운 오디오 데이터를 신속하고 효율적으로 제공받아야 했습니다. 그러나 그들은 Sahara AI와 파트너가 되기 전에 몇 가지 주요 도전에 직면했습니다:
벤더 소싱: 억양별로 대량으로 오디오를 제공할 수 있는 데이터 공급업체를 찾는 것이 어려웠습니다.
높은 비용과 비효율: 데이터 라벨링 프로세스는 비용이 많이 들고 느려서 품질에 영향을 미쳤습니다.
모델 훈련 지연: 긴 피드백 루프는 빠른 모델 적응과 개선을 방해했습니다.
이러한 장애물은 MyShell이 새로운 모델 아키텍처를 실험하고 AI 원주율 애플리케이션을 향상시키는 능력을 제한했습니다.
Sahara AI가 등장했습니다.
"MyShell의 오픈 소스 모델 개발에 대한 헌신은 Sahara AI의 정밀한 데이터 라벨링 서비스와 강력한 동맹을 맺었습니다. 그들의 기여는 접근 가능한 AI에 대한 우리의 비전의 초석입니다. 함께 우리는 혁신과 열린 협력의 길을 열어가고 있습니다."
— MyShell 팀
해결책: 대규모 고품질 데이터 수집 및 라벨링 제공
Sahara AI의 Sahara Data 플랫폼은 MyShell에 세 가지 주요 프로젝트에 걸쳐 포괄적인 솔루션을 제공했습니다. 분산형, AI 기반 데이터 수집 및 필터링을 사용하여 MyShell이 고품질의 다양한 데이터 세트를 효율적으로 대규모로 수집할 수 있도록 했습니다.
프로젝트 1: 오디오 샘플 수집 – 짧은 문장
Sahara AI는 다양한 영어 억양으로 11,980개의 짧은 문장 오디오 샘플을 제공했습니다. 포함된 내용은:
중국어 억양의 영어
미국 억양의 영어
인도 억양의 영어
영국 억양의 영어
이를 통해 MyShell은 다양한 글로벌 억양으로 음성 모델 훈련을 시작할 수 있었습니다.
프로젝트 2: 오디오 샘플 수집 – 긴 텍스트
MyShell의 모델 기능을 더욱 향상시키기 위해 Sahara AI는 여러 언어와 억양으로 긴 텍스트 오디오 샘플을 제공하여 음성 데이터의 다양성을 보장했습니다:
중국어 억양의 영어: 13,000 샘플
미국 억양의 영어: 18,000 샘플
인도 억양의 영어: 14,000 샘플
호주 억양의 영어: 3,000 샘플
영국 억양의 영어: 2,000 샘플
독일어 억양의 영어: 13,003 샘플
중국어: 14,068 샘플
이 폭넓은 데이터 범위로 인해 MyShell은 보다 글로벌한 애플리케이션을 위한 모델 훈련을 할 수 있게 되었습니다.
프로젝트 3: 데이터 필터링
Sahara AI의 인간-주기 인프라는 다양한 언어로 180,000개 이상의 오디오 샘플을 필터링하는 데 도움을 주었습니다. 데이터를 신중하게 평가하고 다듬음으로써 최상의 품질 샘플만을 사용하도록 보장했습니다. 포함된 내용은:
프랑스어: 47,678 샘플
스페인어: 50,876 샘플
독일어: 40,190 샘플
러시아어: 46,238 샘플
이로 인해 MyShell은 데이터 품질을 타협하지 않고 모델 정확성에 집중할 수 있었습니다.
결과: 200만 회 다운로드 및 수천 개의 GitHub 스타
Sahara Data의 분산 데이터 수집 및 필터링 덕분에 MyShell은 모델 훈련 프로세스를 크게 개선할 수 있었습니다. 주요 결과는 다음과 같습니다:
더 빠른 모델 훈련: MyShell은 실시간 데이터를 사용하여 TTS 및 음성 클로닝 모델을 적응적으로 훈련하고 개선하여 시장 출시 시간을 대폭 단축했습니다.
오픈 소스 성공: 이 협력은 VoiceClone 및 MeloTTS의 성공적인 개발과 오픈 소스를 이끌어내며 수천 개의 GitHub 스타와 200만 회 다운로드를 기록했습니다.
Sahara Data로 AI 전략을 혁신하세요
Sahara Data는 가장 까다로운 훈련 데이터 수요를 충족하기 위해 설계되었습니다. 분산형 인프라 또는 온프레미스 배치를 통해 Sahara Data는 개인정보 보호를 보장하는 AI 중심의 인간-주기 접근 방식을 제공하여 AI 훈련을 위한 고가치 데이터 세트를 보장합니다.
Sahara Data 수치:
31+ 엔터프라이즈 클라이언트
35+ 국가 제공
45+ 언어 및 방언 포괄
150+ 파트너 제공업체
30,000+ 검증된 AI 트레이너
왜 Sahara Data를 선택해야 할까요?
자동 라벨링: 독점 AI 모델이 라벨링을 처리하고 일반적인 작업에서 인간 수준의 성능을 일치시킵니다.
인간-주기 정제: 인간 전문가가 라벨을 정제하고 검증하여 최고의 데이터 품질을 보장합니다.
지속적인 학습: 모델은 인간의 입력으로부터 학습하여 라벨링 정확성을 높입니다.
이 최적화된 협력을 통해 Sahara AI는 MyShell이 효율적이고 비용 효율적인 모델 훈련에 필요한 정확하고 고품질의 데이터 세트를 수집하도록 지원했습니다. 이는 그들의 프로젝트 성공에 중요한 요소입니다.
데이터 수집을 확장하고 Sahara Data로 AI 모델을 개선할 준비가 되셨다면, 오늘 저희에게 연락하여 저희 플랫폼이 AI 훈련 요구 사항을 지원하는 방법에 대해 논의해 보세요.