사례 연구: MyShell이 Sahara AI로 음성 모델을 개선하기 위해 데이터 수집 및 라벨링을 확장하다

도전: 다양한 오디오 데이터에 대한 높은 수요 충족

MyShell Al는 소비자, 제작자 및 오픈 소스 연구자를 연결하는 분산형 AI 플랫폼으로, 최첨단 텍스트 음성 변환(TTS) 및 음성 복제 모델을 만들기 위해 나섰습니다. 이를 위해 MyShell은 고품질의 다국어, 억양이 다양한 오디오 데이터를 신속하고 효율적으로 제공받아야 했습니다. 그러나 그들은 Sahara AI와 파트너십을 맺기 전에 몇 가지 주요 도전에 직면했습니다:

  • 공급업체 소싱: 억양별 오디오를 대규모로 제공할 수 있는 데이터 공급업체를 찾는 것이 어려웠습니다.

  • 높은 비용 및 비효율성: 데이터 레이블링 과정은 비용이 많이 들고 느려서 품질에 영향을 미쳤습니다.

  • 모델 훈련 지연: 긴 피드백 루프는 신속한 모델 적응 및 개선을 저해했습니다.

이러한 장애물은 MyShell이 새로운 모델 아키텍처로 실험하고 AI 네이티브 응용 프로그램을 향상시키는 능력을 제한했습니다.

여기에 Sahara AI가 있습니다.

"MyShell의 오픈 소스 모델 개발에 대한 의지는 Sahara AI의 정밀한 데이터 레이블링 서비스와 함께 강력한 동맹을 찾았습니다. 그들의 기여는 우리에게 접근 가능한 AI에 대한 비전의 초석입니다. 우리는 함께 혁신과 열린 협업을 향한 길을 열어가고 있습니다."
— MyShell 팀

해결책: 대규모로 고품질 데이터 수집 및 레이블링 제공

Sahara AI의 Sahara Data 플랫폼은 MyShell에 세 가지 주요 프로젝트에 걸친 포괄적인 솔루션을 제공했습니다. 분산형 AI 주도 데이터 수집 및 필터링을 통해, 우리는 MyShell이 고품질의 다양한 데이터 세트를 효율적으로 대규모로 수집할 수 있도록 했습니다.

프로젝트 1: 오디오 샘플 수집 - 짧은 문장

Sahara AI는 다양한 영어 억양으로 된 11,980개의 짧은 문장 오디오 샘플을 제공했습니다. 여기에는:

  • 중국어 억양의 영어

  • 미국 억양의 영어

  • 인도 억양의 영어

  • 영국 억양의 영어

이 덕분에 MyShell은 다양한 글로벌 억양으로 음성 모델 훈련을 시작할 수 있었습니다.

프로젝트 2: 오디오 샘플 수집 - 긴 텍스트

MyShell의 모델 기능을 더욱 향상시키기 위해, Sahara AI는 다양한 언어와 억양의 긴 텍스트 오디오 샘플을 제공하여 음성 데이터에서 다양성을 보장했습니다:

  • 중국어 억양의 영어: 13,000 샘플

  • 미국 억양의 영어: 18,000 샘플

  • 인도 억양의 영어: 14,000 샘플

  • 호주 억양의 영어: 3,000 샘플

  • 영국 억양의 영어: 2,000 샘플

  • 독일 억양의 영어: 13,003 샘플

  • 중국어: 14,068 샘플

이 광범위한 데이터는 MyShell이 자신의 모델을 보다 글로벌한 응용 프로그램에 맞춰 훈련할 수 있도록 했습니다.

프로젝트 3: 데이터 필터링

Sahara AI의 인간이 개입하는 루프 인프라는 다양한 언어로 된 180,000개 이상의 오디오 샘플을 필터링할 수 있게 해주었습니다. 데이터를 신중하게 평가 및 정제함으로써 오직 가장 높은 품질의 샘플만 사용하도록 했습니다. 여기에는:

  • 프랑스어: 47,678 샘플

  • 스페인어: 50,876 샘플

  • 독일어: 40,190 샘플

  • 러시아어: 46,238 샘플

이 덕분에 MyShell은 데이터 품질을 타협하지 않고 모델의 정확성에 집중할 수 있었습니다.

성과: 200만 회 다운로드 및 수천 개의 GitHub 별점

Sahara Data의 분산형 데이터 수집 및 필터링 덕분에 MyShell은 모델 훈련 프로세스를 크게 개선할 수 있었습니다. 주요 성과는 다음과 같습니다:

  • 더 빠른 모델 훈련: MyShell은 실시간 데이터를 사용하여 TTS 및 음성 복제 모델을 적응적으로 훈련하고 개선하며 시장 출시 시간을 극적으로 단축했습니다.

  • 오픈 소스 성공: 이 협력은 VoiceCloneMeloTTS의 성공적인 개발 및 오픈 소스를 이끌어냈으며, 이는 수천 개의 GitHub 별점200만 회 다운로드 이상을 기록했습니다.

Sahara Data로 AI 전략을 혁신하십시오

Sahara Data는 가장 도전적인 훈련 데이터 수요를 충족하기 위해 설계되었습니다. 분산형 인프라를 통해서든 또는 온프레미스 배포를 통해서든, Sahara Data는 개인정보 보호를 유지하고 AI 중심의 인간 개입 접근 방식을 제공하여 AI 훈련을 위한 고급 데이터 세트를 보장합니다.

Sahara Data의 숫자로:

  • 31+개 기업 고객

  • 35+개 국가에 서비스 제공

  • 45+개 언어 및 방언 커버

  • 150+개 파트너 제공업체

  • 30,000+ 명의 검증된 AI 트레이너

왜 Sahara Data를 선택해야 할까요?

  • 자동 레이블링: 독점 AI 모델이 레이블링을 처리하며, 일반적인 작업에서 인간 수준의 성능을 맞춥니다.

  • 인간 개입 정제: 인간 전문가가 레이블을 정제하고 검증하여 최상급 데이터 품질을 보장합니다.

  • 지속적인 학습: 모델이 인간 입력으로부터 학습하여 시간에 따라 레이블링 정확성을 향상시킵니다.

이 최적화된 협업을 통해 Sahara AI는 MyShell이 효율적이고 비용 효과적인 모델 훈련에 필요한 정확하고 고품질의 데이터 세트를 수집하도록 도왔습니다. 이는 프로젝트의 성공을 위한 핵심 요소입니다.

데이터 수집을 확장하고 Sahara Data로 AI 모델을 개선할 준비가 되었다면, 오늘 저희에게 연락하여 어떻게 저희 플랫폼이 귀하의 AI 훈련 필요를 지원할 수 있는지 논의해보십시오.