Кейс: MyShell масштабирует сбор данных и маркировку для улучшения голосовых моделей с Sahara AI
26 сент. 2024 г.
Задача: удовлетворение высоких требований к разнообразным аудиоданным
MyShell Al, децентрализованная ИИ-платформа, соединяющая потребителей, создателей и исследователей с открытым исходным кодом, поставила перед собой задачу создать передовые модели преобразования текста в речь (TTS) и клонирования голоса. Для этого MyShell потребовались высококачественные, многоязычные, разнообразные по акцентам аудиоданные, предоставляемые быстро и эффективно. Однако они столкнулись с несколькими ключевыми проблемами до того, как начали сотрудничество с Sahara AI:
- Поиск поставщиков: Найти поставщиков данных, способных предоставить акустически специфичную аудиоданные в больших масштабах, было сложно. 
- Высокие затраты и неэффективность: Процессы разметки данных были дорогостоящими и медленными, что сказалось на качестве. 
- Задержки в обучении модели: Долгие циклы обратной связи мешали быстрой адаптации и улучшениям модели. 
Эти препятствия ограничивали возможность MyShell экспериментировать с новыми архитектурами модели и повышать свои AI-ориентированные приложения.
Встречайте Sahara AI.
"Преданность MyShell разработке моделей с открытым исходным кодом нашла надежного союзника в точных услугах разметки данных Sahara AI через их платформу Sahara Data. Их вклад является основой нашего видения доступного ИИ. Вместе мы прокладываем путь к инновациям и открытой коллаборации."
— Команда MyShell
Решение: доставка высококачественного сбора данных и разметки в больших масштабах
Платформа Sahara AI Sahara Data предоставила MyShell комплексное решение по трем ключевым проектам. Используя децентрализованный, основанный на ИИ сбор и фильтрацию данных, мы позволили MyShell эффективно собирать высококачественные, разнообразные наборы данных в больших масштабах.
Проект 1: Сбор образцов аудио – короткие предложения
Sahara AI предоставила 11,980 образцов аудио коротких предложений на различных английских акцентах, включая:
- Английский с китайским акцентом 
- Английский с американским акцентом 
- Английский с индийским акцентом 
- Английский с британским акцентом 
Это позволило MyShell начать обучение их моделей звучания с широким разнообразием глобальных акцентов.
Проект 2: Сбор образцов аудио – длинный текст
Чтобы еще больше улучшить возможности модели MyShell, Sahara AI предоставила длинные текстовые аудио-примеры на нескольких языках и акцентах, обеспечивая разнообразие голосовых данных:
- Английский с китайским акцентом: 13,000 образцов 
- Английский с американским акцентом: 18,000 образцов 
- Английский с индийским акцентом: 14,000 образцов 
- Английский с австралийским акцентом: 3,000 образцов 
- Английский с британским акцентом: 2,000 образцов 
- Английский с немецким акцентом: 13,003 образца 
- Китайский: 14,068 образцов 
Этот широкий диапазон данных обеспечил MyShell возможность обучать их модели для более глобальных приложений.
Проект 3: Фильтрация данных
Инфраструктура Sahara AI человек в цикле позволила отфильтровать более 180,000 образцов аудио на различных языках. Тщательно оценивая и уточняя данные, мы обеспечили использование только образцов высшего качества, включая:
- Французский: 47,678 образцов 
- Испанский: 50,876 образцов 
- Немецкий: 40,190 образцов 
- Русский: 46,238 образцов 
Это позволило MyShell сосредоточиться на точности модели, не пожертвовав качеством данных.
Результат: более 2 миллионов загрузок и тысячи звёзд на Github
С децентрализованным сбором и фильтрацией данных от Sahara Data, MyShell удалось значительно улучшить процесс обучения модели. Ключевые результаты включали:
- Быстрое обучение модели: MyShell адаптивно обучала и улучшала свои модели TTS и клонирования голоса, используя данные в реальном времени, что значительно сократило время выхода на рынок. 
- Успех с открытым исходным кодом: Сотрудничество привело к успешной разработке и открытию VoiceClone и MeloTTS, которые собрали тысячи звёзд на GitHub и более 2 миллионов загрузок на Hugging Face. 
Измените свою стратегию ИИ с Sahara Data
Sahara Data разработана для удовлетворения самых сложных требований к обучающим данным. Будь то через децентрализованную инфраструктуру или локальное развертывание, Sahara Data предоставляет подход, сохраняющий конфиденциальность, ориентированный на ИИ и с участием человека в процессе, который обеспечивает ценные наборы данных для обучения ИИ.
Sahara Data в цифрах:
- 31+ корпоративный клиент 
- 35+ стран, обслуживаемых 
- 45+ охватываемых языков и диалектов 
- 150+ партнеров-поставщиков 
- 30,000+ проверенных тренеров ИИ 
Почему выбирают Sahara Data?
- Автоматическая разметка: Собственные модели ИИ выполняют разметку, достигая производительности на уровне человека в основных задачах. 
- Уточнение с участием человека: Человеческие эксперты уточняют и проверяют метки, чтобы гарантировать высшее качество данных. 
- Непрерывное обучение: Модели учатся на основе человеческого ввода, улучшая точность разметки с течением времени. 
В результате этой оптимизированной коллаборации Sahara AI помогла MyShell собрать точные, высококачественные наборы данных, необходимые для эффективного и экономичного обучения моделей, что является ключевым фактором успеха их проекта.
Если вы готовы масштабировать сбор данных и улучшить ваши модели ИИ с помощью Sahara Data, свяжитесь с нами сегодня, чтобы обсудить, как наша платформа может поддержать ваши потребности в обучении ИИ.




