AMA | За кулисами запуска: Платформа услуг данных
23 июл. 2025 г.
На этом AMA команда Sahara AI открывает двери к одному из своих самых важных продуктов: Data Services Platform, который теперь доступен для всех. Ведущий маркетинга Жульес Барраган и сотрудник Sahara Labs PMM Джастин Эллери приглашают вас за кулисы запуска, чтобы исследовать, как платформа помогает участникам по всему миру маркировать, проверять и создавать высококачественные наборы данных, которые способствуют развитию ИИ. Мы обсуждаем, как DSP строит справедливую, прозрачную и совместную экономику данных, от задач с двойной наградой для партнеров и интеграций для предприятий до защиты от Sybil атак и обеспечения качества. Будь вы разработчиком, исследователем или просто любопытствующим о заработке через вклад данных, это AMA подчеркивает, как DSP напрямую связано с более широкой визией Sahara, охватывающей агентов, рынки и децентрализованную экосистему ИИ.
Ссылка: https://x.com/i/broadcasts/1yNxaLZmDOrJj
Транскрипция
Жульес: Мы в эфире! Привет, всем. Дадим всем минуту, чтобы присоединиться к нам. В это время я Жульес, это Джастин, наш PMM в Sahara Labs. Добро пожаловать на это очень специальное AMA. Сегодня мы погружаемся в официальный запуск платформы сервисов данных Sahara AI, которая теперь открыта для всех. Без необходимости в белом списке. Поэтому, если вы любопытны, новички на платформе или вы вносили вклад в предыдущие сезоны во время нашей частной тестовой сети, это ваш шанс узнать, что дальше, и задать вопросы напрямую нам. Итак, вы можете начать добавлять свои вопросы в чат ниже, и мы скоро начнем.
Хорошо, я вижу, что некоторые люди присоединяются. Спасибо. Джастин, пока мы ждем, когда к нам присоединятся люди, не хочешь рассказать немного о том, что такое платформа сервисов данных?
Джастин: Да, конечно. Мы действительно взволнованы платформой сервисов данных. Мы впервые запустили ее в начале декабря прошлого года. Это наша децентрализованная платформа для маркировки и сбора данных, используемых для развития ИИ. У нас есть пользователи со всего мира, которые помогают нам маркировать и проверять наборы данных не только для нас, но и для партнёров. И за это они могут зарабатывать разные награды. Так что это действительно основа нашего продуктового набора, и мы очень рады тому, где мы находимся сейчас после почти года работы с этим.
Жульес: Это довольно безумно. Я помню, когда мы впервые запустились, ты только что пришел в компанию, что, наверное, прошло всего шесть дней?
Джастин: Да, как неделя. Да, это было безумно.
Жульес: Мы все были в поездке. Мы были в Ванкувере, Канада на NeurIPS, и мы решили сделать все эти классные маркетинговые вещи в последнюю минуту, потому что мы были так взволнованы запуском, и людям это очень нравилось. Я был взволнован. Это был действительно захватывающий тестовый период.
Джастин: Да, это была безумная пора. Находиться на таком мероприятии, как NeurIPS, и при этом запускать продукт. После того, как я провел в компании всего неделю, я никогда не думал, что буду заброшен в такой хаос. Но это было супер весело. Интересно наблюдать за его эволюцией.
Жульес: Да, говоря об эволюции, это довольно безумно. Для тех, кто не в курсе, именно с данных Sahara AI и начала, да? Сервисов данных, верно? И данные — это основа для любого ИИ. Поэтому логично начать именно с этого. И это как бы диктует все, что мы делаем сейчас между нашим конструктором агентов и нашим ИИ-рынком. Все снова сводится к данным, и именно поэтому я очень рад этой платформе.
Джастин: Да, это действительно основа того, кто мы есть как компания, и наши ценности, и откуда мы начали. Так что наблюдать за ее эволюцией, пока мы растем, было привилегией, по меньшей мере.
Жульес: Говоря о росте, что нового для тех, кто пробовал частную версию тестовой сети платформы сервисов данных? Теперь, когда у нас есть этот полный запуск, что конкретно нового?
Джастин: Да, есть несколько действительно классных нововведений. Самое большое, что люди заметят, это то, что мы теперь предлагаем задачи для партнеров на платформе. У нас растущая экосистема и сеть различных партнеров, Web3, Web2 и всех промежуточных, которым нужны данные. Будь то для разработки ИИ, Web2 приложений или даже Web3 приложений, они обращаются к нам и спрашивают, можем ли мы помочь им создавать и выполнять эти наборы данных. Таким образом, что пользователи теперь заметят на платформе, так это наличие задач для партнеров. Выполняя эти задачи, пользователи смогут зарабатывать не только награды от Sahara, от нас, как это всегда было, но и от этих партнеров.
Таким образом, мы в первую очередь разнообразим структуру наград, что очень захватывающе для пользователей.
Жульес: Я думаю, что вы затронули много действительно интересных аспектов задач для партнеров с двойной наградой. Я думаю, что одно из того, на что вы намекнули, это то, что это также отличный способ находить и взаимодействовать с новыми перспективными проектами ИИ. Потому что многие из этих партнеров, некоторые из них уже после TGE (событие генерации токенов), верно? Таким образом, некоторые награды представляют собой токены партнеров, но многие из этих партнеров находятся до TGE. Таким образом, вы можете найти другие отличные проекты ИИ, с которыми мы работали и имеем некоторый уровень отношений, и выполнять задачи, экспериментировать, видеть, чем они занимаются, что они строят, и получать награды их пред-TGE наградами и компенсацией за свои действия, что действительно круто.
Джастин: Да, я думаю, что это очень хороший момент. Это не только помогает партнерам с маркировкой данных, но и дает им возможность получить известность и представить людям все эти удивительные проекты, с которыми нам выпала честь работать. И помимо этого, я как-то забыл самое захватывающее, что платформа теперь открыта для всех. Ранее это был только белый список, а теперь, знаете ли, каждый может прийти и участвовать в задачах и зарабатывать награды. Это очень захватывающе.
Жульес: И награды больше не просто очки.
Джастин: Нет, больше не очки. Мы двигались дальше. Теперь, когда мы после TGE, вы действительно можете зарабатывать Sahara, что потрясающе.
Жульес: Действительно, действительно захватывающе. Я вижу, что уже так много людей выполняет задачи. Многие люди достигают своих лимитов.
Джастин: Да. Это действительно безумие в некотором смысле. Нам пришлось немного замедлиться, что может быть немного неприятно для тех активных пользователей, которые просто хотят внести как можно больше. Но мы действительно хотим гарантировать, что у нас есть определенный уровень регулярности, чтобы убедиться, что у нас достаточно задач для всех, чтобы в них участвовать. И мы будем продолжать добавлять задачи и партнеров по мере продвижения.
Жульес: Да, я думаю, что с удовольствием смотрю на все комментарии в X, особенно в нашей частной тестовой сети, и вижу, что люди делали и что вызывало у людей наибольший интерес. Одним из таких моментов были задачи написания противника красной команды.
Джастин: Да.
Жульес: Нарушающие сделки подсказки. Это было действительно круто. Мы увидим что-то подобное снова в этом открытом запуске?
Джастин: Возможно. Возможно. Есть масса разнообразия задач и целей по сбору данных, которые мы в настоящее время оцениваем с новыми партнерами, которых мы даже еще не представили на платформе. Поэтому скажу так, если вы увлекаетесь такими задачами, то можете ожидать больше из этого.
Жульес: Абсолютно. Всегда будут предприятия. Поэтому это были наши корпоративные задачи, которые мне действительно нравятся. Я думаю, вы много говорили о наших задачах с двойной наградой, которые круты, потому что они с разными партнерскими проектами. Но у нас есть много классных предприятий, с которыми мы работаем, которые не обязательно хотят быть названы, или они не участвуют в программе двойной награды. Но каждая задача, которую вы выполняете на платформе сервисов данных, предназначена для какого-то проекта или предприятия. Вы не просто выполняете задачи ради самих задач, что, на мой взгляд, действительно удивительно. Эти задачи были предназначены для конкретной причины, верно? И скорее всего, будут и другие действительно интересные проекты, которым нужны действительно крутые наборы данных.
И это одна из вещей, которые мне действительно нравятся в платформе сервисов данных, это разнообразие и то, сколько новых вещей я могу узнать через некоторые задачи, которые мы выполняем. Это действительно круто.
Джастин: Да, я думаю, что это одна из вещей, которые мне тоже нравятся. Вы вносите вклад в реальные случаи использования ИИ. Это не просто игровая система, где вы выполняете задания ради удовольствия. Они действительно используются в реальных приложениях или в реальном мире. Так что для пользователей и для участников это действительно захватывающе, потому что вы действительно строите будущее ИИ. Это было бы невозможно без этих аннотаторов и маркировщиков. Так что я думаю, что это действительно классный компонент платформы.
Жульес: Это суперпросто в использовании, верно? Есть платформы, такие как Scale и Amazon Mechanical Turk, где это больше для предприятий, если переводить людей в потенциальные сотрудники. Это становится очень сложным. Здесь так легко просто войти, увидеть, что доступно, выполнить их, а затем получить награды в реальных крипто за ваши вложения, что действительно впечатляет.
Джастин: Да, именно так. Я думаю, что любой, кто имеет любой уровень экспертного знания или знаний в определенной области, может зарабатывать на этой платформе, и это так, так легко в использовании. И, по мере того как мы продолжаем развивать платформу и добавлять новые функции, это всегда будет в центре всего, что мы делаем. Давайте сделаем это как можно более плавным и простым для людей.
Жульес: У нас есть довольно много вопросов от аудитории из различных каналов, я просто собираю их. Одну секунду. Я хочу убедиться, что мы их обсудили, потому что это технически AMA. Итак, один вопрос, который я вижу: Как мне узнать, полезны ли мои вклад или являются ли они качественными?
Джастин: Да, это отличный вопрос. У нас есть процесс машинного обучения для одобрения данных и проверки поданных данных. В конечном итоге мы ищем самые качественные точки данных. И в прошлом у нас был процент одобрения более 90%. Я думаю, это было порядка 95% или что-то безумное. Так что это важный момент, что, насколько бы эта платформа ни была открыта для всех, мы действительно гордимся качеством данных.
Поэтому, когда мы говорим, если вы хотите внести вклад в платформу, всегда хорошая идея выполнять задачи или подавать заявки на задачи, в которых вы сами разбираетесь или считаете себя экспертом. Это просто увеличивает ваши шансы на внесение того, что мы будем называть утвержденными точками данных, которые будут вознаграждены соответствующим образом.
Жульес: Итак, да, вы поднимаете действительно хороший момент, что просто потому, что вы выполняете работу, это не значит, что вам заплатят. Если вы просто делаете работу ради работы, надеясь получить какой-то Sahara из этого, это не сработает. У нас есть проверки качества. Таким образом, ваши точки данных должны пройти через несколько различных этапов проверки качества. У вас есть автоматические проверки, у вас есть децентрализованный обзор равных, затем у вас есть внутреннее обеспечение качества. Если это связано с партнером, одна из этих задач с двойной наградой, партнёры собираются проверять, чтобы убедиться, что данные подходят для того, что они пытаются сделать. Так что много различных этапов проверки.
Джастин: Да, и это только чтобы гарантировать что a) мы предоставляем партнерам и предприятиям самые качественные данные, но и это просто делает платформу более интересной для всех. В конечном итоге, если мы можем гарантировать, что задачи, над которыми вы работаете, требуют высокого качества данных, это только потому, что они будут использоваться в реальных приложениях, верно? Именно поэтому.
Жульес: Да, на самом деле, одна из вещей, которая меня действительно волновала, когда мы проводили исследования, мы проводили наши исследования по обеспечению качества для наших частных сезонов тестовой сети, и именно так мы смогли получить эти 90-95% результатов. Я был честно поражен. Я был удивлен, что нам удалось получить такие высокие показатели качества даже через первоначальный обзор равных. Потому что для тех, кто не знаком с платформой сервисов данных, обычно вы либо аннотатор, либо рецензент. И рецензенты, если вам назначена эта роль, проверяют данные, которые были собраны или аннотированы аннотаторами. И если кто-либо был в крипто или Web3 так долго, как мы, вы знаете, что любой проект Web3, особенно когда к нему прикреплена какая-то дополнительная награда, будет подвержен риску атаки Sybil.
И я опасался, что будет иметь место серьезное влияние Sybil, и оказалось, что его не было, что было действительно хорошо, потому что эти децентрализованные рецензенты на самом деле могут действовать важным образом и избавляться от многих плохих данных, что действительно здорово.
Джастин: Да, да.
Жульес: Да. Позвольте мне увидеть еще один вопрос. Почему я ограничен всего несколькими задачами в день? Есть ли способ увеличить лимит?
Джастин: Да, это то, о чем мы говорили ранее. Я могу понять, как это может быть неприятным для некоторых из наших пользователей. Причина, по которой это так организовано на данный момент, это потому, что для этого начального запуска мы начали с небольшого количества партнеров и меньшего количества целей по сбору данных. Таким образом, по мере того, как будет проходить время, мы продолжаем добавлять все больше и больше задач. И благодаря этому мы сможем увеличить лимиты, потому что будет больше задач для выполнения. На данный момент есть довольно ограниченный лимит, просто потому, что мы хотим убедиться, что у всех есть шанс выполнять задания.
Одно из того, над чем мы работаем, это добавление некоторых стимулов или механизмов вознаграждения для, возможно, возвращающихся пользователей или пользователей, которые ранее вносили действительно качественные данные или действительно высокие точки данных. Так что не разочаровывайтесь. Есть много нового, что выйдет, чтобы гарантировать, что все будут вознаграждены соответственно и правильно на основе предыдущих вкладов, текущих вкладов и так далее. Так что это только начало. Есть много крутых вещей впереди.
Жульес: Если у вас есть какие-либо отзывы, не стесняйтесь, присоединяйтесь к нашему Discord. Мы собираем все это.
Джастин: Да, определенно присоединяйтесь к Discord. Я не могу порекомендовать это достаточно. Мы всегда общаемся там, собираем отзывы и разговариваем с людьми.
Жульес: Хорошо, давайте посмотрим. Какие примеры задач я могу увидеть на платформе сервисов данных?
Джастин: Да, это отличный вопрос. Сейчас это может быть что угодно. Это может быть озвучивание, это может быть маркировка изображений, это может быть голос в текст. Каждая задача добавляется на платформу постоянно. Но в прошлом, я думаю, Жульес упоминал это ранее, но там были антагонистические подсказки. Так что вы на самом деле писали как антагонистические подсказки для чего-то вроде зрелого контента, если хотите. Так что снова, небо — это предел. Я думаю, что нет на самом деле никакого способа узнать, какие именно задачи мы будем выкладывать дальше, что делает это очень захватывающим, потому что независимо от того, что вас интересует, в конечном итоге там, вероятно, будет что-то, что как бы отзывается об этом.
Итак, сейчас мы находимся в разгаре переговоров с как можно большим количеством партнеров и предприятий, чтобы загружать все больше и больше задач, и они будут охватывать множество различных областей.
Жульес: Возможности действительно безграничны, особенно когда дело касается данных. Всегда будет необходимость в данных, особенно в данных, помеченных людьми и создаваемых людьми, когда дело касается ИИ. Я убежден, что данные — это следующая гонка вооружений, когда дело касается ИИ. Это не будет, как Восток против Запада. Это не будет вопросом, у кого есть лучшая модель; это будет вопросом, у кого есть лучшие данные. И мы уже видели это с частичной покупкой Scale AI от Meta. Верно, данные — это то, на что стоит обратить внимание. Данные станут ключевым дифференциатором, и возможность иметь действительно крутую, качественную заказную информацию будет чрезвычайно важна для ведущих моделей и агентов ИИ завтрашнего дня.
И как получить эти данные, знаете ли, через платформы, такие как платформа сервисов данных Sahara AI, что действительно захватывающе, потому что это просто означает, что вы все получите шанс поэкспериментировать и собрать много этих данных, что действительно круто. И это действительно, я не хочу сказать сложно, но это тоже времязатратно. Это то, с чем многие из этих крупных корпораций часто сталкиваются. И это одна из причин, по которой мы видим, что многие предприятия обращаются к нам после того, как некоторые из этих крупных компаний не смогли выполнить свой запрос на данные. И одно из ключевых дифференциаторов, которое мы имеем и можем сделать, это разнообразие всех наших пользователей.
Громадное количество и разнообразие пользователей, которые могут выполнять эти задачи оперативно, действительно круто. У нас много... Извините, я работаю над целым рядом кейсов, так что все это просто засело в моей голове, и мне хочется говорить о них, но я не могу раскрывать имена, пока мы не выпустим эти кейсы. Но это так захватывающе и круто. Давайте посмотрим. Я не был частью белых сезонов. Что-то меня ждет, начиная с нуля?
Джастин: Отличный вопрос. Краткий ответ — нет. Вы можете присоединиться. Извините, что вы не были частью белого списка. Знаете ли, даже несмотря на то, что у нас было много участников в белом списке, был критерий оценки, который являлся частью процесса выбора, и определенно были люди, которые выпали из графика. Это произойдет, верно? В любое время, когда вы используете белый список. И поэтому это не значит, что мы не ценим ваши вклады или что-то в этом роде. Но теперь это больше не проблема. Вы можете присоединиться к платформе и вносить вклад столько, сколько сможете.
Жульес: Да, это потрясающе. И теперь вы можете зарабатывать Sahara. Вы упустили возможность заработать очки Sahara и наш аирдроп, но теперь вы можете зарабатывать Sahara напрямую из источника.
Джастин: Да, именно так.
Жульес: Никогда не поздно начинать. И это одна из вещей, о которых мы не говорили в начале, но введение этой новой экономики подработки действительно захватывающее. Если вы ищете немного крипто, нет лучшего способа, чем просто, эй, давайте я выполню эти задачи, и я могу заработать вознаграждение за это. И это все. И, очевидно, будет много других слов, и все будет меняться, и динамика будет меняться по мере продвижения вперед. И мы вводим новые типы задач, новые задачи и новые механизмы, о которых мы не можем сейчас говорить. Но это начало новой совместной экономики ИИ, и я так рад этому.
Джастин: Да. Это супер круто. Я имею в виду, вы больше не ограничены покупкой крипто с помощью, знаете ли, торговли крипто или использования фиата для покупки крипто. Теперь вы можете зарабатывать крипто на основе ваших знаний, верно? Если вы просто много знаете о конкретной теме, вы можете получать оплату в крипто просто за то, что являетесь экспертом в данной области, что супер круто.
Жульес: Да, именно так. Мне кажется, что сейчас есть так много проектов, это как если бы они либо проекты до TGE, и вы стараетесь в надежде заработать на дропе токенов, а потом и все. Либо вам нужно владеть куском крипто и ставить его, и затем вы зарабатываете какую-то дивидендную награду от вашего стекинга. Но это так: нет, вы просто заходите, выполняете работу, и за это вас вознаграждают. И я просто считаю, что концептуально это действительно круто, и вы не видите этого достаточно.
Джастин: Да, вы буквально инвестируете свое время и свои знания.
Жульес: Как мне оставаться в курсе или получать уведомления о новых задачах и функциях?
Джастин: Отличный вопрос. Так что есть несколько вещей, которые вы можете сделать. Во-первых, присоединитесь к Discord. Мы всегда делаем наши большие анонсы и обновления платформы там. Итак, прежде всего, присоединяйтесь к Discord. Второе, у нас есть списки электронной почты, в которых мы также отправляем обновления платформы, новые задачи и т.д. Подписывайтесь на нас в Twitter или в X. Это тоже отличный способ узнать. Но, как бы там ни было, присоединяйтесь к Discord. Discord — это место, где вы получите всю эту информацию. Вы можете пообщаться с другими пользователями и другими участниками, что здорово, потому что они могут дать советы. Вы можете просто найти людей, которые могут быть заинтересованы в тех же темах и областях, что и вы, что довольно весело. Так что, да, в общем, присоединяйтесь к Discord.
Жульес: Да. Также следите за нами в X, если вы еще не подписаны. Если вы здесь, вы уже на нашей странице, поэтому я предполагаю, что вы, вероятно, подписаны на нас. Но я обычно, знаете, я публикую, когда новые задачи становятся доступны, тоже там.
Джастин: Да.
Жульес: Также есть уведомления. Я не знаю. Есть ли центр уведомлений в DSP, который уведомляет вас, когда появляется новая задача?
Джастин: Он действительно имеет уведомления, однако, знаете ли, да, он действительно имеет уведомления. Он будет уведомлять вас о некоторых обновлениях задач и некоторых обновлениях, связанных с задачами, к которым вы вносите свой вклад. Но снова, это только один источник информации. Я также рекомендую присоединиться к Discord, чтобы, в случае если вы пропустите что-то на платформе. Да.
Жульес: Вы имеете в виду, что вы не держите платформу открытой 24/7 онлайн?
Джастин: Верно. Да. Это не будет отправлять вам уведомление на телефон. Это важное уточнение. Верно? Как бы там ни было, в то время как Discord, как если бы у вас были включены уведомления, вы получите, получите уведомление на своем телефоне с сообщением, что появились новые задачи. Итак, вы сможете узнать об этом намного быстрее.
Жульес: Существуют ли лидерборды{




