AMA | 启动背后的故事:数据服务平台
2025年7月23日
在此次AMA中,Sahara AI团队开放了其最重要的产品之一:数据服务平台,现已上线并可供所有人访问。由市场负责人Joules Barragan主持,并由Sahara Labs PMMJustin Ellery加入,本次会议让你深入发布背后,探索该平台如何赋能全球贡献者标记、审核和生成支持AI发展的高质量数据集。从双重奖励合作伙伴任务和企业集成到反Sybil保护和质量保证,我们解读了DSP如何构建一个公平、透明和协作的数据经济。无论你是开发者、研究人员,还是对通过数据贡献获利感到好奇,这次AMA强调了DSP如何直接与Sahara在代理、市场和去中心化AI生态系统中的广泛愿景连接。
链接: https://x.com/i/broadcasts/1yNxaLZmDOrJj
记录
Joules:我们直播中!大家好。我们会给大家一分钟的时间来加入我们。在此期间,我是Joules,这是我们的PMM Justin,欢迎来到这一特别的AMA。今天我们将深入探讨Sahara AI数据服务平台的正式发布,现在对所有人开放。不需要白名单。所以无论你是好奇、对该平台不熟悉,还是在我们之前的私有测试网中的早期季节中做出贡献,现在是你直接听取我们接下来的机会,向我们提问的时刻。你们可以开始在下面的聊天中添加问题,我们将很快开始。
好吧,我看到有人来了。谢谢你。Justin,在我们等待大家加入的过程中,你想给我们简单介绍一下数据服务平台是什么吗?
Justin:当然可以。我们对数据服务平台感到非常兴奋。我们在去年12月初首次推出。这是我们用于AI开发的去中心化数据标记和收集平台。我们拥有来自全球的用户,他们帮助我们标记和审核数据集,不仅是我们自己,还包括现在的合作伙伴。作为回报,他们可以获得不同的奖励。因此,这对于我们的产品系列至关重要,我们对此感到非常激动,经过将近一年的时间我们终于达到了现在的阶段。
Joules:这真是太疯狂了。我记得我们首次推出时,你刚在公司待了六天,对吧?
Justin:是的,差不多一周。对,真疯狂。
Joules:我们都是在一次旅行中。我们在加拿大温哥华参加NeurIPS,决定做所有这些最后一刻真正酷的市场营销活动,因为我们对即将推出感到非常兴奋,人们对此感到非常激动。我也很兴奋。这是一次非常刺激的测试网。
Justin:是的,那是个疯狂的时刻。参与像NeurIPS这样的活动,同时推出产品。在公司待了一周,我从来没有过如此混乱的经历。但这真的很有趣。看着它不断发展,真是超级有趣。
Joules:是的,谈到演变,这真是令人惊叹。对于那些不知情的人来说,Sahara AI的起步就是数据。数据服务,是吗?数据就是任何AI的基础。所以我们为什么从这里开始是有道理的。这也主导着我们现在所做的一切,从我们的代理构建器到我们的AI市场,所有一切的根本都归结于数据,这就是我对这个平台感到超级兴奋的原因。
Justin:是的,这对我们作为公司来说是非常核心的,代表了我们的价值和我们的起点。因此,看到它随着我们的发展而演变,至少可以说是一种特权。
Joules:说到成长,对于那些尝试过数据服务平台私有测试版的人,新的变化是什么?现在我们有了这个完整的发布,究竟有什么新变化?
Justin:是的,有一些非常酷的新功能。人们会注意到的最大变化是我们现在在平台中提供合作伙伴任务。我们拥有一个日益壮大的生态系统和来自Web3、Web2及其间的不同合作伙伴网络,他们需要数据。无论是用于AI开发、Web2应用还是Web3应用,他们都在向我们询问是否可以帮助他们创建和履行这些数据集。因此,用户现在在平台上会注意到有合作伙伴任务。通过完成这些合作伙伴任务,用户将有资格获得不仅是来自Sahara的奖励,这是一直以来的情况,还有来自这些合作伙伴的奖励。
因此,我们第一次正在多样化奖励结构,这对用户来说非常令人兴奋。
Joules:我认为你引出了双重奖励合作伙伴任务许多非常有趣的部分。我认为你稍微提到了一下,这也是一个寻找和与新兴AI项目互动的非常好方式。因为很多这些合作伙伴,有些是后TGE(代币生成事件),对吗?所以一些奖励就是这些合作伙伴代币,但很多这些合作伙伴都是前TGE的。因此,你可以找到我们合作过的其他非常酷的AI项目,并且与他们有一定的关系,能够完成任务,进行实验,看看他们在做什么,看看他们在构建什么,并获得他们的前TGE奖励以及你所做的工作的补偿,这真的很酷。
Justin:是的,我认为你提到了一个非常好的观点。这不仅帮助合作伙伴进行数据标记,而且还给予他们曝光,并向人们介绍我们可以合作的所有这些令人惊叹的项目。此外,我还忘了提到最令人兴奋的部分,就是这个平台现在对每个人开放。因此,之前仅限白名单,现在每个人都可以进来,贡献任务和获得奖励。这真是令人兴奋。
Joules:而且奖励不再仅仅是积分了。
Justin:不,不再是积分了。我们已经向前迈进。现在我们后TGE,你实际上可以获得Sahara,这是惊人的。
Joules:真的非常令人兴奋。我看到已经有很多人正在执行任务。很多人达到了他们的限制。
Justin:是的。从某种意义上说,真的很疯狂。我们不得不放慢这个进程,我知道这可能会让那些想尽可能多贡献的强用户有点沮丧。但我们确实希望确保能够有某种节奏,以确保我们有足够的任务供大家贡献。我们会继续添加任务并持续增加合作伙伴。
Joules:是的,我喜欢回顾我在X上的所有评论,尤其是在我们的私有测试网中,看到人们在做什么,以及是什么让人们最兴奋。其中一个就是红队对抗任务的编写,提示。
Justin:是的。
Joules:破坏性提示。那些真的很酷。在这个开放发布中,我们会看到类似的事情吗?
Justin:我们可能会。我们可能会。我们目前正在与新合作伙伴评估大量的任务多样性和收集目标,我们甚至还没有在平台上介绍他们。所以,我可以说,如果你对这些类型的任务感兴趣,可能会期待到更多。
Joules:绝对有。总会有企业。所以那些就是我们的企业任务,我非常喜欢。我觉得你谈到我们的双重奖励任务时说了很多很酷的事情,因为它们与所有这些不同的合作伙伴项目有关。但是我们还有很多酷的企业,我们与之合作,这些企业并不一定想被命名,或者他们不参与双重奖励项目。但你在数据服务平台上所做的每一项任务都是为某个项目或企业。你不是仅仅在做任务而已,我认为这真的很惊人。这些任务都是出于某种原因而做的,对吧?而且更有可能有其他非常酷的项目需要非常优秀的数据集。
我非常喜欢数据服务平台的一个方面,就是多样性,以及我可以通过我们所做的一些任务学习到多少新事物。这真的很酷。
Justin:是的,我认为这是我喜欢的一个方面。你正在为真正的AI用例做贡献。这不仅仅是一个游戏化的系统,你是在完成任务以获得乐趣。这些实际上是在现实应用中使用,或者在现实世界中使用。因此,我认为对用户和贡献者来说,这真的很令人兴奋,因为你确实是在构建AI的未来。没有这些标注者和标签者,这一切都是不可能的。因此,我认为这也是平台上一个非常酷的组成部分。
Joules:这真的很简单,对吧?像Scale和亚马逊机械土耳其一样的平台,确实是更偏企业的、真正的将人们作为潜在员工引入的。这变得非常复杂。登录、查看可用内容、完成并获得实际的加密奖励,以换取你的贡献,这真的很惊人。
Justin:对,就是这样,是吗?任何在某个主题上有一定领域专长或知识的人,都可以通过这个平台获利,而这非常容易使用。随着我们继续发展平台并添加新功能,这始终是我们一切工作的核心或者前沿。让我们让这对人们尽可能无缝和简单。
Joules:我们确实有很多来自不同频道的观众提问,只是在汇总它们。稍等一下。所以我想确保我们能通过这些问题,因为这在技术上是一次AMA。好吧,我看到一个问题:我如何知道我的贡献是否有用或高质量?
Justin:是的,这是个好问题。因此,我们有一个机器学习流程来批准数据点和审核提交。因此,最终我们在寻找尽可能高质量的数据点。在过去,我们的成功率或批准率超过90%。我想大概是95%或其他什么疯狂的数字。因此值得特别强调的是,尽管这个平台是为每个人提供的,但我们确实对数据质量感到自豪。
所以这就是为什么当我们说,如果你想对平台做出贡献,完成任务或申请任务时,你自己对这些任务的知识或专家认知非常重要。这仅仅增加了你贡献我们所称赞的已批准数据点的几率,而这些数据点将获得适当的奖励。
Joules:是的,你提到了一个非常好的观点,仅仅因为你在工作,并不意味着你会得到报酬。如果你只是在工作,仅仅为做工作而做工作,希望能够获得一些Sahara,那是不行的。我们确实有质量检查。因此,你的数据点必须通过多个质量检查的迭代。你有自动化检查,你有去中心化的同行评审,然后你有内部质量保证。如果是与合作伙伴之一的双重奖励任务,合作伙伴将对数据进行审核,以确保数据符合他们想要的内容。因此,有很多不同的审查回合。
Justin:是的,这就是为了确保一方面,我们为合作伙伴和企业提供尽可能高质量的数据。另一方面,这只是为了让所有人都能享受这一平台。最终,如果我们能够保证你正在进行的任务需要高数据质量,那是因为这些数据将被用于现实应用,对吧?所以,这就是原因。
Joules:是的,实际上当我们进行研究时,我对此感到非常兴奋,我们为我们的私有测试季进行了质量保证研究,这就是我们能得出90%至95%的数字的原因。我当时真的很震惊。我惊讶我们能够通过初步的同行评审获得如此高的质量评分。因为对于那些不熟悉数据服务平台的人来说,你通常是一个注解者或审查者。如果你的角色是审查者,你会审查由注解者收集或注释的数据。任何在加密或Web3行业工作了这么久的人都知道,任何带有某种激励的Web3项目都将面临Sybil攻击的风险。
我曾担心会存在一个严重的Sybil影响,而结果是没有,这真的很好,因为那些去中心化的同行审查员实际上能够发挥重要作用,将很多坏数据剔除,这真的很好。
Justin:是的,是的。
Joules:是的。让我看看还有其他问题:为什么我每天的任务数量受限?有没有办法提高限制?
Justin:是的,这就是我们之前所提到的。我可以理解这对一些用户可能会令人沮丧。之所以会这样设置是因为在该初始发布中,我们推出的合作伙伴数量相对较少,数据收集目标也很有限。因此,随着时间的推移,我们将继续增加更多任务,并通过这样做来提高限制,因为会有更多的任务供人们去做。因此,目前有一个相对限制性较大的限制,因为我们希望确保每个人都有机会完成任务。
我们正在努力增加一些奖励机制或激励措施,可能是针对返还用户或过去贡献了高数据质量或高数据点的用户。因此不要感到气馁。有很多新东西即将推出,将确保每个人都能根据过去的贡献、当前的贡献等得到适当和应有的奖励。因此,这只是一个开始。未来会有更多酷的东西。
Joules:如果你有任何反馈,也不要害怕,像加入我们的Discord。我们会收集所有反馈。
Justin:是的,绝对要加入Discord。我尤其推荐这一点。我们总是在那里和大家聊着收集反馈和讨论。
Joules:好的,让我们看看。我可能会看到你在数据服务平台上可能会见到什么样的任务?
Justin:是的,这是个好问题。目前可能会有任何东西。可能是语音配音,可能是图像标记,可能是声纹转文本。每时每刻都有许多不同的东西被添加到平台上。但是在之前,我认为Jules之前提到的,有一些对抗性的提示。所以你实际上是在为类似于成熟内容的某种东西写对抗性提示。因此,我认为可能性是无穷无尽的。并且没有办法确切知道我们下一步会添加什么,这让它变得非常刺激,因为无论你对什么感兴趣,最终会有一些东西可以吸引你。
所以目前我们正在尽力与尽可能多的合作伙伴和企业进行洽谈,以上传更多的任务,通常涵盖许多不同领域。
Joules:可能性真的没有尽头,特别是在数据方面。数据的需求总是存在,特别是涉及到人工标记、人工创作的数据时。对于我来说,数据就是AI领域的下一场军备竞赛。这不会是东西方的对抗,也不会是谁拥有最佳模型,而是谁拥有最佳数据。我们已经看到Meta部分收购Scale AI的例子。对吧?数据就是关键。数据将成为关键的差异化因素,能够拥有真正优秀、定制的数据将对于明天领先的AI模型和代理来说至关重要。
而你如何获得这些数据,通过像Sahara AI的数据服务平台这样的平台,这真的很令人兴奋,因为这意味着你们可以实验并收集大量的数据,这真的很酷。而且实际上,这并不容易,我不想说困难,但这也是耗时的。这是许多大公司经常面临的挑战之一。这就是我们看到许多企业在未能完成他们的数据请求后转向我们的原因之一。而我们能够做到的关键区别之一就是我们所有用户的多样性。
用户能够及时完成这些任务的数量和多样性真是太酷了。我们有很多......抱歉,我正在研究一堆案例研究,所以这些都在我的脑海中,我想谈及所有这些,但我不能在此时透露任何名字,直到我们完成那些案例研究。但这真的太令人兴奋和酷了。让我们看看。我没有参与白名单季节。我现在开始时是否错过了什么?
Justin:好问题。简短的回答是没有。你可以加入。抱歉,你没有参加白名单季节。虽然我们有很多白名单参与者,但这是一个评估标准,部分选拔过程确实有一些人会被遗漏。任何时候使用白名单时都会发生这种情况。因此,并不意味着我们不重视你的贡献或其他任何事情。但现在不再是问题。欢迎你加入平台并尽可能多地做出贡献。
Joules:对,非常棒。你现在可以获得Sahara。你错过了Sahara积分和我们的空投,但现在你可以直接从源头获得Sahara。
Justin:是的,确实如此。
Joules:开始永远不嫌晚。另外一点是,在一开始我们并未详细讨论这一点,但这个新工作经济的引入令人兴奋。如果你正在寻找一些额外的加密,真的没有比执行这些任务更好的方法了。嘿,参与其中,我就可以因它们获奖。就是这样。显然会有很多更新和变化,并且事情将会更加流动和动态,因为一切都在发展。我们引入新的任务类型、新的任务和新的机制,虽然在此时我们无法深入讨论,但这是新合作AI经济开始的一部分,我对此感到非常兴奋。
Justin:是的,这非常酷。我是说,你不再仅限于仅仅通过交易加密或用法币购买加密。现在,你可以通过你的知识获得加密对吗?如果你对某个主题了解很多,你可以仅仅凭借做领域专家而用加密获得报酬,这真的很酷。
Joules:是的,没错。我感觉现在有很多项目,它们要么是前TGE项目,你努力工作以期获得代币空投,然后就结束了。或者你必须持有一堆加密并进行质押,然后获得某种股息奖励。而这个平台不是,你只是进来,完成工作,便会为此获得奖励。我认为这一概念非常酷,而你并不经常看到这种情况。
Justin:是的,你实际上是在投资你的时间和知识。
Joules:我如何保持参与或获取新任务和功能的通知?
Justin:好问题。所以你可以做几件事。第一个是加入Discord。我们总是在那儿发布重大公告和平台更新。因此,首先加入Discord。其次,我们也有邮件列表,在那里我们向平台发送更新、新任务等。关注我们的Twitter或X,这也是获取信息的好方法。但是,加入Discord。Discord是获取所有这些信息的地方。你可以和其他用户以及其他贡献者聊天,这很好,因为他们可以提供建议。如果你想找到一些可能对同样话题和领域感兴趣的人,那也是很有趣的。所以,长话短说,加入Discord。
Joules:是的。如果你还没有在X上关注我们,也请跟上。一旦有新任务上线,我通常也会在上面发布消息。
Justin:是的。
Joules:还有通知。我不知道,数据服务平台的通知中心是否会在有新任务发布时通知你?
Justin:它确实有通知功能,然而,你知道。是的,它确实有通知。它会就某些任务更新和与你所贡献的任务相关的某些更新向你发出警报。但是再说一次,那是信息的一个来源。我还建议加入Discord,因为在你错过某些信息时会非常有用。
Joules:你是说你没有时时在线吗?
Justin:是的。本质上并不会自动发送通知到你的手机,这是一个重要的限制。是的,像Discord那样,如果你的通知开启,当有新任务发布时,你会收到手机上的通知条,这样你就可以更快地找到信息。
Joules:现在仍然存在排行榜或其他方式来追踪我与其他人的表现吗?
Justin:是的。现在有一个全新的仪表盘将显示你的奖励和你所获得的内容。我们将添加一些新功能,模仿或者说看起来像以前的排行榜,但从更刺激的角度。我不会对此过多透露,但简短的回答是:是的,加入Discord。这些信息会首先发布。但是,确实会有新版本的排行榜以及一些非常酷的新功能,这些功能我现在不能透露,因为我们仍在开发中。
Joules:这真有趣,我想起我一位以前CEO常说的一句话,如果你想获取最好的信息,请务必去Discord。那里是每个人首先讨论事情的地方。你想知道任何事情的第一个地方,那可能已经在Discord上讨论过一阵子。而后,如果你在X上看到的消息,它很可能已经在Discord上公开过很久了。而如果你看到像Cointelegraph或Crypto News等任何内容,可能那已经是旧新闻了。
Justin:是的,确实如此。
Joules:一定要查看Discord和项目。
Justin:而且,Discord相较于社交媒体的一个优势在于,它能够真正提供二次反馈。这让用户能够给我们提供反馈,我们会真正看到并阅读所有的反馈,然后将其纳入我们选择优先的特征中。这不仅仅是获取我们消息的渠道。你也可以分享自己的想法和建议,我们会将它们纳入我们的产品策略。
Joules:我们实际上有一个整个会议,讨论本周的反馈。
Justin:是的,你实际上是在帮助我们构建这个平台,这也是非常酷的。
Joules:是的,这也是我很喜欢Sahara的一个方面,大家都对我们所做的工作非常热情,所以这很令人兴奋。一些关于提交任务数量限制的更多问题,所以你可能要再涵盖一下这一点。
Justin:请继续关注。我知道现在这有点困难。部分原因是当我们将平台开放给每个人时,真的很难知道你将接收到一千人还是一百万人。因此,直到我们将其发布出去,我们才知道对吧?所以在谨慎起见,我们实施了这些限制,以确保任务不会在10分钟内全部被完成。因此,随着时间的推移随着我们添加更多任务,你确实会看到这些限制放宽。因此,请耐心等候。
Joules:是的。这也是重要的反Sybil措施。我想这就是。
Justin:确实是的。这是。
Joules:是的,是的。还有一些其他酷炫的反Sybil措施。我已经在公告里提到过。这些措施尚未激活,但在不久的未来会激活的某些任务将要求你锁定一定数量的Sahara,以防止某些更复杂的、高工资的任务的Sybil攻击。这确实是一个相对常见的反Sybil措施。
Justin:是的,是的。我觉得安全的思维方式是,是的,它是为了我们,也是为了Sahara,但也是为了你作为用户不被削弱。对我来说,如果我在贡献任务,投入了每周数小时,但发现有人已设置脚本并自动化并完全压制了我的提交,我会很不高兴。所以不仅仅是保护我们,也是为了确保用户不被削弱,确保你的贡献实际上被采纳和批准,这样你就能获得奖励。
Joules:说的很好。
Justin:是的。
Joules:接下来会添加更多任务吗?很多人对此感到好奇,我们何时会添加新任务。
Justin:尽快。尽快。是的,我不会给你确切的时间,但我会说,在一个非常短的时间窗口内,几天或几周之内,肯定会有新任务添加。
Joules:新任务将会定期添加。我不会担心这一点。你会看到它们弹出。现在开放的任务也有很多可以做的事情。是的,Justin,也许你可以谈谈在后台实际放置任务的情况,因为这并不是想象中那么简单,一个人希望数据服务,然后一个小时后就有新任务了,这并不是这么简单。
Justin:不,并不是。需要发生几件事。因此,现在的设置情况下,我们的任务都来自合作伙伴及其企业关系。这是价值交换,因为这些是我们与合作伙伴和企业之间的实际合同。因此,有一个整个过程需要确定预算、确定收集目标、确定时间线。这项工作很多。而且甚至在所有这些确定后,每个任务都需要非常具体的说明。
这会花费技术提升在平台工程方面,以确保它们能够正确呈现,你能够顺利浏览不同模块,你能看到你的接受状态,以知道你是否会获得奖励。这些都有很多需要考虑,这每个都需要逐一处理。并不是我们可以批量上传任务。每个上传到平台的任务都是我们审核的,由我们直接添加的。这可能非常耗时,我们感谢大家在此过程中保持耐心。正如Jules提到的,我们将继续添加更多。我认为将来会有一些变化和平台的功能,能让这个过程更顺利。
因此,再次请继续关注。加入Discord。
Joules:




