Page 1 of 1

数据科学家如何改进 Guru 的搜索功能

Posted: Wed Dec 11, 2024 7:22 am
by lizaakter317
了解 Guru 的数据科学家团队如何进行测试、收集客户反馈以及开发产品搜索功能的增强功能。
查看 Guru 的任何产品发布博客文章,您会注意到一个反复出现的主题:改善客户的搜索体验。并且有充分的理由 - 凭借由数据科学家、产品经理和工程师组成的专门搜索团队,Guru 的搜索和知识可发现性始终得到测试和改进。与任何具有搜索功能的技术公司一样,它是 Guru 的基础部分,我们将始终寻求改进和完善。虽然搜索增强功能可能不像 UI 更改、AI 增强功能或新功能那样“华丽”,但它们肯定仍然具有冲击力,并显着增强用户对我们产品的体验。今天,我们要采访我们的搜索团队,看看他们在过去几个月里所做的工作。


感谢三位今天加入我们!首先,您能否向我们介绍一下您自己以及您在 Guru 的搜索 Pod 上所做的工作?
Nina:我是 Search Pod 的数据科学家,所以我专注于弄清楚我们可以尝试哪些机器学习方法来改进搜索。我最近一直关注如何将卡片( Guru 记录信息的格式)的使用方式(查看、复制链接或内容、收藏)合并到我们的搜索算法中,并继续前进,我将研究如何在搜索时更好地理解用户的意图,以确保我们为他们提供最相关的卡片。

Laura:我是 Search Pod 的产品经理,因此我花了很多时间与客户相处,以获取他们的反馈并了解什么对他们最有帮助和最重要。然后,我将其带回团队,以便我们可以决定如何随着时间的推移改进和发展搜索。我规划了我们的短期、中期和长期目标,以便我们能够在搜索的多个方面不断改进。

Jenna:我也是 Search Pod 的数据科学家,我特别关注 华人海外英国数据库包 我们的算法。现在,我专注于我们的内部工具,它使我们能够尝试不同的算法调整,并了解它们如何影响我们客户的搜索结果。我还进行数据分析,以比较我们的搜索当前的表现与过去的表现。潜在变化时它的表现如何。

上次我们讨论Search Pod 时,我们讨论了算法即将发生的变化以及我们测试搜索增强功能的方式。您能告诉我们一些有关这项工作的进展情况吗?

Image

劳拉:我们最近的变化是将卡的使用情况考虑在内,作为寻找最相关和最有用的结果的另一个因素。

Nina:这个想法源于想要了解卡使用数据如何影响 Guru 的人工智能工作。在将这些问题具体应用于搜索之前,我们探讨了卡片“受欢迎程度”与黑客马拉松项目中的实用性如何相关!

Jenna:卡片的使用属于我们对 Search Pod 的更大关注,它引入了新的数据源,可以帮助我们了解卡片的相关性。因此,使用情况将是一个数据源,也是 Nina 为理解意图所做的工作。

一开始,我们知道我们拥有大量关于跨团队使用卡片的方式的数据,并且我们假设围绕卡片的用户行为可以为搜索的增强提供信息。
尼娜:我认为值得注意的是,搜索不仅仅是匹配关键术语,它还了解卡片使用地点和时间的上下文。

最佳%20search%20is%20no%20search.png
Laura:我们关注卡的使用情况,以帮助我们产品其他领域的用户 - 例如,您可以在“我的任务”中查看等待验证的卡的使用数据。

我们还提供了整个应用程序的受欢迎程度得分 - 这些使用数据点旨在帮助用户了解哪些信息对其团队最重要。
将这些数据引入搜索有助于我们使这种体验变得更加普遍。

Jenna:这也有助于我们确保搜索结果是有用的和动态的 - 例如,也许卡片的内容在一年内不会发生太大变化,但在同一时间范围内使用量会急剧增加。这可能表明该卡对团队变得越来越有用,搜索结果应该反映这一点。

您能否告诉我们 Pod 如何决定是否继续进行更改?
Jenna:这个吊舱在我们的方法中是非常具有实验性的,我们有多种级别的实验。我们的测试环境与客户帐户完全隔离,在我们考虑向客户发布更改之前,实验必须“通过”几轮测试。由于我们的实验设置,我们能够非常快速地测试更改,并对我们最终部署给客户的更改更有信心。

尼娜:我还想补充一点,所有这些实验都是由数据驱动的。我们将同时对一项变更进行多次试验,然后使用数据来了解哪些对结果具有最佳的预期影响。例如,我们最近进行了一次冲刺,进行了 110 项不同程度的粒度和复杂性的实验——其中 2 项我们最终根据结果继续推进。有时需要进行数十次实验才能做出改变,有时则需要更多。

Laura:我们所有的指标都围绕着将最相关的结果尽可能放在结果列表的前面。但由于我们的客户团队及其帐户中的内容多种多样,我们必须经过严格的测试,以确保我们在整个客户群中看到积极的结果。

Jenna:我们运行的每个实验都会模拟数十万次搜索,这使我们能够模拟我们需要的搜索量,并充满信心地说,更改将对全面的客户产生积极影响。