生成式 AI 应用落地已经从热火朝天的“百模大战”,步入到了少数优秀模型脱颖而出,工具链百花齐放,以及企业主管认真寻找生成式 AI 落地场景的新阶段。然而,大模型能否真正落地并应用于实践、如何基于开发者自身 IT 架构快速构建AI Native 应用、如何衡量引入生成式 AI 的价值等问题引发行业关注。
在此背景下,亚马逊云科技举办亚马逊云科技生成式 AI 构建者大会。在本次大会中,众行业大咖和技术专家们深度聚焦生成式 AI 前沿技术,就生成式 AI 的热点技术话题和热门应用场景展开了深入分享与交流,为开发者们解读了当下应怎么样应对生成式 AI 带来的机遇,在 AI 时代保持强有力的竞争力。
Zilliz 合伙人兼首席技术官栾小凡、Zilliz AI 云平台负责人陈将受邀参加。
栾小凡表示,向量数据库是一种将数据存储为高维向量的数据库,高维向量是特征或属性的数学表示。拆解来看,向量数据库有两个关键要素,一是面向高维向量数据的解决能力,二是具备一个数据库的基本能力。因此,作为向量数据库需要具备支持向量数据的增删改查、高性能的向量检索、支持数据的持久化、支持一种易用的查询语言的能力。
此外,还可以从许多角度来评估向量数据库:系统的扩展性、弹性、可用性,所采用的向量检索算法,是否支持标量过滤、混合查询、多向量等功能,是否开源,是否提供云服务,还有是不是有完善的生态支持等。Milvus 和 Zilliz Cloud 作为全球领先的向量数据库,能够从多重维度满足开发者对于向量数据库的需求。
当然,并非所有的向量数据库都生而平等。栾小凡认为,开发者评判自己是不是需要真正的向量数据库时,需要着重考虑应用场景。向量数据库的传统应用场景包括文本类(如翻译和语义检索)、图片类(如去重和以图搜图)、视频类(如推荐和内容合规检测)、生物制药、无人驾驶等。随着大模型时代的到来,向量数据库的应用场景也随之拓展,包括 RAG(Retrieval-augmented generation)、AI Agent、多模态大模型等。
陈将在进行主题分享时则对 RAG 应用于向量数据库的场景进行了详细拆解。陈将认为,LLM 的最严重的问题就是缺乏最新的知识和特定领域的知识。对于这一问题,业界有两种主要解决办法:微调和检索增强生成。业内许多公司(如 Zilliz、OpenAI 等)都认为相比微调,RAG 是更好的解决办法。归根究底是因为微调的成本更高,需要用的数据也更多,因此一般适用于风格迁移(style transfer)的场景。
相比之下,RAG 方法使用例如 Milvus 之类的向量数据库,从而将知识和数据注入到应用中,更适用于通用场景。陈将提到,采用 RAG 方法就意味着使用向量数据库存储真理数据,这样做才能够确保应用返回正确的信息和知识,而不是在缺乏数据时产生幻觉,捏造回答。不过,随着越来越多的文档、用例等信息被注入应用中,越来越多开发者意识到信息来源的重要性,它能保证信息准确性,使得大模型的回答更加真实。
生成式 AI 应用落地已经从热火朝天的百模大战,步入到了少数优秀模型脱颖而出,工具链百花齐放,以及...
近年来,VR直播凭借独特的沉浸感和优越的互动性,受到了很多直播观众的欢迎。10月27日,抖音上线了「手机VR...
从前时光里的老街肇庆石牌里位于中国广东省肇庆市端州区狮岗北路,是一个历史悠远长久的村落。这里是老街生...
这些创新在Infor最近的半年度产品发布周期中推出,旨在帮企业实现业务转型和更好地服务客户北京...
说到「咖啡」,你会想到什么?每日上班打工的必备神器?加班时的熬夜搭子?还是清晨早起的续命水?用户认...
在数字化转型、智能化升级引领的新时代浪潮中,一个城市或区域的数字化的经济规模和质量,已成为衡量其核心...
转眼间,2023年即将进入最后两个月,又到了回顾一年并且展望未来的时候。如今,市场正经历着不断的变化...
说到指数基金,自然离不开指数。指数是一个选股规则,它的目的是按照某个规则挑选出一篮子股票,并反映...
近日,2023年珠海市优秀非公有制企业与优秀民营企业家表彰大会顺利召开。会上,冠宇集团荣获珠海市优秀民营...
2023北京马拉松跑鞋大数据出炉10月29日,2023北京马拉松暨全国马拉松锦标赛(北京站)落下帷幕。据组委...
生成式 AI 应用落地已经从热火朝天的百模大战,步入到了少数优秀模型脱颖而出,工具链百花齐放,以及...
导言钱大妈百县千村系列报道,旨在发挥消费端反向推动农产品供给侧改革和提质增效的优势,实现农民种植...
10月27日,国家卫生健康委临床检验中心(NCCL)公布了《2023年全国