告别预设脚本和关键词触发,京东数字人主播“真听真看真回应”

业界动态 2026-04-16 admin 18578

4月14日,基于京东JoyAI大模型,京东在2026商家大会上发布了以互动Agent为核心的数字人直播智能交互体系,围绕电商知识增强型问答、场控动态响应、多智能体协同三大技术能力,提升数字人主播在直播场景中的交互能力。

同时,京东提出下一代数字人主播的演进方向——从"脚本驱动的提线木偶"走向具备全链路自主决策能力的零售经营智能体。

现场图

行业现状:数字人主播高度依赖人工场控

数字人直播已成电商行业的基础配置,但商家在实际使用中面临一个共性问题:数字人主播高度依赖人工投喂与场控,缺乏对业务的真正理解。

目前,多数数字人主播的运作方式仍是"预设脚本"加"关键词触发"——用户在弹幕里问"多少钱"就报价格,问"怎么用"就读说明书,但脚本之外的问题往往无法有效应答。简单理解,多数数字人主播更像一个记忆力很好的演员,但不懂业务逻辑,本质上是真人直播的数字化复刻。

对商家而言,更实际的困扰在于:数字人无法判断弹幕背后的真实购买意图,无法根据直播间流量变化动态调整节奏,一旦离开人工场控就容易"失灵"。商家期待的是一个能独当一面的主播,实际得到的往往是一个需要持续照看的工具。

京东数字人:三大技术支撑互动能力升级

针对上述痛点,基于京东JoyAI大模型,京东数字人此次发布的互动Agent体系从三个层面切入。

知识层面,京东数字人构建了电商知识增强型问答体系。该体系将商品信息、平台政策、促销活动、国补资格等知识实时融合,并支持接入商家自有知识库,包括客服话术、产品手册、使用教程、品牌介绍等内容。系统同时具备用户洞察能力,可识别用户等级、优惠资格及商品诉求,基于用户历史行为主动预判需求,提升推荐精准度。

执行层面,京东搭建了场控动态响应机制。数字人可实时调用红包、抽奖、优惠券等直播营销工具,将互动与执行打通。系统还会基于实时的观看、互动、转化数据,自动调整讲品与促销节奏,降低对人工场控的依赖。

协同层面,京东引入多智能体协同机制,由场控智能体基于直播目标全局调控流程节奏,互动智能体则聚焦用户需求完成意图识别与个性化应答,两者协同配合。

在交互策略上,该体系设计了四项核心机制:一是对弹幕进行实时意图分类,高购买意向问题优先响应,低价值干扰智能过滤;二是根据流量高低自动切换策略,高流量时聚焦转化效率,低流量时引导互动、吸引停留;三是通过上下文感知实现智能打断与自然回归,保障直播体验连贯性;四是基于实时流量感知主动触发引导下单与互动策略。

PPT图

演进方向:从"听指令"走向"自主经营决策"

在当前互动能力之上,京东数字人进一步描述了行业演进的方向。

下一代数字人主播将搭载"快慢双驱"能力体系。"快思考"负责毫秒级基础交互响应,包括用户进房欢迎、情绪安抚、简单问答、流程推进等,保障全天候稳定运营;"慢思考"则深度融合供应链、库存、流量、价格等全链路零售数据,支撑商品排品、库存调度、价格策略、转化优化等经营决策。

在这一模式下,数字人能够在检测到SKU库存紧张时自动申请补货或切换替代商品,在识别到用户犹豫时自动匹配专属优惠券进行促单。

这意味着数字人将彻底摆脱对预设脚本与人工场控的依赖,从被动执行指令升级为主动理解生意、自主制定经营策略的零售Agent。数字人不再需要运营人员"喂"脚本,而是能自己看懂生意数据,自己决定卖什么、怎么卖。

从"懂知识"到"会互动",从"听指令"到"自主决策",京东数字人正从交互体验优化走向经营能力重构,为行业提供了一个从"工具"到"智能体"的演进样本。