科技快讯网 4小时前
元旦出行AI成最强决策工具,腾讯云TACO助力同程旅行推理效率翻倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

2026 年元旦伊始,中国旅游市场呈现量价两旺的开门红。"00 后 " 和 "90 后 " 出游占比达到 72%,成为绝对主力军。与曾经的标准模板参团游相比,年轻群体不再满足于传统的观光游览,更加注重旅行体验和个性化表达,他们开始通过各种旅行助手 AI 工具定制、设计 " 千人千面 " 的主题行程。而 AI 工具需求的快速放大,成为了重塑文旅市场服务模式的 " 发动机 ",也对背后的云计算底座提出了新的要求。

承接元旦出行的旺盛需求,同程旅行以 DeepTrip 智能旅行助手为关键抓手,推动服务智能化进一步升级。在搭载了腾讯云计算加速套件 TACO 后,同程旅行 GPU 利用率从 40% 提升到 80% 以上,模型推理速度同步获得优化,为旅游行业 AI 大规模应用提供了可复制、可参考的成功范例。

在同程的业务场景中测试,同样的测试条件下,TACO 推理的性能表现,在满足业务精度要求下,首包延迟缩短到原来的 15%,输出 Token 时延缩短为原来的 40%。

(延迟指标越低越好)

(延迟指标越低越好)

同程旅行 DeepTrip 智能旅行助手自 3 月上线以来,承载着同程旅行从 " 工具型 " 平台向 " 智能服务型 " 平台转型的战略重任。该智能体需要理解用户自然语言描述的旅行需求,实时生成个性化行程建议,并整合酒店、交通、景点等资源。作为国内领先的在线旅行服务平台,同程旅行每日需处理数百万次用户查询,尤其在国庆、元旦等高峰时段,并发请求量急剧增长,DeepTrip 面临稳定运行、快速响应等挑战。

在此背景下,同程旅行选择与腾讯云进行深度合作,部署大模型推理服务。并搭配 TACO 加速能力,优化吞吐。其中在 DeepSeek 模型部署场景中,推理服务吞吐提升两倍,显著降低成本,提升业务体验。

腾讯云计算加速套件 TACO 立足于腾讯丰富的 AI 业务场景,专注于生成式 AI 的核心技术优化,包括训练框架优化、推理性能优化,为客户提供涵盖文生文、文生图、文生视频等多个跨模态领域的 AI 加速能力。

其中 TACO-LLM 作为其核心组件,在大语言模型推理场景展现出显著优势,在 GPU 和国产硬件上,提供文生文场景兼顾高吞吐和低时延的优化方案。

具体而言,TACO-LLM 支持公有化、私有化部署,部署简洁,开箱即用,全面兼容主流模型,包含 DeepSeek 和 Qwen 全系列,100% 兼容开源引擎(vLLM),支持无缝迁移。

同时,基于 TACO 自研的加速组件 TurboAttention、Lookahead Cache 等,持续为客户优化推理性能。 并且支持大语言模型 PD 分离部署,吞吐可相较于开源版本提升 2 倍及以上,在多模态生成,多模态理解等场景,TACO 均可提供 50%+ 的加速。

实际应用显示,面向文生文和图文理解场景,TACO 均能够提供加速能力,在 DeepSeek R1 满血版模型部署时,可实现吞吐性能提升 2 倍,首包延迟显著缩短 12.5 倍;在 QwenVL、InternVL 等模型部署中,计算能力提升超 50%。在保障用户体验的前提下,可成功将业务推理资源消耗量降低至原来的一半,大幅度节约成本。

同程旅行与腾讯云的这一合作成果,不仅为同程旅行带来了显著的业务价值,也正推动整个行业向着更智能化方向持续发展,TACO 将继续在更多行业场景中发挥价值,为各行各业的 AI 规模化应用提供了高效、可靠的实施路径。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 腾讯 腾讯云 同程 元旦
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论