WWW.YOUINFO.SITE
标签聚合 通义

/tag/通义

IT之家 · 2026-06-08 17:49:16+08:00 · tech

IT之家 6 月 8 日消息,阿里巴巴今日宣布合并通义大模型事业部和未来生活实验室, 成立 Token Foundry 事业部 ,由集团 CEO 吴泳铭直接负责。 据了解,此次调整涉及到一批 AI 业务。 周靖人将担任阿里巴巴首席科学家 ,牵头成立阿里巴巴 AI 未来研究院,专注前沿 AI 科技的探索与突破。 郑波带领 Happy Horse、Happy Oyster 等加入 Token Foundry 事业部。 IT之家注意到,此次升级是阿里在 AI 领域的持续加码。最新的 Qwen-3.7 模型实现全球前三、国内第一的 Coding 能力,上个月发布的 Q4 财报首次披露阿里 AI 业务已跨越初期投入阶段,迈入商业化回报周期。 据了解,通义大模型团队从零到一的搭建,到 Qwen 系列模型, 周靖人是关键人物之一 ,他于去年成为阿里巴巴合伙人。首席科学家是阿里巴巴技术体系的最高学术头衔,此次任命既是对周靖人贡献的认可,也是一次面向未来的战略部署。

LinuxDo 最新话题 · 2026-06-08 13:40:34+08:00 · tech

通义千问 APP 正在内测名为 AI 帮我挑的全新功能,备战 618 电商大促。AI 帮我挑在首页拥有独立的一级服务入口,与办事和 AI 生图并列,定位为专属的 AI 导购与决策场景。 AI 帮我挑主要覆盖商品对比与选购攻略等决策辅助模块。通义千问在 5 月已全面接入淘宝 40 亿商品库,实现了从消费决策到直接下单的全链路闭环。用户无需跳出 APP,即可在通义千问内完成商品咨询、比价和优惠测算。 3 个帖子 - 3 位参与者 阅读完整话题

IT之家 · 2026-05-20 15:43:24+08:00 · tech

IT之家 5 月 20 日消息,据通义实验室消息,通义千问团队发布了 Qwen3.5-LiveTranslate-Flash 实时语音翻译模型,该模型在语种覆盖、延迟控制和音色保留等方面实现显著突破,旨在解决跨境直播、跨国会议等场景中的实时同传痛点。 IT之家附官方详细介绍如下: 跨境直播卡顿、跨国会议延迟、AI 配音“机器感”太重…… 实时同传一直卡在“延迟、语种、音色”三大痛点。 Qwen3.5-LiveTranslate-Flash 给出了解决方案: 支持 60 种语言的音频输入和文字输出,29 种语言的音频输出,端到端字均延迟低至 2.8 秒,还能保留说话人的原声特征。 核心亮点速览 Qwen3.5-LiveTranslate 输入音频和输出文本语种从 18 种提升至 60 种,输出音频从 10 种提升至 29 种; 语音同传字均延迟降低至 2.8 秒; 支持实时音色克隆,翻译后仍保留说话人原声特征; 内置热词能力,专有名词和行业术语翻译更精准。 Qwen3.5-LiveTranslate 能听懂和翻译 60 种语言,其中 29 种可以实现语音输出。输入音频和输出文本语种从 18 个大幅提升至 60 个,输出音频语向从 10 个提升至 29 个,覆盖更多国家与区域的语言互译组合,满足跨境会议、直播出海、在线课堂、商务谈判等多语同传需求。 引入全新 Readable Unit(可读单元)实时翻译技术,在保证译文可读性与语义连贯的前提下,实现更激进的流式输出。端到端字均延迟降低到 2.8 秒,适用于直播、连麦、发布会等对时延极敏感的场景。 支持 Real-time Voice Cloning(动态跨语言音色克隆)。在同传过程中自动捕捉并复刻说话人音色特征,译文在不同语言间依旧保持“同一个人”的声音质感与情绪表现力。主播、嘉宾、主持人的身份一致性大幅提升,沉浸感拉满。 内置动态热词(Hotword)引擎,最高支持 1000 个自定义词条。对人名、地名、品牌、产品型号、行业术语进行优先识别与优先翻译。支持场景动态配置与实时更新,显著降低技术发布会、医疗 / 法律 / 金融会议、企业内训中“术语翻错、名字听错”的风险。 我们将模型放入高频实战环境,复杂场景依旧稳定发挥: 跨国会议 & 出境旅游 多语混说 / 复杂口音:会议室多语种交替发言、带口音表达,模型精准切分并同步译。 智能硬件落地:搭配千问 AI 眼镜在泰国点餐实测,语音交互 + 实时同传无缝衔接,沟通零障碍。 直播带货 & 影视出海 数字与规格精准翻译:直播连麦中,商品参数、价格、折扣数字翻译准确率极高,带货宣发不断档。 古文 / 文化内容同传:准确理解并翻译古典文言文,语义连贯且保留文化韵味,字幕与配音同步流畅。 视觉消歧辅助 结合多模态理解能力,在语境模糊时自动引入视觉信息辅助判断,大幅降低“一词多义”导致的翻译歧义。 在公开多语言语音翻译基准(FLEURS、CoVoST2)上,Qwen3.5-LiveTranslate-Flash 翻译准确率优于当前主流语音大模型,显著优于前代 Qwen3-LiveTranslate-Flash,在语言覆盖和翻译质量上均实现突破。 凭借可读单元流式策略,Qwen3.5-LiveTranslate-Flash 相比 Qwen3-LiveTranslate-Flash 将首字延迟降低 3.45 秒、字均延迟降低 1.88 秒,最终实现端到端字均延迟 2.8 秒,翻译质量几乎无损。 相比上一代,Qwen3.5-LiveTranslate-Flash 在核心参数与功能上实现了全面进阶,详细对比如下: Qwen3.5-LiveTranslate 是基于 Qwen3.5-Omni Thinker-Talker 架构打造的翻译大模型。面向同声传译场景,我们采用 chunk-wise 流式输入机制,引入可读单元来控制语音合成粒度,在保证同传体感的同时有效降低时延。此外,借助动态跨语言音色克隆技术,模型在翻译时能够实时识别并模仿说话人的原始音色。 从“能翻译”到“实时同传”,Qwen3.5-LiveTranslate-Flash 用更低延迟、更多语种、更自然音色,为跨境协作、内容出海、智能硬件提供新一代语音基础设施。 立即体验 Blog: https://qwen.ai/blog?id=qwen3.5-livetranslate Demo: https://omni.qwen.ai/live-translate 阿里云百炼:即将上线

LinuxDo 最新话题 · 2026-05-17 11:24:58+08:00 · tech

自 2024-06-18 起,通义灵码结束公测阶段。个人专业版限时免费活动将于北京时间 2026 年 5 月 20 日 18:00:00 正式结束。届时,当前通过限免活动使用个人专业版的用户,其主账号的订阅计划将自动转为个人基础版。个人基础版仍可享有一定有限额度和功能使用次数,详情请参见下方版本功能对比。如需继续使用专业版全部功能,用户可自行按需选购灵码个人专业版。 help.aliyun.com 计费说明 本文主要介绍通义灵码的付费方式、产品价格等说明信息,方便您快速了解通义灵码的相关计费内容。 Quest 模式一天就被我试用完额度了 10 个帖子 - 6 位参与者 阅读完整话题

cnBeta全文版 · 2026-05-10 15:05:49+08:00 · tech

路透社报道称,阿里巴巴 计划官宣将旗下人工智能平台通义千问与电商平台淘宝打通融合,此举旨在以对话式交互替代传统关键词搜索,重塑购物模式。 此次整合落地后,消费者无需手动翻阅商品列表,只需在通义千问应用中与 AI 智能体对话,即可完成商品浏览、比价及下单购买。通义千问将接入淘宝、天猫超 40 亿款全品类商品库,依托专属能力库,可承接物流调度与售后维权全流程服务;同时还能根据用户历史订单、购物偏好智能推荐商品。 淘宝 APP 内部也将上线由通义千问赋能的 AI 购物助手,搭载虚拟试穿、30 天价格走势追踪等实用功能。 阿里巴巴加码 AI 驱动购物,凸显出中外电商平台发展路径差异:国内电商模式可将人工智能深度嵌入真实交易全流程;而海外平台布局更为分散保守,$亚马逊 (AMZN.US)$虽在站内运用 AI 优化购物体验,但对完全自主化智能购物持谨慎态度;加拿大电商平台$Shopify (SHOP.US)$则仅支持接入第三方 AI 智能体,并未搭建面向消费者的自研整合式 AI 平台。 查看评论