WWW.YOUINFO.SITE
标签聚合 LongCat

/tag/LongCat

LinuxDo 最新话题 · 2026-06-09 14:02:05+08:00 · tech

目前已知的模型: LongCat AI 每天 5,000,000 tokens,提case之后审核通过会刷新额度。目前我使用下来有时候会降智 Xiaomi MiMo百万亿 Token 创造者激励计划,有效期一个月,总体感觉比LongCat AI好点 SenseNova AI的sensenova-6.7-flash-lite和deepseek-v4-flash,长时间在一个对话框会出现上下文长度满的报错,有时候服务不稳定会返回400 还有啥呢?欢迎大家补充 6 个帖子 - 5 位参与者 阅读完整话题

IT之家 · 2026-05-22 14:24:25+08:00 · tech

IT之家 5 月 22 日消息,美团技术团队今日正式开源了其数字人视频生成模型 LongCat-Video-Avatar 1.5。 官方介绍称,该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率方面均实现了升级,旨在推动数字人视频生成从“高拟真”走向“真可用”的商业化场景。该版本在 1.0 版本的基础上完成全面升级,定位从“开源 SOTA”走向“商业级应用”。 据介绍,这一版本在基础体验上进行了强化,能够应对长句、快语速、歌唱等复杂语音输入,使唇部运动更精准平滑,同时面部表情、头部姿态与肢体动作也更为协调。 在场景支持方面,借助高质量数据体系,模型可稳定处理真人、动漫、动物等多种主体,并在多人对话场景中自然区分说话者与聆听者。 推理部署方面,LongCat-Video-Avatar 1.5 采用 DMD 蒸馏技术,将生成步数从 50 步压缩至 8 步,推理效率提升约 15 倍,生成一段 10 秒视频仅需约 1 分钟。 从技术架构来看,1.5 版本主要在三方面实现升级。首先是基础体验的商用化,模型将音频特征提取编码器从 Wav2Vec2 升级为 Whisper-large,凭借更大的参数量和更丰富的多语言先验,能够更细致地捕捉音素变化与发音节奏,从而提升唇形同步与全身时序稳定性,减少长视频中的抖动、跳帧和身份漂移。 龙猫团队还构建了一套多阶段数据处理流程,包括离线标注和在线验证,并专门增加了多人数据、静默数据和情绪数据三类增强数据,以应对虚拟人生成的典型难点。 此外,通过逐帧级的 GRPO(Group Relative Policy Optimization)偏好对齐,模型针对手部稳定性和动作连续性进行优化,缓解了手部畸变和动作不连贯等问题。 在性能评测方面,美团基于 EvalTalker 构建了覆盖新闻、教育、娱乐等场景的综合基准。由 770 名评估者完成的 13,240 条主观评分及 10 名专家的结构化分析显示,在物理合理性、时间稳定性、身份一致性和音视频协调性四个维度上,LongCat-Video-Avatar 1.5 的雷达图面积处于领先水平。 用户偏好对比中,该模型相比 Kling Avatar 2.0 胜率为 65.9%,相比 OmniHuman-1.5 胜率为 61.1%,相比 HeyGen 胜率为 54.3%。 在多人场景中,其得分大幅领先 InfiniteTalk;主体变形问题率仅为 23.1%,跳帧问题率低至 0.8%,均优于对比模型。 美团方面表示,数字人视频生成正在从展示效果走向真实使用,希望此次开源能成为一个可验证、可改进、可共建的技术基座,让开发者和创作者基于此探索更多应用边界。 开源链接: Github: https://github.com/meituan-longcat/LongCat-Video HuggingFace: https://huggingface.co/meituan-longcat/LongCat-Video-Avatar-1.5 Tech Report: https://github.com/meituan-longcat/LongCat-Video/blob/main/assets/LongCat-Video-Avatar-1.5-Tech-Report.pdf Project Page: https://meigen-ai.github.io/LongCat-Video-Avatar-1.5-Page/ Modelscope: https://www.modelscope.cn/models/meituan-longcat/LongCat-Video-Avatar-1.5/summary

linux.do · 2026-05-06 17:34:28+08:00 · tech

秘钥:ak_2lD1Bc7Eb99u0Vy1f54a06706jr1P 支持的模型 模型名称 API格式 描述 LongCat-Flash-Chat OpenAI/Anthropic 高性能通用对话模型 LongCat-Flash-Thinking OpenAI/Anthropic 深度思考模型 LongCat-Flash-Thinking-2601 OpenAI/Anthropic 升级版深度思考模型 LongCat-Flash-Lite OpenAI/Anthropic 高效轻量化MoE模型 LongCat-Flash-Omni-2603 OpenAI 多模态模型 LongCat-Flash-Chat-2602-Exp OpenAI 高性能通用对话模型 LongCat-2.0-Preview OpenAI/Anthropic 高性能Agentic模型 支持的接口类型 LongCat API开放平台兼容两种主流API格式,您可以根据需要选择使用: OpenAI API 格式 完全兼容OpenAI API规范,支持以下接口: 对话补全:/v1/chat/completions Anthropic API 格式 兼容Anthropic Claude API规范,支持以下接口: 消息对话:/v1/messages 接入端点 OpenAI格式: https://api.longcat.chat/openai Anthropic格式: https://api.longcat.chat/anthropic 可以参考官方: longcat.chat LongCat API开放平台快速开始 | API 文档 LongCat 开放平台 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-05-01 09:26:17+08:00 · tech

官方文档 LongCat-2.0-Preview: 上下文长度1M,最大输出长度128K Tokens,能达到1M上下文,说明有这个实力 不过or里面的输出比这个大 官方给内测用户每2小时10M 之前叫S什么的模型代号,这几天改名Longcat2.0了 官方文档叫自己高性能Agentic模型,OR里面叫自己高性能Agentic基础模型(high-performance foundation model designed for agentic workloads) 当然,只是个人猜测,也有可能是百度/阶跃的 3 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-25 17:33:41+08:00 · tech

昨天申请的内测体验,今天通过了,据说是全程基于国产算力集群训练 美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练 前沿快讯 [image] 美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练 - IT之家 CC里花了12分钟 提示词 你是 Apple Inc 的顶级 UI 设计师,以 iOS 18 的设计风格(毛玻璃效果、高斯模糊、动态渐变、细腻阴影)创建一个单个 HTML 文件(包含完整 CSS 和 JavaScript)。实现横板天气页面,包含 4 个并排的动画天气卡片: 晴天(太阳光线、动态光晕) 大风(飘动云朵、摇曳树木、风线) 暴雨(下落雨滴、形成水洼、闪电) 暴雪(下落雪花、堆积效果) 卡片需深色背景,支持按钮切换天气状态,实现流畅交互和微动效。代码必须可直接运行,美观度优先。 效果 代码 (点击了解更多详细信息) 4 个帖子 - 4 位参与者 阅读完整话题