WWW.YOUINFO.SITE
标签聚合 gallery

/tag/gallery

IT之家 · 2026-06-04 11:12:44+08:00 · tech

IT之家 6 月 4 日消息,科技媒体 9to5Mac 今天(6 月 4 日)发布博文,报道称谷歌 AI Edge Gallery 现已登陆 macOS, 苹果 Mac 用户可在本机运行 Gemma AI 模型 。 IT之家注:AI Edge Gallery 是由谷歌开发的实验性应用,主要让用户直接在本地运行生成式 AI 模型,其核心优势在于完全离线、私密性高且速度快,无需联网即可进行聊天、图像处理和语义理解。 Google AI Edge Gallery Mac 应用界面 适用于 Mac 的 Google AI Edge Gallery 目前仅提供对 Google 自身 5 个模型的访问权限,名称中的“it”代表 instruct(指令调优): Gemma-4-12B-it Gemma-4-E2B-it Gemma-4-E4B-it Gemma-3n-E2B-it Gemma-3n-E4B-it 其中最值得关注的是 Gemma 4 12B,谷歌称该模型可以在 16GB 内存 Mac 上处理文本、视觉和音频,并具备一定代码能力,适合在设备端分析数据和提取信息,让笔记本具备智能体合多模态能力。 与此同时,Google AI Edge Eloquent 也登陆 Mac。它是一款免费听写应用,可捕捉用户语音并转写成文字,同时去除口误、轻度润色文本,让表达更清晰。处理过程在设备端完成,而不是上传云端。 Eloquent 还支持不同写作风格和自定义词汇。用户可以加入姓名、行业术语和常用短语,从而减少听写软件对特定词语的误改。

IT之家 · 2026-05-30 17:01:20+08:00 · tech

IT之家 5 月 30 日消息,微信鸿蒙版 App 今日在华为应用市场(App Gallery)发布了 8.0.18.34(8393250)版本尝鲜升级(如果未抢到尝鲜版本,须等待官方“补货”)测试时间为 2026/5/30-2026/6/29。 和往常一样,本次更新的说明依旧为“修复了一些已知问题”。IT之家整理近期新增特性如下: 登录界面手机号选择国家 / 地区有所增加; 聊天界面图片 / 视频支持横屏自动旋转; 听一听-歌曲制作变更为“音乐回声”,原“歌曲制作”的 AI 写歌和 AI 翻唱功能变更为我要唱和我要说(灰度开放); 听一听歌曲详情页右上角“发现”变更为“留回声”,点击可录制音色进行 AI 翻唱(逐步开放); 设置-通用-听一听新增 AI 翻唱模型(需账号灰度到“音乐回声”功能); 聊天界面长按文字消息新增搜一搜; 视频号支持查看图片类作品(暂不支持发表); 我-视频号-右上角我的视频号新增创作者中心; 视频号作品评论区支持查看和评论图片; 通讯录新增服务号类别,公众号和服务号分类展示; 公众号“置顶”更改为“设为星标”(服务号为置顶); 企业微信联系人主页支持查看朋友圈; 聊天界面播放视频时支持双指缩放(此前朋友圈播放视频已支持缩放,视频号的视频暂不支持缩放); 设置-个人信息与权限新增授权管理,支持管理已授权的移动应用、网站应用; 支持折叠屏和平板以分栏模式显示界面(如无分栏可以清理后台卡片重进); 朋友圈详情页支持评论框常驻底部; 我-小店与卡包右侧展示推荐或关注商品(灰度); 搜索网络结果左侧新增 AI 搜索(部分场景可用); 小店与卡包-通知位置更改为界面右上角(三端同步); 视频号支持展示直播预约; 视频号小红点提醒支持显示在底部“发现”tab; 面容机型在视频通话时,支持包括微信在内的软件调用面容支付,无需挂断视频通话; 修复了一些已知问题。 微信鸿蒙版 App 于去年 1 月正式登陆华为鸿蒙应用市场 App Gallery ,已支持基础通讯、社交、微信支付、公众号、小程序、视频号、直播等主要功能。另外, 微信鸿蒙版安装量也突破了 5000 万次 。

LinuxDo 最新话题 · 2026-05-10 13:37:43+08:00 · tech

GitHub Release 1.0.13 · google-ai-edge/gallery Support Gemma 4's built-in Multi Token Prediction (MTP) to accelerate decoding. Check out the blog post for more details. Try it in AI Chat, Ask Image, Ask Audio, and Prompt Lab (turn on the "Suppo... 需要更新到 v1.0.13 ,下载新的模型文件,并打开这个开关启用 Google – 5 May 26 Accelerating Gemma 4: faster inference with multi-token prediction drafters An overview of how Multi-Token Prediction (MTP) drafters are making Gemma 4 models up to 3x faster at inference. 我们现正为 Gemma 4 系列发布“多词元预测”(Multi-Token Prediction,简称 MTP)草稿模型。通过采用一种专门的推测解码架构,这些草稿模型可在不降低输出质量或推理逻辑准确性的前提下,实现高达 3 倍的推理速度提升。 为何选用推测解码? 从技术现实来看,标准的 LLM(大型语言模型)推理过程往往受限于内存带宽,从而产生了严重的延迟瓶颈。处理器将绝大部分时间都耗费在将数十亿个模型参数从显存(VRAM)传输至计算单元上,而这一切仅仅是为了生成一个词元。这种低效的资源利用导致了计算单元的闲置以及高昂的推理延迟,尤其是在消费级硬件平台上。 推测解码技术将词元的“生成”过程与“验证”过程解耦开来。通过将一个计算开销较大的“目标模型”(例如 Gemma 4 31B)与一个轻量级的“草稿模型”(即 MTP 模型)相结合,我们可以充分利用闲置的计算资源:草稿模型能够一次性“预测”出多个后续词元,且其耗时甚至少于目标模型单独生成一个词元所需的时间。随后,目标模型会对所有这些由草稿模型建议的词元进行并行验证。 推测解码的工作原理 标准的 LLM 采用自回归的方式生成文本,即每次仅生成一个词元。尽管这种方式行之有效,但它存在一个弊端:无论是预测一个显而易见的后续内容(例如在“Actions speak louder than…”之后预测出“…words”),还是解决一道复杂的逻辑推理题,模型所投入的计算资源是完全相同的。 MTP 技术通过推测解码机制缓解了这种低效问题。推测解码是一项由 Google 研究人员在论文 《通过推测解码实现 Transformer 模型的快速推理》(Fast Inference from Transformers via Speculative Decoding) 中首次提出的技术。如果目标模型认可草稿模型所预测的内容,它便会在单次前向传播计算中全盘接受这一整串序列——甚至在验证的同时,还能额外生成一个属于它自己的新词元。这意味着,在通常仅够生成单个词元的时间内,你的应用程序现在能够输出由草稿模型生成的一整串序列,外加目标模型额外生成的一个词元。 1 个帖子 - 1 位参与者 阅读完整话题

v2ex.com · 2026-04-24 22:06:05+08:00 · tech

大家好,最近我做了一个 GPT Image 2 prompt gallery: https://gptimagelab.com 同时把一部分内容整理成了 GitHub 仓库: https://github.com/peterRooo/awesome-gpt-image-2-prompts 主要是因为最近试 gpt-image-2 的时候,发现好的案例和 prompt 很分散,想复用时不太方便,所以整理成了一个 image-first 的 gallery 。 目前有 400+ 个 prompts / templates ,包含人像、海报、信息图、UI mockup 、产品图、包装、3D 场景、文字渲染等类型。每个案例尽量保留效果图、prompt 、来源和分类,方便直接找相似案例改。 后面还会继续补 prompt builder / improver / translator 这类小工具,把一句需求转成更完整的 gpt-image-2 prompt 。 欢迎大家试用和拍砖。如果你有更好的 GPT Image 2 prompt ,也欢迎提 issue / PR 。

v2ex.com · 2026-04-24 21:35:06+08:00 · tech

大家好,最近我做了一个 GPT Image 2 prompt gallery: https://gptimagelab.com 同时把一部分内容整理成了 GitHub 仓库: https://github.com/peterRooo/awesome-gpt-image-2-prompts 主要是因为最近试 gpt-image-2 的时候,发现好的案例和 prompt 很分散,想复用时不太方便,所以整理成了一个 image-first 的 gallery 。 目前有 400+ 个 prompts / templates ,包含人像、海报、信息图、UI mockup 、产品图、包装、3D 场景、文字渲染等类型。每个案例尽量保留效果图、prompt 、来源和分类,方便直接找相似案例改。 后面还会继续补 prompt builder / improver / translator 这类小工具,把一句需求转成更完整的 gpt-image-2 prompt 。 欢迎大家试用和拍砖。如果你有更好的 GPT Image 2 prompt ,也欢迎提 issue / PR 。

v2ex.com · 2026-04-24 21:35:06+08:00 · tech

大家好,最近我做了一个 GPT Image 2 prompt gallery: https://gptimagelab.com 同时把一部分内容整理成了 GitHub 仓库: https://github.com/peterRooo/awesome-gpt-image-2-prompts 主要是因为最近试 gpt-image-2 的时候,发现好的案例和 prompt 很分散,想复用时不太方便,所以整理成了一个 image-first 的 gallery 。 目前有 400+ 个 prompts / templates ,包含人像、海报、信息图、UI mockup 、产品图、包装、3D 场景、文字渲染等类型。每个案例尽量保留效果图、prompt 、来源和分类,方便直接找相似案例改。 后面还会继续补 prompt builder / improver / translator 这类小工具,把一句需求转成更完整的 gpt-image-2 prompt 。 欢迎大家试用和拍砖。如果你有更好的 GPT Image 2 prompt ,也欢迎提 issue / PR 。

v2ex.com · 2026-04-24 20:46:05+08:00 · tech

大家好,最近我做了一个 GPT Image 2 prompt gallery: https://gptimagelab.com 同时把一部分内容整理成了 GitHub 仓库: https://github.com/peterRooo/awesome-gpt-image-2-prompts 主要是因为最近试 gpt-image-2 的时候,发现好的案例和 prompt 很分散,想复用时不太方便,所以整理成了一个 image-first 的 gallery 。 目前有 400+ 个 prompts / templates ,包含人像、海报、信息图、UI mockup 、产品图、包装、3D 场景、文字渲染等类型。每个案例尽量保留效果图、prompt 、来源和分类,方便直接找相似案例改。 后面还会继续补 prompt builder / improver / translator 这类小工具,把一句需求转成更完整的 gpt-image-2 prompt 。 欢迎大家试用和拍砖。如果你有更好的 GPT Image 2 prompt ,也欢迎提 issue / PR 。

v2ex.com · 2026-04-24 20:17:59+08:00 · tech

大家好,最近我做了一个 GPT Image 2 prompt gallery: https://gptimagelab.com 同时把一部分内容整理成了 GitHub 仓库: https://github.com/peterRooo/awesome-gpt-image-2-prompts 主要是因为最近试 gpt-image-2 的时候,发现好的案例和 prompt 很分散,想复用时不太方便,所以整理成了一个 image-first 的 gallery 。 目前有 400+ 个 prompts / templates ,包含人像、海报、信息图、UI mockup 、产品图、包装、3D 场景、文字渲染等类型。每个案例尽量保留效果图、prompt 、来源和分类,方便直接找相似案例改。 后面还会继续补 prompt builder / improver / translator 这类小工具,把一句需求转成更完整的 gpt-image-2 prompt 。 欢迎大家试用和拍砖。如果你有更好的 GPT Image 2 prompt ,也欢迎提 issue / PR 。