WWW.YOUINFO.SITE
标签聚合 genai

/tag/genai

cnBeta全文版 · 2026-05-24 07:06:02+08:00 · tech

苹果正筹备启用全新的“Gen AI”网站,相关子域名 genai.apple.com 近期已被添加到苹果的域名服务器记录中,但目前访问该地址尚不会跳转到任何实际网页。据介绍,这一动作发生在苹果年度全球开发者大会(WWDC)召开前数周,而苹果此前已公开表示,将在本届大会上围绕旗下各大软件平台发布一系列“AI 方面的最新进展”。 目前,苹果官网已经上线了Apple Intelligence专题页面,因此外界尚不清楚 genai.apple.com 的具体用途。从命名上看,“Gen AI”被普遍解读为“生成式 AI”的缩写,呼应了近几年由 ChatGPT、Claude 等产品带动的生成式人工智能热潮。 按照现有爆料,苹果即将发布的 iOS 27、iPadOS 27 和 macOS 27 等重大系统更新,都将集成大量 Apple Intelligence 功能,包括一套更具个性化的 Siri 体验,并支持对当前屏幕内容进行智能感知。类似于 ChatGPT 等聊天机器人,据称苹果还将推出独立的 Siri 应用,允许用户与 Siri 进行多轮对话,并可自动管理和删除历史聊天记录。 Apple Intelligence 也将成为苹果新一轮辅助功能升级的基础,例如为用户用 iPhone 拍摄的视频自动生成字幕,提升内容可访问性。此外,语音控制功能将获得自然语言理解能力,用户可以通过类似“点一下关于最佳餐厅的指南”(在 Apple Maps中)或“点那个紫色文件夹”(在“文件”应用中)的自然语句来完成界面操作。 在生产力与效率方面,Apple Intelligence 将帮助用户更轻松地在“快捷指令”应用中创建复杂自动化流程,同时在“钱包”应用中支持全新的“创建通行证(Create a Pass)”选项,用于快速生成自定义票证或卡片。Safari 浏览器有望自动识别并命名标签页分组,而视觉智能(Visual Intelligence)则可以扫描食品营养标签,或从名片、纸质文件中提取信息并直接添加到“通讯录”应用中。 苹果已确认,WWDC 2026 开幕主题演讲将于当地时间 6 月 8 日(周一)上午 10 点举行,届时围绕 Apple Intelligence、Siri 以及“Gen AI”布局的更多细节有望正式揭晓。 查看评论

IT之家 · 2026-05-24 06:40:54+08:00 · tech

IT之家 5 月 24 日消息,2026 年苹果全球开发者大会(WWDC)将于北京时间 6 月 9 日凌晨 1 点举办,距离现在仅剩两周时间。 MacRumors 发现,苹果公司正在持续扩展其 AI 相关布局,该公司已经为子域名 genai.apple.com 做好了技术准备,不过目前该地址并未指向任何一个实际可访问的页面。 IT之家注意到,苹果官网此前已设立专门的“Apple Intelligence”页面,用于介绍旗下个性化 AI 功能。对于 genai.apple.com 这一全新子域名的具体规划,目前尚不明确。 但从名称来看,该子域名很可能指向某种以生成式 AI(Gen AI)为核心的全新服务、工具或平台更新,有可能是对现有 Apple Intelligence 体系的强化或延伸。 在软件功能层面,预计 iOS 27、iPadOS 27 与 macOS 27 等新版系统将包含大量 Apple Intelligence 新特性,其中最受关注的正是升级版 Siri。 根据已知爆料,苹果还将效仿 ChatGPT 推出一款 Siri 独立应用,支持用户与语音助手进行连续对话。与此同时,苹果还在筹备一系列全新的基于 Apple Intelligence 的无障碍功能,例如为 iPhone 录制的视频自动生成实时字幕;语音控制(Voice Control)也将支持自然语言指令,用户可以直接说出“点按地图中‘最佳餐厅’指南”或“在文件应用中点击紫色文件夹”等操作。 在具体应用场景中,Apple Intelligence 将降低快捷指令应用的创建门槛,并为钱包应用带来一项全新的“创建通行证”选项。Safari 浏览器将能够自动为标签组命名,而视觉智能则可扫描食品营养标签,或从名片、文件资料中提取信息并直接存入通讯录应用。

linux.do · 2026-04-25 07:46:59+08:00 · tech

github.com/googleapis/python-genai docs: Add instruction for custom endpoint (#2335) main ← copybara/904525557 已合并 06:49PM - 23 Apr 26 UTC copybara-service[bot] +27 -0 docs: Add instruction for custom endpoint Copybara import of the project: -- 70 … d10f2c8e7068afd1439d3201f417ce725a3562 by AliyahZombie <[email protected]>: doc: Add instruction for custom endpoint FUTURE_COPYBARA_INTEGRATE_REVIEW=https://github.com/googleapis/python-genai/pull/1233 from AliyahZombie:patch-1 dbd593dcbb2b0a4a0b9c673914fd5181d641d745 去年的pr以为没后文了,昨天突然收到被合并的邮件!! 也是混入Google的contributor了 1 个帖子 - 1 位参与者 阅读完整话题

www.ithome.com · 2026-04-24 16:59:34+08:00 · tech

IT之家 4 月 24 日消息,硬件制造商 MINIX 本月 23 日宣布推出基于 NVIDIA(英伟达) Jetson Thor 系列模组的 T4000 / T5000 GenAI 迷你工作站。其 拥有 Arm Neoverse-V3AE CPU 和英伟达 "Blackwell" GPU ,配备至高 128GB LPDDR5X 统一内存。 MINIX T4000 / T5000 系列三维 139.3 × 131 × 76.8 (mm),采用金属 + 塑料机身,内置双涡轮风扇散热,总重 1420g,具备至高 2070 TFLOPS 的 FP4 稀疏算力, 可满足 7B~70B LLM 本地推理的需求 。 这两款 AI 迷你主机预装 1TB PCIe Gen4 固态硬盘,外部提供 2 个 10GbE 网口、Wi-Fi 6E & BT 5.3 无线网卡、2 个 HDMI 2.1 TMDS、4 个 USB-A 5Gbps、1 个 USB-C 10Gbps。

v2ex.com · 2026-04-22 17:04:17+08:00 · tech

我们正在寻找一位对生成式 AI ( GenAI )充满热情,且功底扎实的 Java 工程师加入我们的团队。您将负责构建基于大语言模型( LLM )的企业级应用,利用 Java 强大的生态系统(如 Spring Boot, LangChain4j, Spring AI )连接业务逻辑与 AI 能力。您不仅仅是编写 API ,更是 AI 落地“最后一公里”的关键执行者。 岗位职责 (Responsibilities) AI 应用后端开发: 基于 Java (Spring Boot/Cloud) 设计并开发高可用、低延迟的 AI 应用后端服务(如智能客服、企业知识库 RAG 、AI Agent 平台)。 大模型集成与编排: 负责对接主流 LLM ( OpenAI, Anthropic, 通义千问, DeepSeek 或私有化部署模型),设计 Prompt 工程,并使用 LangChain4j 或 Spring AI 进行任务编排。 RAG 系统构建: 负责向量数据库( Milvus, Pinecone, Pgvector 等)的选型、搭建与维护;实现高效的文档解析、切片( Chunking )、Embedding 向量化及混合检索策略。 性能优化: 针对 AI 响应流式传输( SSE )、并发处理及上下文窗口管理进行系统优化,确保用户获得流畅的交互体验。 跨语言协作: 与算法团队( Python 栈)紧密配合,将训练/微调好的模型通过 API 封装并集成到 Java 业务系统中。 任职要求 (Requirements) Java 核心基础: 精通 Java 基础,熟悉 JVM 调优、多线程编程及高并发处理;熟练掌握 Spring Boot, Spring Cloud 微服务架构。 AI 应用开发经验: 大语言模型( LLM )基本原理( Transformer, Token, Embedding, Temperature )。 熟悉 RAG (检索增强生成) 架构,有实际落地经验者优先。 至少一种 Java AI 框架(如 LangChain4j, Spring AI )或有 Python (LangChain/LlamaIndex) 转 Java 开发的经验。 数据库与中间件: 使用 MySQL/PostgreSQL 。 必须具备向量数据库( Vector DB )或搜索引擎( Elasticsearch/OpenSearch )的使用经验。 工程能力: 熟悉 Docker, Kubernetes 容器化部署;有良好的代码规范和 API 设计能力( RESTful/gRPC )。 学习能力: 对 AI 技术发展保持高度敏感,能快速阅读英文技术文档并落地新技术。 加分项 (Nice to Haves) 有 Python 基础,能看懂算法同事的训练/推理代码。 有本地大模型部署经验(如使用 Ollama, vLLM )。 贡献过 LangChain4j 或 Spring AI 等开源项目代码。 熟悉 AI Agent 设计模式(如 ReAct, AutoGPT 架构)。 邮箱:d2FuZ2p1bmZlbmdAcXRoYWlsdW4uY29t

v2ex.com · 2026-04-22 14:40:45+08:00 · tech

我们正在寻找一位对生成式 AI ( GenAI )充满热情,且功底扎实的 Java 工程师加入我们的团队。您将负责构建基于大语言模型( LLM )的企业级应用,利用 Java 强大的生态系统(如 Spring Boot, LangChain4j, Spring AI )连接业务逻辑与 AI 能力。您不仅仅是编写 API ,更是 AI 落地“最后一公里”的关键执行者。 岗位职责 (Responsibilities) AI 应用后端开发: 基于 Java (Spring Boot/Cloud) 设计并开发高可用、低延迟的 AI 应用后端服务(如智能客服、企业知识库 RAG 、AI Agent 平台)。 大模型集成与编排: 负责对接主流 LLM ( OpenAI, Anthropic, 通义千问, DeepSeek 或私有化部署模型),设计 Prompt 工程,并使用 LangChain4j 或 Spring AI 进行任务编排。 RAG 系统构建: 负责向量数据库( Milvus, Pinecone, Pgvector 等)的选型、搭建与维护;实现高效的文档解析、切片( Chunking )、Embedding 向量化及混合检索策略。 性能优化: 针对 AI 响应流式传输( SSE )、并发处理及上下文窗口管理进行系统优化,确保用户获得流畅的交互体验。 跨语言协作: 与算法团队( Python 栈)紧密配合,将训练/微调好的模型通过 API 封装并集成到 Java 业务系统中。 任职要求 (Requirements) Java 核心基础: 精通 Java 基础,熟悉 JVM 调优、多线程编程及高并发处理;熟练掌握 Spring Boot, Spring Cloud 微服务架构。 AI 应用开发经验: 大语言模型( LLM )基本原理( Transformer, Token, Embedding, Temperature )。 熟悉 RAG (检索增强生成) 架构,有实际落地经验者优先。 至少一种 Java AI 框架(如 LangChain4j, Spring AI )或有 Python (LangChain/LlamaIndex) 转 Java 开发的经验。 数据库与中间件: 使用 MySQL/PostgreSQL 。 必须具备向量数据库( Vector DB )或搜索引擎( Elasticsearch/OpenSearch )的使用经验。 工程能力: 熟悉 Docker, Kubernetes 容器化部署;有良好的代码规范和 API 设计能力( RESTful/gRPC )。 学习能力: 对 AI 技术发展保持高度敏感,能快速阅读英文技术文档并落地新技术。 加分项 (Nice to Haves) 有 Python 基础,能看懂算法同事的训练/推理代码。 有本地大模型部署经验(如使用 Ollama, vLLM )。 贡献过 LangChain4j 或 Spring AI 等开源项目代码。 熟悉 AI Agent 设计模式(如 ReAct, AutoGPT 架构)。 邮箱:d2FuZ2p1bmZlbmdAcXRoYWlsdW4uY29t

v2ex.com · 2026-04-22 14:28:04+08:00 · tech

我们正在寻找一位对生成式 AI ( GenAI )充满热情,且功底扎实的 Java 工程师加入我们的团队。您将负责构建基于大语言模型( LLM )的企业级应用,利用 Java 强大的生态系统(如 Spring Boot, LangChain4j, Spring AI )连接业务逻辑与 AI 能力。您不仅仅是编写 API ,更是 AI 落地“最后一公里”的关键执行者。 岗位职责 (Responsibilities) AI 应用后端开发: 基于 Java (Spring Boot/Cloud) 设计并开发高可用、低延迟的 AI 应用后端服务(如智能客服、企业知识库 RAG 、AI Agent 平台)。 大模型集成与编排: 负责对接主流 LLM ( OpenAI, Anthropic, 通义千问, DeepSeek 或私有化部署模型),设计 Prompt 工程,并使用 LangChain4j 或 Spring AI 进行任务编排。 RAG 系统构建: 负责向量数据库( Milvus, Pinecone, Pgvector 等)的选型、搭建与维护;实现高效的文档解析、切片( Chunking )、Embedding 向量化及混合检索策略。 性能优化: 针对 AI 响应流式传输( SSE )、并发处理及上下文窗口管理进行系统优化,确保用户获得流畅的交互体验。 跨语言协作: 与算法团队( Python 栈)紧密配合,将训练/微调好的模型通过 API 封装并集成到 Java 业务系统中。 任职要求 (Requirements) Java 核心基础: 精通 Java 基础,熟悉 JVM 调优、多线程编程及高并发处理;熟练掌握 Spring Boot, Spring Cloud 微服务架构。 AI 应用开发经验: 大语言模型( LLM )基本原理( Transformer, Token, Embedding, Temperature )。 熟悉 RAG (检索增强生成) 架构,有实际落地经验者优先。 至少一种 Java AI 框架(如 LangChain4j, Spring AI )或有 Python (LangChain/LlamaIndex) 转 Java 开发的经验。 数据库与中间件: 使用 MySQL/PostgreSQL 。 必须具备向量数据库( Vector DB )或搜索引擎( Elasticsearch/OpenSearch )的使用经验。 工程能力: 熟悉 Docker, Kubernetes 容器化部署;有良好的代码规范和 API 设计能力( RESTful/gRPC )。 学习能力: 对 AI 技术发展保持高度敏感,能快速阅读英文技术文档并落地新技术。 加分项 (Nice to Haves) 有 Python 基础,能看懂算法同事的训练/推理代码。 有本地大模型部署经验(如使用 Ollama, vLLM )。 贡献过 LangChain4j 或 Spring AI 等开源项目代码。 熟悉 AI Agent 设计模式(如 ReAct, AutoGPT 架构)。 邮箱:d2FuZ2p1bmZlbmdAcXRoYWlsdW4uY29t

v2ex.com · 2026-04-22 14:16:24+08:00 · tech

我们正在寻找一位对生成式 AI ( GenAI )充满热情,且功底扎实的 Java 工程师加入我们的团队。您将负责构建基于大语言模型( LLM )的企业级应用,利用 Java 强大的生态系统(如 Spring Boot, LangChain4j, Spring AI )连接业务逻辑与 AI 能力。您不仅仅是编写 API ,更是 AI 落地“最后一公里”的关键执行者。 岗位职责 (Responsibilities) AI 应用后端开发: 基于 Java (Spring Boot/Cloud) 设计并开发高可用、低延迟的 AI 应用后端服务(如智能客服、企业知识库 RAG 、AI Agent 平台)。 大模型集成与编排: 负责对接主流 LLM ( OpenAI, Anthropic, 通义千问, DeepSeek 或私有化部署模型),设计 Prompt 工程,并使用 LangChain4j 或 Spring AI 进行任务编排。 RAG 系统构建: 负责向量数据库( Milvus, Pinecone, Pgvector 等)的选型、搭建与维护;实现高效的文档解析、切片( Chunking )、Embedding 向量化及混合检索策略。 性能优化: 针对 AI 响应流式传输( SSE )、并发处理及上下文窗口管理进行系统优化,确保用户获得流畅的交互体验。 跨语言协作: 与算法团队( Python 栈)紧密配合,将训练/微调好的模型通过 API 封装并集成到 Java 业务系统中。 任职要求 (Requirements) Java 核心基础: 精通 Java 基础,熟悉 JVM 调优、多线程编程及高并发处理;熟练掌握 Spring Boot, Spring Cloud 微服务架构。 AI 应用开发经验: 大语言模型( LLM )基本原理( Transformer, Token, Embedding, Temperature )。 熟悉 RAG (检索增强生成) 架构,有实际落地经验者优先。 至少一种 Java AI 框架(如 LangChain4j, Spring AI )或有 Python (LangChain/LlamaIndex) 转 Java 开发的经验。 数据库与中间件: 使用 MySQL/PostgreSQL 。 必须具备向量数据库( Vector DB )或搜索引擎( Elasticsearch/OpenSearch )的使用经验。 工程能力: 熟悉 Docker, Kubernetes 容器化部署;有良好的代码规范和 API 设计能力( RESTful/gRPC )。 学习能力: 对 AI 技术发展保持高度敏感,能快速阅读英文技术文档并落地新技术。 加分项 (Nice to Haves) 有 Python 基础,能看懂算法同事的训练/推理代码。 有本地大模型部署经验(如使用 Ollama, vLLM )。 贡献过 LangChain4j 或 Spring AI 等开源项目代码。 熟悉 AI Agent 设计模式(如 ReAct, AutoGPT 架构)。 邮箱:d2FuZ2p1bmZlbmdAcXRoYWlsdW4uY29t