IT之家 6 月 9 日消息,在今天(6 月 9 日)召开的 2026 年全球开发者大会(WWDC)上,苹果公司在 AI 修图方面,引入空间重塑(Spatial Reframing)、扩展(Extend)以及移除干扰元素(Clean Up)三项功能。 空间重塑(Spatial Reframing) 在官方示例中,苹果高管要重新构图一张孩子的照片。他在编辑窗口中点击“重新构图”,然后触摸并拖动来围绕拍摄对象旋转图像。IT之家附上相关视频如下: 苹果高管表示,为确保重构后的图片和原图保持一致,该功能会生成新的内容,来填补视角变化造成的空白。 扩展(Extend) Extend 工具则能在不裁掉关键内容的前提下扩展画面、拉直地平线或调整长宽比。 例如用户可以在不裁剪掉任何重要部分的情况下矫正倾斜的地平线,或者调整宽高比,“扩展”工具会自动填充缺失的部分。 Clean Up 升级后的 Clean Up 还能更自然地移除干扰元素,即使面对复杂的场景,用户也能以更高的质量和更逼真的填充效果去除干扰元素。
IT之家 6 月 9 日消息,在目前正在进行的 WWDC26 中,苹果宣布为照片 App 引入“空间构图”技术,相应功能号称来自 Vision Pro 技术,能够帮助用户先拍照再构图。 具体来看,苹果利用设备端空间模型和基于专用云计算的空间模型,让照片变身为“3D 空间场景”,用户可以后期自由放大、移动照片视角位置,支持所有照片,包括相机拍摄的照片。 除此之外,苹果还升级了扩图和背景杂物移除功能,进一步增强了相应功能效果。并改进图乐园功能,新增支持生成写实风格图片。
自己用AI开发了个软件,想用中转站的gpt-image-2给我生成几张系统架构图之类的图,不知道在哪个平台使用方便,可以结合我的项目进行生图,有佬知道吗?第一次发帖,如果内容板块不合适,请佬们指出,我一定马上调整。 11 个帖子 - 6 位参与者 阅读完整话题
IT之家 6 月 2 日消息,索尼中国今日宣布推出两款新型 PTZ 摄像机,分别为具备 AI 智能构图功能的 4K60P PTZ 摄像机 SRG-AS10 和标准 4K60P PTZ 摄像机 SRG-XS10。 这两款新品均采用索尼自研的新一代 STARVIS 1/2.8 英寸 4K 图像传感器,支持 4K 分辨率和 60 帧每秒的高帧率视频拍摄。 两款摄像机支持 4K 分辨率下的 10 倍光学变焦能力,而在全高清模式下开启长焦转换功能后,可将变焦倍率提升至 20 倍。此外,两款机型还支持通过超采样技术输出全高清画质。 在操作流畅性方面,新品在远程进行平移或俯仰控制时,顿挫感更小,操作手感更平滑。同时,得益于更紧凑、轻巧的机身设计,SRG-AS10 和 SRG-XS10 能够更方便地部署在教室、会议室、体育场馆乃至舞台侧翼等空间有限的区域。 SRG-AS10 和 SRG-XS10 的核心差异在于前者搭载了新一代 AI 智能构图技术。SRG-AS10 通过内置的索尼自研 AI 算法,能够自动识别并持续追踪拍摄主体,智能调整构图,从而降低对操作人员经验的要求。 针对特定应用场景,该摄像机还内置了篮球构图模式。在该模式下,系统可自动识别篮球场范围,并追踪球员与篮球的轨迹,以广角视角完成全自动拍摄。 IT之家注意到,该机型还具备多人跟踪功能,可支持最多 8 人同时处于画面中,并保持构图自然均衡,适用于会议、课堂等多人场景。 相比之下,SRG-XS10 则是一款更专注于提供基础 4K PTZ 功能的机型,适合已有成熟拍摄流程、对自动化功能要求相对简单的应用场景。 在网络和接口方面,两款摄像机均预装了 NDI HX2,并支持 RTSP、RTMP 及 SRT 等多种 IP 流媒体传输协议,能够便捷地融入基于 IP 网络的远程制作流程。 机身还支持 PoE++ 供电技术,通过一根网线即可同时完成电力供应、视频信号传输和设备控制。两台设备也提供了 SDI 和 HDMI 两种传统视频输出接口。 索尼表示,这两款新品的推出旨在服务于政府、企业、教育等领域的客户,以更智能且高效的解决方案,辅助用户制作演出、综艺、体育赛事等内容。两款新品预计在 2026 年年底正式上市。
目前完全不懂摄影,不懂各种参数,不懂构图拍摄方法,想现在开始入门摄影,慢慢培养审美习惯。 最终学到中等水平就行,比普通人好一点,也不用像那些专业的大师一样长枪大炮为了出图奴役自己。 无人机想买但是出了新政策不买了(眼红那些拍旅行的博主,无人机能拍出像 GTAV 电影视角那样)。 目前只有一个过气的安卓旗舰手机和 Insta360 AcePro2 (这玩意拍照连手机都不如全靠滤镜),我需要买单独的相机吗? (预算小几千块)
目前完全不懂摄影,不懂各种参数,不懂构图拍摄方法,想现在开始入门摄影,慢慢培养审美习惯。 最终学到中等水平就行,比普通人好一点,也不用像那些专业的大师一样长枪大炮为了出图奴役自己。 无人机想买但是出了新政策不买了(眼红那些拍旅行的博主,无人机能拍出像 GTAV 电影视角那样)。 目前只有一个过气的安卓旗舰手机和 Insta360 AcePro2 (这玩意拍照连手机都不如全靠滤镜),我需要买单独的相机吗? (预算小几千块)
目前完全不懂摄影,不懂各种参数,不懂构图拍摄方法,想现在开始入门摄影,慢慢培养审美习惯。 最终学到中等水平就行,比普通人好一点,也不用像那些专业的大师一样长枪大炮为了出图奴役自己。 无人机想买但是出了新政策不买了(眼红那些拍旅行的博主,无人机能拍出像 GTAV 电影视角那样)。 目前只有一个过气的安卓旗舰手机和 Insta360 AcePro2 (这玩意拍照连手机都不如全靠滤镜),我需要买单独的相机吗? (预算小几千块)
目前完全不懂摄影,不懂各种参数,不懂构图拍摄方法,想现在开始入门摄影,慢慢培养审美习惯。 最终学到中等水平就行,比普通人好一点,也不用像那些专业的大师一样长枪大炮为了出图奴役自己。 无人机想买但是出了新政策不买了(眼红那些拍旅行的博主,无人机能拍出像 GTAV 电影视角那样)。 目前只有一个过气的安卓旗舰手机和 Insta360 AcePro2 (这玩意拍照连手机都不如全靠滤镜),我需要买单独的相机吗? (预算小几千块)
目前完全不懂摄影,不懂各种参数,不懂构图拍摄方法,想现在开始入门摄影,慢慢培养审美习惯。 最终学到中等水平就行,比普通人好一点,也不用像那些专业的大师一样长枪大炮为了出图奴役自己。 无人机想买但是出了新政策不买了(眼红那些拍旅行的博主,无人机能拍出像 GTAV 电影视角那样)。 目前只有一个过气的安卓旗舰手机和 Insta360 AcePro2 (这玩意拍照连手机都不如全靠滤镜),我需要买单独的相机吗? (预算小几千块)
目前完全不懂摄影,不懂各种参数,不懂构图拍摄方法,想现在开始入门摄影,慢慢培养审美习惯。 最终学到中等水平就行,比普通人好一点,也不用像那些专业的大师一样长枪大炮为了出图奴役自己。 无人机想买但是出了新政策不买了(眼红那些拍旅行的博主,无人机能拍出像 GTAV 电影视角那样)。 目前只有一个过气的安卓旗舰手机和 Insta360 AcePro2 (这玩意拍照连手机都不如全靠滤镜),我需要买单独的相机吗? (预算小几千块)
还有doka相机,下载研究了一下,也想弄一个ai辅助构图的相机软件,但是接了大模型后,相应的速度好慢啊,而且也不准确。有视觉方面的大佬指点迷津吗 2 个帖子 - 2 位参与者 阅读完整话题
一个认证需要用到pptx和架构图领导于是叫我用ai生成,于是我使用codex生成,今天又叫生成说明文档,于是领导过来问我用什么ai工具,我说用codex,可能因为他之前不认识这个工具,就先问我用的是什么模型。我说是gpt模型后,领导觉得国外模型存在数据安全风险,担心聊天记录被导出造成信息泄露,所以要求后续改用workbuddy。 7 个帖子 - 6 位参与者 阅读完整话题
通过GPT沟通详细技术方案,出技术架构图,一开始方案图片和draw.io生成效果都正常,但是一旦要求他调整内容,重新生成,就越来越糊,图片文字连线错乱,有什么办法让它稳定输出。 1 个帖子 - 1 位参与者 阅读完整话题
最近兄弟一直在玩anima这个base模型,发现他的潜力真的非常大,但是看兄弟们还在傻傻的搞节点打开那个破WEBUI,拉线,我感觉就像原始人一样,所以我干脆把anima全自动构图的skills开源了,直接让生产力进步,大伙上班也给我画色图啊!!!!!!以下是这玩意的介绍:让 AI 助手(Snow、Claude Code、Codex 这些)能理解构图和生图流程,不用你手撸 prompt 和调参数。它帮你做四件事 1. 构图规划 — 自动选画幅比例、镜头远近、构图方式、光影方向 2. 标签检索 — 你要画某个角色/画师,它能去索引里查 Danbooru 的有效 tag,不用你自己猜拼写 3. Prompt 组装 — 按 Anima 官方规范把正向负向 prompt 拼好 4. 工作流执行 — 直接调 ComfyUI 出图、放大、缓存一条龙 包含的工具链: * 构图指导(画幅/镜头/构图/光影) * 随机图生成(抽卡、roll 图用的) * Danbooru 标签检索器(Rust 写的,查画师/角色/服装 tag 飞快) * ComfyUI 管理器(导入工作流、执行生图) * 预配了 5 个 Anima 工作流,默认双美学 LoRA + TeaCache + RTX VSR 放大 环境需求: * Windows + ComfyUI + comfyui-skill-cli * Anima base v1.0 模型 + qwen CLIP/VAE * 节点要装 ANIMA_BOOSTER、FLSampler、TeaCache、RES4LYF、RTX VSR * 两块美学 LoRA 的 CivitAI 链接我也放 README 里了 项目地址 → GitHub - ShiroEirin/comfyui-good-anima · GitHub 有啥问题欢迎提 issue 或者直接下面 12 个帖子 - 7 位参与者 阅读完整话题
自己跑了几张车万的cp组,据说这个模型在多人效果和姿势控制这块遥遥领先 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 20 日消息,荣耀 600 系列手机已定档 5 月 25 日发布,荣耀手机官方公布了荣耀 600 系列手机的 磁吸副屏 配件魔法小“耀”屏。 据介绍,这款磁吸副屏支持 四档补光、预览构图、操控拍摄 等功能,还可以充当手机遥控器进行刷抖音等操作。 这款磁吸配件兼具电子吧唧、潮流挂件等玩法,可以轮播用户指定的画面、自由切换壁纸。 据IT之家此前报道,荣耀手机宣布 600 系列将带来 行业唯一全焦段 4K Live ,首发 7 倍超长焦 4K Live + 首发前置 4K Live + 首发双对称 AI 变焦闪光灯。 荣耀 600 系列已知信息和爆料如下: 荣耀 600 6.57 英寸 1.5K 直屏 8600mAh 电池 +80W 有线快充 前置 50MP 后置 200MP(1/1.4")+12MP 骁龙 7 Gen 4 处理器 荣耀 600 Pro 6.57 英寸 1.5K 直屏 8000mAh 电池 +80W 有线快充 +50W 无线快充 前置 50MP 后置 200MP(1/1.4")+12MP+50MP(3.5 倍长焦) 天玑 8550 处理器
ai画出来的图总是线连不好还有图形有时候还会重叠,有什么好的解决方法吗? 3 个帖子 - 3 位参与者 阅读完整话题
各位大佬们 现在我想使用ai进行流程图和架构图之类的绘制,有什么好的开源工具或者项目推荐吗? 3 个帖子 - 2 位参与者 阅读完整话题
大佬们知不知道有没有什么mcp或者skill是了解整个项目的架构图,需要用来清理冗余设计? 1 个帖子 - 1 位参与者 阅读完整话题
4月20日,华为首款鸿蒙AI眼镜正式发布,其搭载1200万超感光摄像头,支持AI构图矫正,具备0.7s超清晰AI闪拍功能,内置小艺智能体,可提供AI实时视频交互,且支持“看一下”支付宝支付。(证券时报)