Genie效果的动图截图演示。图片来源:谷歌官网
据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。
过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过单个图像提示即可生成交互式、动作可控的环境。
Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。
Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的,而且能根据生成的环境来推测出多种潜在的动作。
该模型接受单个图像(无论是AI合成图像、照片还是草图),并将其转换为可玩的游戏,响应用户控件。从图像到基本的交互环境一步到位。
用户只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是AI生成对2D世界的描述,Genie就会完成剩下的工作,帮用户生成2D游戏。
谷歌官网称,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境,这为生成和进入虚拟世界的各种新路径开启了大门。
吃什么东西增强免疫力 | 普外科是什么科 | 后背麻木是什么原因 | 金贵肾气丸治什么病 | 大名是什么意思 |
主观臆断是什么意思 | 吃什么能治疗早射 | 眉中间有竖纹代表什么 | 血压高喝什么茶 | 夏枯草长什么样 |
感统失调挂什么科 | 唐氏综合症是什么原因 | 性质是什么 | 山见念什么 | 同病相怜什么意思 |
换肾是什么病 | 晚来天欲雪能饮一杯无什么意思 | 孕妇缺铁对胎儿有什么影响 | 老是饿是什么原因 | 乌梅是什么水果做的 |
4月24号是什么星座hcv9jop7ns2r.cn | 痛经吃什么水果hcv9jop6ns6r.cn | 出家人不打诳语是什么意思hcv8jop8ns0r.cn | 壑是什么字hcv9jop2ns5r.cn | 梦见撞车是什么预兆hcv7jop6ns6r.cn |
台甫是什么意思hcv8jop4ns4r.cn | 石决明是什么hcv9jop1ns8r.cn | 胆经不通吃什么中成药hlguo.com | 足下生辉是什么意思hcv8jop0ns6r.cn | apart是什么意思hcv8jop3ns1r.cn |
三高不能吃什么食物youbangsi.com | 明月照沟渠是什么意思hcv9jop2ns1r.cn | 吃什么菜对眼睛好qingzhougame.com | 农字五行属什么hcv9jop1ns0r.cn | 双响炮是什么xianpinbao.com |
麦露迪女鞋什么档次hcv8jop1ns6r.cn | 内分泌科主要看什么naasee.com | 总胆固醇高是什么原因hcv7jop5ns6r.cn | 蜂蜜水什么时候喝最好hcv8jop8ns5r.cn | 献血有什么要求hcv8jop2ns6r.cn |