Nvidia 招募人形机器人领域知名人士打造新人工智能平台 GR00T
来源:建站-站长之家 发布日期:2024-03-19
站长之家(ChinaZ.com) 3月19日 消息:近日,英伟达通过推出诸如 Isaac 和 Jetson 等项目,为自身作为机器人创新驱动力提供了强有力的证据。在年度 GTC 开发者大会上,该公司还宣布将通过 GR00T 项目进一步巩固在人形竞赛中的地位,这一举措被认为是对漫威的致敬。GR00T 项目被称为“人形机器人的通用基础模型”,旨在为最近涌现的众多机器人制造商构建一个统一的人工智能平台。这些制造商包括1X Technologies、Agility Robotics、Apptronik、Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics 和 XPENG Robotics 等。图源备注:图片由AI生成,图片授权服务商MidjourneyAgility Robotics 的联合创始人兼首席机器人官 Jonathan Hurst 表示:“我们正处于历史的转折点,像 Digit 这样的机器人将永远改变劳动力。现代人工智能将加速发展,为像 Digit 这样的机器人在日常生活的各个方面提供帮助铺平道路。我们很高兴与 NVIDIA 合作,投资计算、模拟工具、机器学习环境和其他必要的基础设施,以实现机器人成为日常生活一部分的梦想。”Sanctuary AI 联合创始人兼首席执行官 Geordie Rose 也表示:“Embodied AI 不仅有助于解决人类面临的一些最大挑战,还将创造目前超出我们能力或想象的创新。如此重要的技术不应孤立构建,这就是我们优先考虑 NVIDIA 这样的长期合作伙伴的原因。”除了GR00T 项目外,Nvidia 还推出了新硬件Jetson Thor,这是一款专为运行模拟工作流程、生成人工智能模型等人形外形而设计的新型计算机。该硬件包括基于NVIDIA Blackwell 架构的下一代GPU,其变压器引擎可提供800teraflops 的8位浮点AI 性能,以运行GR00T 等多模式生成AI 模型。这一系列创新显着简化了人形机器人的设计和集成工作。此外,本周的 GTC 机器人公告还包括另外两个关键项目:Isaac Manipulator 和 Isaac Perceptor。Isaac Manipulator 为机械臂提供了最先进的灵活性和模块化人工智能功能,拥有强大的基础模型和 GPU 加速库集合。这些创新将为下一代机器人技术带来更大的灵活性和效率,为日常生活带来更多可能性。
【腾讯云】11.11云上盛惠!云服务器首年1.8折起,买1年送3个月!
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
NVIDIA发布GR00T基础模型 对Isaac机器人平台进行更新
NVIDIA在最新的消息中宣布了ProjectGR00T,这是一项为人形机器人提供通用基础模型的项目。该项目的推出旨在推动机器人和具象化人工智能领域的突破。NVIDIA正在为1XTechnologies、AgilityRobotics、Apptronik、BostonDynamics等领先的人形机器人公司构建全面的人工智能平台,以支持不断发展的机器人生态系统。
AMD显卡继续学习NVIDIA:终于补上AI缩放
众所周知,AMD显卡经常跟在NVIDIA后边学习先进技术,现在看起来,FSR超分辨率缩放技术经过三代的进化之后,终于要借鉴NVIDIA的方式,也引入AI。DLSS、FSR、XeSS是当今三大显卡厂商各自提出的超分方案,但实现方式各有不同。FSR3这一代被拉开的差距比较大,帧生成技术效果也不够好,就看下一代怎么样了。
Nvidia因使用侵权作品训练NeMo AI平台被作者起诉
在一场法律纷争的风波中,以其芯片驱动人工智能的Nvidia公司被三位作者起诉,指控其未经许可使用了其版权图书来训练NeMoAI平台。BrianKeene、AbdiNazemian和StewartONan三位作者提起了诉讼,声称他们的作品成为NeMoAI平台训练的约196,640本书的数据集的一部分。对于整个科技行业言,这也是一个提醒,即在追求创新的同时,应当更加注重尊重知识产权和保护作者的权益。
英伟达为什么越涨越便宜 NVIDIA AI应用有哪些?
近期关于「英伟达为什么越涨越便宜」的报道显示,英伟达在股票市场上经历了一段波澜起伏的时期。英伟达的股价一路大涨,市值逼近苹果,盘中涨幅超过5%,让人看到了其潜力和吸引力。如果您想深入了解更多关于英伟达的AI应用和技术,请访问AIbase官方网站。
AMD MI300X这次成了!大量NVIDIA用户投奔而来
NVIDIAAIGPU风头无两,公司市值全球第三,黄仁勋甚至声称对手免费也无法击败自己,但事实上,AMDMI300系列这一代还是可圈可点的,也吸引了大量用户。TensorWave对82名高级工程师、AI专家进行的独立调查显示,大约50%的受访者表示对AMDMI300XGPU充满信心,原因是相比NVIDIAH100系列不但性价比更高供货充足,不会因为缺货加价。AMD在开发支持、生态建设方面还存在较大的差距,仍需努力追赶。
NVIDIA CEO 称 AI 在五年内可能通过人类测试
Nvidia首席执行官黄仁勋周五表示,根据某些定义,人工智能普遍智能可能在五年内实现。黄仁勋是全球领先的人工智能芯片制造商,用于创建像OpenAI的ChatGPT等系统。我们也在不断改进算法和的处理能力。
功耗高达1000W!NVIDIA B200 GPU加速器明年到来
根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器B100”,官方称可轻松搞定1730亿参数大语言模型,是现在H200的两倍甚至更多。B100之后有更强大的升级版B200,一如现在H100、H200的关系。NVIDIAGTC2024图形技术大会将于3月18-21日举行,必然会披露新一代GPU加速器的情况,甚至有可能正式宣布。
三位作家起诉Nvidia指控AI芯片制造商侵犯版权
3月10日,三位美国作家向旧金山联邦法院针对芯片制造商Nvidia提起集体诉讼,指控该公司在未经授权的情况下使用他们的版权作品训练人工智能系统NeMo。根据诉讼文件,作家布莱恩·基恩、阿卜迪·纳泽米安和斯图亚特·奥南声称,他们的作品是近20万本数据集中的一部分,这些数据集被用于训练NeMo模拟普通书面语言。凭借AI芯片的强劲需求,Nvidia股价自2022年底以来飙升近6倍,市值接近2.2万亿美元,成为投资者最青睐的科技公司之一。
NVIDIA封杀转译兼容CUDA!摩尔线程官方:MUSA、MUSIFY不受影响
近日,NVIDIA更新了CUDA11.6版本安装程序中的EULA协议条款,明确禁止以转译模拟的方式兼容CUDA。不仅是Intel、AMD这样的国际巨头,不少中国GPU厂商也在通过各种方案支持CUDA,包括摩尔线程、壁仞科技、沐曦科技等,它们是否会受影响呢?摩尔线程强调,将充分发挥从芯片到显卡到集群的智算产品优势,继续打磨MUSA,持续为大模型训练与推理提供高性能算力支撑。
戴尔高管透露,Nvidia正在研发一款耗能高达1000W的GPU B100
划重点:-Nvidia计划推出功耗高达1000W的B100AI加速器,比之前的产品多出42%的功耗。-Dell高管表示,虽然GPU的功耗将持续增加,但直接液冷可能不再是必需的解决方案。Nvidia拒绝置评,这是可以理解的,因为其年度GTC大会仅几周后就要举行。
NVIDIA Blackwell Platform:开创计算新时代的NVIDIA Blackwell平台现已发布
NVIDIA Blackwell平台使用六项变革技术推动加速计算,能够在减少成本和能耗的同时,实现实时生成AI和处理高达数万亿参数的大型语言模型。
AI算力平台
OMG:是一个基于深度学习的图像超分辨率工具
OMG(Once More Generalization)是一个开源的图像超分辨率工具,它利用深度学习技术来提高图像的分辨率。该项目旨在通过AI模型增强图像质量,使其在放大后仍然保持清晰和细腻。
图像超分辨率
AI图像处理
Upscale.media Plugins:简化工作流程的强大图像转换套件
Upscale.media插件使用先进的AI技术,提供图片放大和增强功能,只需几次点击即可简化您的图像处理工作流程。成千上万的用户已经使用Upscale.media来节省时间并获得出色的结果。
图片无损放大
AI图片拓展
Face to Many:一键将你的脸部照片转成各种好玩的风格
Face to Many 可以将一张面部照片转变成多种风格,包括 3D、表情符号、像素艺术、电子游戏风格、粘土动画或玩具风格。用户只需上传一张照片,然后选择想要转换的风格,即可轻松创建奇妙有趣的面部艺术作品。产品提供多种参数供用户自定义,包括降噪强度、提示强度、深度控制强度和 InstantID 强度。
DarkGPT:基于GPT-4-200K的OSINT助手,设计用于对泄露数据库执行查询
DarkGPT是一个基于GPT-4-200K的开源OSINT(开放源码情报)助手,旨在帮助用户在泄露的数据库上执行查询。它提供了一个人工智能助手,可以在传统的OSINT流程中发挥作用。
OSINT
GPT-4
Chaturji:为您的团队激活最佳AI,支持合作分享。
Chaturji是一个团队分享为焦点的AI助手,可以让团队访问世界上最好的AI,编写、保存、组织提示,共享提示和协作,以及获取分析和监控使用情况。
AI文档工具
Writesonic AI Article Writer:快速生成事实准确、引用丰富的SEO优化文章。
Writesonic的AI文章生成器支持生成事实准确、含引用和内部链接的文章,优化SEO,助力内容快速排名。适用于内容写手、SEO专家和机构,能在数分钟内完成文章创作,降低成本,提升效率。
AI文档工具
SEO优化
NVIDIA Project GR00T:用于人形机器人学习的通用基础模型
NVIDIA Project GR00T是一种通用基础模型,可在仿真和真实世界中改变人形机器人的学习方式。通过在NVIDIA GPU加速模拟中进行训练,GR00T使得人形机器人能够从少量的人类演示中通过模仿学习和NVIDIA Isaac Lab进行强化学习,并可从视频数据生成机器人动作。GR00T模型接受多模态指令和过去的交互作为输入,并输出机器人需要执行的动作。
SystemAnimatorOnline:XR Animator,由System Animator Online驱动的基于AI的全身动作捕捉和扩展现实(XR)解决方案
SystemAnimatorOnline是一个基于AI的全身动作捕捉和扩展现实(XR)解决方案,旨在为XR Animator提供支持。该项目利用人工智能技术来捕捉和模拟全身动作,适用于XR领域的动画制作和交互设计。
AI动作捕捉
XR解决方案
Prefind.ai:智能 AI 搜索引擎
Prefind 是一款智能 AI 搜索引擎,采用 GPT-4 和 Claude-3 技术,提供多模型比较和快速搜索等功能。完全免费。
GPT-4
Prentus | Job Tracker, AI Networking, & Application Helper:追踪职位、扩展社交网络、AI辅助快速申请,让您更快地找到梦寐以求的工作。
Prentus是一款能够帮助您更快地找到理想工作的插件。它集职位追踪、扩展社交网络和AI辅助快速申请于一体。您可以追踪职位、扩展人脉网络,并利用AI辅助快速生成求职邮件和填写申请表格。Prentus能够自动提取职位详情,并提供AI工具生成个性化的简历、求职信和面试问题。让您成为每个职位的顶级申请者。
Kater:快速转换数据,使数据可被任何人使用AI
Kater是一个AI数据分析工具,可以快速转换数据,遵循软件开发最佳实践,使数据可被任何人使用AI。它可以通过以英语提问的方式与数据进行交互,提供智能标签、分类和数据整理功能,并帮助用户定义语义层、度量层和文档等。Kater还可以将验证的答案存储在查询库中,以便提供更准确的回答。
Blur ID:自动打码工具,识别隐私内容并一键打码保护隐私
Blur ID 是一款自动打码工具,能够检测照片/截图中包含的隐私文本、头像和二维码,并自动打码以保护隐私。用户可以自定义头像实现沉浸式打码效果。该应用程序完全在本地运行,无需服务器,保证隐私安全。支持打码的内容包括人脸、敏感文字、头像、二维码和条形码。软件通过不断优化模型来提高识别准确率。Blur ID提供了免费版本及付费的订阅服务,付费版本提供更多高级功能。
敏感内容识别
NextStarterAI::一站式开发套件,用于您的下一个项目。包括Next.js、Tailwind CSS、Supabase、Stripe、Lemon Squeezy等。
NextStarterAI是一个全面的开发套件,旨在帮助用户快速启动SaaS、AI工具或其他任何类型的Web应用程序。它提供了Next.js模板、着陆页组件、支付系统集成(Stripe/Lemon Squeezy)、营销指南、数据库解决方案(Supabase)、SEO标签、博客板块、邮件发送服务(Mailgun)等,以及终身更新。
一站式开发
Next.js
Tailwind CSS
Stable Video 3D:从单张图片生成高质量3D视图和新颖视角的3D生成技术
Stable Video 3D是Stability AI推出的新模型,它在3D技术领域取得了显著进步,与之前发布的Stable Zero123相比,提供了大幅改进的质量和多视角支持。该模型能够在没有相机条件的情况下,基于单张图片输入生成轨道视频,并且能够沿着指定的相机路径创建3D视频。
新颖视角合成
包阅AI文档阅读:包阅AI帮你阅读广、理解深、效率高
包阅AI阅读助手支持一键总结、AI问答、多语言翻译,涵盖网页、论文文献、法律文档、学术科研、产品手册、市场报告、电子书等多种内容类型。功能包括总结提炼、深度理解、问答解惑、文献检索、文案润色等。定位于帮助用户高效阅读和理解各类文本资料。
AI文档工具
Griffon:高分辨率多模态感知 LVLM
Griffon 是第一个具有本地化能力的高分辨率(超过1K)LVLM,可以描述您感兴趣的区域中的所有内容。在最新版本中,Griffon 支持视觉语言共指。您可以输入图像或一些描述。Griffon 在 REC、目标检测、目标计数、视觉/短语定位和 REG 方面表现出色。定价:免费试用。
Skyvern:使用LLMs和计算机视觉自动化基于浏览器的工作流程
Skyvern是一个自动化工具,它结合了大型语言模型(LLMs)和计算机视觉技术,用于自动化基于浏览器的工作流程。它提供了一个简单的API端点,可以完全自动化手动工作流程,替代易碎或不可靠的自动化解决方案。
浏览器工作流程
Creatie:.ai是一款为创意人士设计的AI驱动设计工具
Creatie.ai不仅仅是一个设计工具,它体现了对AI在不取代设计过程的前提下增强设计潜力的信念。Creatie.ai通过其多功能的AI设计,让用户的想象力无限扩展,观察设计如何栩栩如生。
AI设计工具
3D图标生成
Animagine XL 3.1:基于稳定扩散生成高质量动漫风格图像的文本到图像模型
Animagine XL 3.1 是一款能够基于文本提示生成高质量动漫风格图像的文本到图像生成模型。它建立在稳定扩散 XL 的基础之上,专门针对动漫风格进行了优化。该模型具有更广泛的动漫角色知识、优化过的数据集和新的美学标签,从而提高了生成图像的质量和准确性。它旨在为动漫爱好者、艺术家和内容创作者提供有价值的资源。
文本到图像
生成式AI