首页 > 企业单位招聘 > 企业单位招聘 > 谷歌发布全新PaliGemma 2视觉模型 能识别人们的情绪

谷歌发布全新PaliGemma 2视觉模型 能识别人们的情绪

发布时间:2024-12-07 12:52:37来源: 15210273549

在众多为人工智能(AI)赋予“视觉”能力的模型中,谷歌的PaliGemma模型占据一席之地。作为谷歌的视觉语言模型,它能够识别图像中的物体和文字。近日,谷歌正式推出了全新的PaliGemma 2模型,并已投入使用。

  PaliGemma初代模型已是一款实用的工具,能够识别图像中的物体,并为图像添加字幕,甚至还能为短视频添加字幕。PaliGemma的一个更为实用的功能是能够回答关于图像的问题。因此,它是一款功能强大的综合模型。

  谷歌于今年5月正式向公众介绍了PaliGemma模型。谷歌希望PaliGemma 2能够成为初代模型的直接替代品。谷歌提供了多个版本的PaliGemma 2,包括30亿、100亿和280亿参数变体,以及224像素、448像素和896像素分辨率版本。

  在其他规格方面,PaliGemma 2支持长文本字幕生成。谷歌表示,它将不仅仅局限于识别物体,还能识别人物并解读其情绪。因此,如果某人感到高兴、悲伤等情绪,PaliGemma 2都能捕捉到。

  此外,该模型似乎还能识别场景中发生的更多内容,以讲述完整的故事。谷歌称,PaliGemma在识别乐谱、化学公式、识别深度以及制作胸部X光片报告方面表现更佳。谷歌为PaliGemma带来了相当显著的更新。如果你想使用它,可以在Hugging Face、Kaggle和Ollama平台上获取其代码。

  谷歌还发布了其视频生成模型Veo的私有预览版。该公司在今年的谷歌I/O大会上宣布了这一消息。如果你正在使用谷歌的Vertex云平台,那么你将有机会进行尝鲜。你可以生成最高达1080p分辨率的视频。

企业单位招聘更多>>

奔驰拿出诚意,这SUV直降16万,轴距超2米8,配置还丰富,不香? 2025年,旗舰SUV新车成为下一个内卷方向! 混合动力车型连续数月,引领新能源乘用车渗透率飙升超50% 日本汽车市场实地观察,一场大败局在酝酿? 捷尼赛思G80黑色版上市,约合人民币40万! 力压赛那/格瑞维亚,24.98 万起,比亚迪夏怎么选? 2024年售40万余台,江淮汽车销量虽然下滑,却也不必过虑 标配云辇-C!角逐赛那/格瑞维亚 比亚迪夏售价24.98万起 车圈成绩单:2024全民狂欢,2025充满挑战 全新比亚迪唐L、汉L预热,双旗舰更新,更大更贵 变“克队友”为“扶队友”,或许是长安汽车未来发展的高速路 大众双揽出击,你觉得谁是家用SUV首选 新能源彻底站稳脚跟!中国品牌24年销量出炉,比亚迪成功登顶 比亚迪唐L上市后,25万级增程SUV的优势,只剩降价了? 春节自驾返乡过年,东风奕派eπ007如奕版能替你说话! 40万+市场:“科技新贵”与“传统老豪”的对决 星纪元ET 2025款增程版四驱:续航、空间、舒适、智能都有了! 华为智驾加持,全新岚图梦想家夜晚城市智驾出乎意料,平稳又舒服 为啥说一汽红旗才是国产豪车品牌?看完2024年这些大事情就明白了 修车师傅都不建议购买的二手车,哪怕不是事故车,价格很便宜 广汽集团首发GOVY AirJet复合翼飞行汽车,抢占低空赛道|天下车智 都什么年代了,中型SUV起售价还18.98万?比亚迪这么自信? 轴距2829mm,曾经销量稳定破万,这款合资车如今被人看不起? 宝马全新风洞实验室亮相,中国品牌风阻技术已领先全球? 剥离动力电池!聚焦储能!跨界上市公司又有新动作 复古造型 丰田Hilux Rangga SUV官图发布 预售12万元起 捷达VA7在成都正式下线 曝特斯拉中国工厂负责人已离职 Lidwave推出Odem 4D LiDAR传感器 可实现更智能、更高效的系统 德国11月汽车产销量同比持平