快捷搜索:  

google炸场,最强轻量级、盛开模子gemma揭晓,一面pc就能用,内部员工:强是强,但名字取得让我杂沓

"google炸场,最强轻量级、盛开模子gemma揭晓,一面pc就能用,内部员工:强是强,但名字取得让我杂沓,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 " Google炸场,最强轻量级、开放模型Gemma发布,个人PC就能用,内部员工:强是强,但名字取得让我混乱-36氪
账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院潮生TIDE36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台 首页快讯资讯推荐财经(Finance)科技(Technology)创新城市最新创投汽车(Car)企服专精特新直播视频专题活动搜索寻求报道我要入驻城市合作Google炸场,最强轻量级、开放模型Gemma发布,个人PC就能用,内部员工:强是强,但名字取得让我混乱CSDN·2024-02-22 17:01关注性能超 Llama-2

不同于 OpenAI 的闭源大模型,Google、Meta 等科技(Technology)巨头正在发力开放模型来达成弯道超车。

2 月 21 日,Google 推出新一代开放 AI 模型——Gemma(https://ai.google.dev/gemma),这是一个轻量级的模型,比肩 Meta 的Llama 2 模型。

仅是从名称上来看,最新推出的 Gemma 和此前 Google 的 Gemini 还有点傻傻分不清。对此,Google 也在官宣公告中解释称,Gemma 设计的灵感就是来源于 Gemini,拉丁语 Gemma,有“宝石”之意。二者之间稍有不同的是:

可以将 Gemma 视为 Gemini 的更小、更轻的版本。

Gemma 的设计目的是让开发人员和研究人员更容易访问和使用,而 Gemini 的设计目的是用于更复杂的任务。

两种型号均可免费使用,但 Gemma 的免费套餐更为有限。

更为重要的是,Gemma 模型可以在台式机可能者笔记本电脑(Computer)上本地运行。

Gemma 是什么?

整体来看,Gemma 是由 Google DeepMind 和其他 Google AI 团队共同开发而成,采用与 Gemini 模型相同的研究和技术,建立在序列模型、Transformer、基于神经网站的深度学习方法和分布式系统上大规模训练技术至上。模型训练的上下文长度为 8192 个 token。

这款最新的模型有两种尺寸,一个是 Gemma 2B(20 亿参数),另一个是 Gemma 7B(70 亿参数)。每种尺寸都发布了预训练和指令调整变体。

模型权重将以许可商业授权的方式发布,同时 Google 也会发布一个新的负责任的生成式人工智能工具包,指导开发者、研究人员负责任地使用 Gemma 模型。

在 AI 中,参数是神经网站中确定 AI 模型行为的值,权重是存储在文件中的这些参数的子集。

Gemma 的发布,也是 Google 自 2022 年 OpenAI 推出 ChatGPT 以来发布的首个开放式 LLM,但这并不是 Google 对开放式 AI 研究的第一个贡献。在官方博客中,Google AI 团队表示, 其在过去带来了 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold 和 AlphaCode 等重要的 AI 架构和工具集。

所以这一次,其也为所有主要框架提供推理和监督微调 (SFT) 工具链:JAX、PyTorch 和 TensorFlow(通过本地 Keras 3.0)。

还有随时可用的 Colab 和 Kaggle 笔记本,以及与 Hugging Face、MaxText 和 NVIDIA NeMo 和 TensorRT-LLM 等流行工具进行(Carry Out)了集成,方便开发者更容易上手使用 Gemma。

经过预训练和指令调整的 Gemma 模型可在笔记本电脑(Computer)、工作站可能 Google Cloud 上运行,并能够部署在 Vertex AI 和谷歌 Kubernetes Engine 上。

除此之外,英伟达在今天(Today)宣布与 Google 合作,在包括本地 RTX AI PC 在内的所有英伟达 AI 平台上启动优化,用来加速 Gemma 的性能。

同尺寸下,最先进的性能

当然新模型的发布,难免要和业界已存在的大模型一较高下。Google 在发布一份 16 页的 Gemma 技术报告时,将其与 Meta 的 LLaMA 2(7B)、LLaMA 2(13B),以及 Mistral(7B)进行(Carry Out)了性能对比。

Google 表示,“Gemma 2B 和 7B 与其他开放式模型相比,在其规模上达成了同类最佳的性能。”

Gemma 技术报告评测结果(Result)如下:

从学术基准角度来看,Gemma 7B 在数学、Python 代码生成、常识和常识推理任务的几个基准测试中,优于 Meta 的 Llama 2 7B 和 13B 模型。

详细来看,在 MMLU 基准测试中,Gemma 7B 模型不仅超过了所有规模相同可能更小的开源模型,还超过了一些更大的模型,包括 Llama 2 13B。

Google:Gemma 是负责任的设计

对于 AI 模型的发布,Google 一直采取比较谨慎的态度。

这一次,Google 也特别强调,「Gemma 的设计是将 AI 原则放在第一位。为了使 Gemma 预训练模型安危可靠,Google 使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外,他们(They)还使用了大量的微调和人类反馈强化学习(RLHF),使指令调整模型与负责任的行为保持一致。为了了解并降低 Gemma 模型的风险,我们(We)进行(Carry Out)了严格的评估,包括人工红队、自动对抗测试和危险活动模型能力评估。」

此外,Google 还与 Gemma 一起发布了新的《负责任的生成式人工智能工具包》(https://ai.google.dev/responsible),以帮助开发人员和研究人员优先构建安危、负责任的人工智能应用。该工具包包括:

安危分类:发布 codelab(https://codelabs.developers.google.com/codelabs/responsible-ai/agile-classifiers),可使用最少的示例构建稳健的安危分类器。

调试:带来最新的模型调试工具 LIT(https://codelabs.developers.google.com/codelabs/responsible-ai/lit-gemma#0),可帮助开发者调查 Gemma 的行为并解决潜在问题。

指导:你可以根据 Google 在开发和部署大型语言模型方面的经验,获取模型构建者的最佳实践。

开放模型并不是指开源

最后,在很多教授学者来看,开源和开放权重的人工智能模型是确保聊天机器人透明度和隐私的重要步骤。

不过在发布 Gemma 之际,Google 特别强调了开源和开放模型的区别。其表示,“开放源代码的一个好处是,一旦发布,许可证就赋予用户完全的创作自主权。这为开发人员和最终用户获取技术提供了有力保障。另一个好处是,开放源码技术可以不受限制地进行(Carry Out)修改,以适应最终用户的独特使用情况。”

但是 Gemma 遵循的规则是「开放模型」而非开源。开放模型的特点是可以免费获取模型权重,但使用、再分发和变体所有权的条款根据模型的具体使用条款而有所不同,这些条款可能不是基于开源许可证。

Gemma 模型的使用条款规定,个人开发者、研究人员和商业用户均可自由访问和重新分配这些模型。用户还可自由创建和发布模型变体。在使用 Gemma 模型时,开发者同意避免有害使用,这体现了 Google 对负责任地开发人工智能的承诺,同时也增加了对这项技术的使用。

之所以不用开源一词来形容 Gemma 的属性,在 Google 看来,现有的开源概念并不总能直接应用于 AI 系统,这就提出了如何在人工智能中使用开源许可证的问题。Google 所需要做的是,要澄清开源 AI 的概念,并解决衍生作品和作者归属等概念。

Gemma 这个名字,让你感到混乱吗?

Gemma 一经发布,便受到了不少 AI 从业者的关注,也有不少的媒体将其解读为 Google 正面叫板 Meta 的 LLama。

从体验上来看,网友在 X 社交平台上分享了其用 ollama 在 Macbook Pro M1 Max 32G 上安装了 Google 刚刚开源的 LLM gemma-7b,并直言“gemma-7b 的速度好过 Llama 13 B”。

以下是他的一个测试示例:

对 Gemma 感兴趣的小伙伴,现在可以直接通过 Gemma(https://ai.google.dev/gemma)上手体验。

最后,鉴于过去的三个月里,Google 先是推出了 Gemini,而后干掉了 Bard 品牌名并将其改名为 Gemini,进而推出了更好的版本 Gemini Advanced(可以看做是 ChatGPT Plus 的付费服务;不要与 Gemini Ultra 混淆,这一模型可以视为对标 OpenAI 的 GPT-4)。

不久之后,Google 又推出了另一个改进版本 Gemini 1.5,带来了 Gemini for Workspace。也有媒体报道,Google 内部还开发了一款“Gemini 的后代”——Goose,仅供内部使用,帮助员工更快地编写代码。

面对层出不穷 G 打头阵的名字,据 Business Insider 报道,就连 Google 内部员工都已被“逼疯”,各种内部员工吐槽的表情包涌现出来,发出“哪位 VP 的 OKRs 是以 Al 产品名称的数量来衡量的?”的质疑:

至此,你能准确分得清 Google 的各种模型吗?对最新发布的开放模型 Gemma 又有何看法?欢迎留言分享。

Google Gemma 官方博客:https://blog.google/technology/developers/gemma-open-models/

技术报告:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

使用地址:https://ai.google.dev/gemma

本文来自微信公众号“CSDN”(ID:CSDNnews),整理:屠敏,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

+16

好文章,需要你的鼓励

CSDN特邀作者0收  藏+10评  论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微  博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章智能机器人公司宇树科技(Technology)完成10亿元B2轮融资,美团、金石、源码参投|36氪首发原来是谷歌Open了AI?谷歌大模型迟到的开源战略网易的AI ,让玩家爱恨交加李一舟火了,普通人能靠AI月入过万吗?AI搜索大变局AI美女,组团在抖音(Tik Tok)卖货英伟达业绩再创纪录,黄教主称AI“临界点”已到知名AI创企被曝停工停产6个月?已获D轮融资,最新回复来了最新文章推荐李彦宏弟子赵世奇离开华为,百度10年老将回归,可能重掌搜索业务一文读懂Vison Pro与 Sora 眼前身后的空间计算氪星晚报|贝莱德聘请高盛前高管负责其委托投资业务;梅赛德斯-奔驰2023年平均售价提高2%,至约58万国人币;抖音(Tik Tok)否认停止运营自营家装业务“住好家”,将调整业务方向福布斯发布2024祖国香港富豪榜:李嘉诚蝉联榜首,整体财富缩水看见|多维度提供区域新经济(Economy)服务,36氪助力大湾区抢占人才、产业高地企业家为什么粉“苏王曾”连亏3年,华夏航空6亿“卖子”银行“盯上”压岁钱,存款利率超3%2024上市银行人事“局”:工行董事长落定一分钟狂卖26亿股票,百亿私募砸盘CSDN特邀作者

作者有点忙,还没写简介

发表文章970篇最近内容Google炸场,最强轻量级、开放模型Gemma发布,个人PC就能用,内部员工:强是强,但名字取得让我混乱59分钟前挑战在 Vision Pro 里编程,开发者赞许「超沉浸」,网友试过吐槽:看代码太累了2024-02-20为什么“下云”会成为一种趋势?2024-02-20阅读更多内容,狠戳这里下一篇吃鸡大战后,腾讯和网易又一次激烈交火

《元梦之星》与《蛋仔派对》春节期间竞争激烈。

59分钟前

热门标签一叶子武天贸易壁垒宋卫平绿城设计绿城桃花源丁香医生(Doctor)scott颐堤港小龙虾加盟盱眙小龙虾夜生活(Life)笔刷海康萤石萤石奥巴马医改计划米国医疗保险变革傅磊王煜全红岸基地直投业务周期性行业兴趣和职业公装无忧管控模式香薰香薰精油龙虎斗电话评测电话故障关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴鲸准氪空间富途牛牛企服点评人人都是产品经理领氪36氪APP下载iOS Android本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2024 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间

推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

Google炸场,最强轻量级、开放模型Gemma发布,个人PC就能用,内部员工:强是强,但名字取得让我混乱

您可能还会对下面的文章感兴趣:

赞(567) 踩(30) 阅读数(2918) 最新评论 查看所有评论
加载中......
发表评论