-
元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用
元象发布了XVERSE-MoE-A4.2B大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部
-
微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变
微软和苏黎世联邦理工学院的研究人员联合开源了SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25%左右,同时保持性能不变。实验数据显示,在保持零样本任务
-
魔搭社区开源多模态对齐统一框架OneLLM
OneLLM是一种多模态对齐的统一框架,它使用通用编码器和统一的投影模块与LLM对齐多模态输入。OneLLM还通过使用modalitytokens实现了在不同模态之间的切换。OneLLM在视频-文
-
零一万物Yi-34B-Chat微调模型及量化版开源
11月24日,零一万物基正式发布并开源微调模型Yi-34B-Chat,可申请免费商用。零一万物还为开发者提供了4bit/8bit量化版模型,Yi-34B-Chat4bit量化版模型可以直接在消费级显卡
-
开源之夏2023结项审核结果公示
#开源之夏2023结项名单公示11月9日,开源软件供应链点亮计划-开源之夏2023的结项名单正式出炉,经过三个月的项目开发和一个多月的严格审核,共产生418个成功结项项目!2023
-
AI视野:百度推千帆SDK开源版本;美图推出“AI封面”功能;支付宝上线AI写真功能;三星发布生成式AI模型
百度智能云升级推出免费开源的千帆SDK,包括数据集管理、模型训练、模型评估、服务部署等功能,助用户轻松构建大语言模型应用。具体操作指引可点击链接查看:https://github
-
英伟达最新AI AgentEureka开源 可完成转笔等复杂动作
英伟达最新的AIAgentEureka搭载了强大的GPT-4模型,通过生成奖励函数的方式,使机器人能够完成多项复杂任务,其中包括一些看似简单但难以实现的动作,如转笔、打开抽屉、抛
-
谷歌研究人员在 JAX 中引入了一个开源库 用于在球面上进行深度学习
Google研究人员最近推出了一个基于JAX的开源库,旨在解决在球面上进行深度学习的挑战。传统的深度学习模型通常处理平面数据,例如图像,但科学应用中的数据通常是球面数据。