推荐
专栏
教程
课程
飞鹅
本次共找到2241条
能力模型
相关的信息
Stella981
•
4年前
Dubbo网络通讯篇概述
微信公众号:\中间件兴趣圈\作者简介:《RocketMQ技术内幕》作者从本节开始将深入学习Dubbo网络通讯的底层实现细节,在深入学习Dubbo网络模型时,首先应从整体上了解Dubbo的网络通讯模型、线程模型是怎样的?下图是Dubbo官方给出的线程模型:!(https://oscimg.oschina.net/osc
Wesley13
•
4年前
NLP怪兽GPT
2020年5月底OpenAI发布了有史以来最强的NLP预训练模型GPT3,最大的GPT3模型参数达到了1750亿个参数。论文《LanguageModelsareFewShotLearners》长达74页已发布在arXiv。视频讲解:有网友估算最大的GPT3模型大小大约有700G,这个大小即使OpenAI公开模型,我们一
京东云开发者
•
2年前
chatglm2-6b在P40上做LORA微调 | 京东云技术团队
目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm26b在国内开源的大模型上,效果比较突出。本文章分享的内容是用chatglm26b模型在集团EA的P40机器上进行垂直领域的LORA微调。
天翼云开发者社区
•
1年前
国云注智,聚力向新!天翼云打造五位一体智算云能力体系!
5月25日,第七届数字中国建设峰会期间,以“国云注智 聚力向新”为主题的2024智算云生态大会·智算云论坛在福州召开。天翼云全面升级产品及生态矩阵,打造“算力·平台·数据·模型·应用”五位一体的智算云能力体系。会上举行“开源大模型社区发布暨生态繁荣计划启动”、“息壤区域算力互联互通及调度管理服务计划暨息壤城市算力互联网点亮行动”等仪式,通过产业各方伙伴共创、共建、共推智算产业发展再上新台阶。作为云服务国家队,天翼云正以全新智算云布局,加快构建以科技创新为驱动的新质生产力,为数字经济发展与数字中国建设注入澎湃动能。
京东云开发者
•
1年前
chatglm2-6b在P40上做LORA微调
背景:目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm26b在国内开源的大模型上,效果比较突出。本文章分享的内容是用chatglm26b模型在集团EA的P40机器上进行垂直领域的LORA微调。一、c
天翼云开发者社区
•
8个月前
下载超快!2小时下完DeepSeek !还送算力券!!
本文分享自魔乐社区公众号《》还在忍受外网下载DeepSeek模型权重的龟速吗?DeepSeek模型火爆全球,但无数国内开发者却在下载模型时苦不堪言,吐槽下载就像“用2G网下高清电影”。某大厂工程师反馈,从外网下载DeepSeekR1模型,速度仅为2MB/s
codigger
•
3个月前
“小而精” 的语言巨匠:Object Sense 的 Micro 框架如何挑战传统语言的臃肿困境?
主题:探索OSE“最小化核心、最大化扩展”的独特架构哲学,了解Micro语言如何打破语言壁垒,让OSE成为一个能无限集成各语言生态能力的“能力容器”。
1
•••
22
23
24
•••
225