150元,全场图书终身免费阅读
注册
登录
立即搜索
三体
三国演义
商品分类
导航
商品分类
首页
会员中心
购买须知
关于我们
其他
历史
期刊杂志
政治军事
哲学宗教
原版书
医学健康
教育学习
科学技术
社会文化
文学
世界名著
外国文学
古代诗词
现代诗歌
语言文字
戏剧文学
文学鉴赏
散文杂著
经典作品
民间文学
艺术
音乐
舞蹈
设计
民艺
摄影
影视
理论
鉴赏
工艺
书法
个人成长
认知思维
沟通表达
励志成长
情绪心灵
人生哲学
人在职场
心理学
发展心理学
心理学应用
心理学研究
认知与行为
社会心理学
积极心理学
计算机
图像视频
数据库
人工智能
理论知识
软件学习
编程设计
计算机综合
经济理财
商业
理财
管理
财经
人物传记
娱乐明星
艺术家
学者
文学家
女性人物
历史人物
科学家
军政领袖
传记综合
财经人物
生活百科
育儿
游戏
体育
手工
时尚
情感
命理
美食
旅游
居家
童书
阅读工具书
幼儿启蒙
少儿英语
漫画卡通
儿童文学
首页
计算机
编程设计
图书详情
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
程戈
内容简介 这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。 第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识; 第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进; 6~8章从底层技术实现的角度讲解了大语言模
加入书架
分享
开始阅读
推荐商品
三国演义
¥0.00
¥0.00
水浒传
¥0.00
¥0.00
红楼梦
¥0.00
¥0.00
热门商品
精彩点评 (0)
暂无评价
暂时没有数据
返回
顶部