编者按:四年AI实战者揭穿AI课程泡沫:Python核心+PyTorch手撸GPT+MLOps部署——这三本书构建的能力护城河,胜过87%速成课,文章来自编译。
在人工智能与机器学习领域深耕四年后,我想分享所有助我成长的资源。
由于内容较多,我将它们分为以下几类:
编程与软件工程
数学与统计学
机器学习
深度学习与大语言模型
人工智能工程
编程与软件工程
想进入AI领域,编程能力与软件工程技能是必备基础。
OpenAI首席技术官Greg Brockman也支持我的观点!
32
0
举报
神译局
资深作者
除少数特例外,AI领域最具影响力的人往往是软件与机器学习都精通的专家。
跟大众的认知相反,掌握机器学习其实比精通软件工程快得多。
因此优秀软件工程师在AI领域往往潜力非凡
由于AI领域较新,其主流语言尚未定型,但Python凭借易用性和完善生态仍是首选。
当前AI岗位多由机器学习领域衍生,而Python是该领域通用语言,短期不会改变。
但最热门的AI工程师岗位更接近软件工程而非机器学习工程,因此可能需要掌握Java/GO/Rust等后端语言。
建议从Python入门(更易掌握核心工程原理),但未来可能需要转向其他语言。
尽管课程书籍众多,持续实践才是最佳导师。资源仅能带你入门,真正掌握Python(或任何语言)必须通过创造与实践。
我的Python与软件工程基础推荐:
学习Python(Learn Python — Full Course for Beginners)——我的启蒙课,仅4小时,半天即可学完
面向所有人的Python专项课程(Python for Everybody Specialization)——全网最受推崇的体系课程,想系统学习选它准没错(其他正规入门课亦可)
Hacker Rank & Leetcode——用于Python面试刷题
NeetCode——通过实战练习学习数据结构、算法与系统设计,涵盖基础到高阶内容,是绝佳的面试备战平台
哈佛CS50计算机导论(Harvard CS50 Introduction to Computer Science)——科技圈无人不晓的神课,堪称最佳计算机科学与软件工程入门,强烈推荐给所有初学者
数学与统计学
虽然多数AI工作只需部署基础模型,但想成为顶尖从业者,至少要懂模型底层原理。
以下资源足以满足数学需求,无需另寻他处:
《数据科学实用统计学》(Practical Statistics for Data Science)——若只能选一本统计书,非它莫属。专为AI/ML从业者编写,含Python实战案例
《机器学习数学基础》(Mathematics for Machine Learning)——详解机器学习与AI背后的数学原理,涵盖微积分、线性代数等。内容较深,建议重点选读,可作工具书使用
《机器学习与数据科学数学基础》专项课(Mathematics for Machine Learning and Data Science Specialization)——DeepLearning.AI新出品(著名机器学习/深度学习专项课制作方),专为AI/ML设计的数学入门课,包含微积分、线性代数、统计概率等核心内容
机器学习
当前主流AI其实指的是生成式AI(GenAI),属于机器学习分支。顾名思义,GenAI指生成文本/图像/音频/代码的算法。
但AI概念早在上世纪50年代神经网络诞生时就已存在。
甚至可追溯至二战时期——艾伦·图灵在计算机与思维机器研究中提出了"图灵测试"。
总之我想强调:AI远比当今大众的认知更加广阔,要想成为优秀的AI从业者,机器学习与传统AI的扎实基础不可或缺。
下列资源覆盖了机器学习的核心知识(若需时间序列预测/强化学习/优化算法/计算机视觉等进阶内容,可另行推荐):
《Scikit-Learn、Keras与TensorFlow机器学习实战》(Hands-On ML with Scikit-Learn, Keras, and TensorFlow)——如果只能推荐一本书,必选此本。内容惊艳,覆盖全面,末尾还谈到了大语言模型、强化学习与计算机视觉
机器学习专项课(Machine Learning Specialization)——2020年我的机器学习启蒙课,堪称史上最佳的机器学习课程。当初我是用Octave学习的,现已升级为Python教学并新增推荐系统/强化学习等前沿内容
《百页机器学习宝典》(The Hundred-Page ML Book)——百页浓缩的机器学习精华!轻量级工具书,助你快速查阅核心概念,基础讲解尤为出色
《统计学习导论》(The Elements of Statistical Learning)——掌握机器学习(本质即统计学习)根基的绝佳教材,真正传授学科精髓
深度学习与大语言模型
如上图所示,深度学习是AI大类中的子集,属于机器学习分支。
当前所有生成式AI算法皆源于此,你会在这个领域深入理解大语言模型、扩散模型、Transformer等基础架构的运作原理。
PyTorch官方教程(PyTorch Tutorials)——深度学习框架必选其一,目前的行业双雄为PyTorch与TensorFlow。建议主攻PyTorch(近年势头更劲):2021年约77%研究论文采用这一框架,HuggingFace平台92%模型为其专属
深度学习专项课(Deep Learning Specialization)——机器学习专项课的进阶篇。学习卷积神经网络/循环神经网络的优质课程,含大语言模型导论,可谓深度学习最佳入门
Andrej Karpathy的(特斯拉前AI总监)《大语言模型入门》——1小时科普视频讲解LLM原理与应用。强烈推荐给所有人(包括非技术背景者),内容宏观易懂
《神经网络:从零进阶》(Neural Networks: Zero to Hero,作者也是Andrej Karpathy)——从零搭建神经网络,起步节奏平缓,但最终视频将带你亲手构建GPT模型!AI从业者必修课
《动手学大语言模型:语言理解与生成》(Hands-On Large Language Models: Language Understanding and Generation)——LLM教材稀缺(近年才成主流),但此书广受好评。合著者Jay Alammar曾撰Transformer最佳科普博文,获吴恩达背书
人工智能工程
至此你已全面掌握了AI(特别是LLM与GenAI)的理论与实践版图。
真正的价值在于将AI模型转化为产品,因此需学习算法产品化部署技能,让技术为企业与客户创造价值。
多数AI岗位其实是"AI工程师",其工作性质更接近传统软件工程而非机器学习工程。
核心工作是运用Llama/GPT-4/Claude等基础GenAI模型开发产品,极少涉及模型开发——主要是因为训练成本过高,且现有的基础模型已足够强大!
《实用MLOps指南》(Practical MLOps)——模型部署领域唯一的必备书。我主要用作工具书,内容覆盖容器化/脚本编写/云系统/模型监控等全流程
《人工智能工程实践》(AI Engineering)——当红教材。作者Chip Huyen是生产环境ML/AI系统权威专家,斯坦福课程主讲人,品质保证
学习资源浩如烟海,关键要化繁为简,即刻行动。核心知识体系大同小异,选任何资源都不会错。
谨以AI领域顶尖研究者Andrej Karpathy的推文祝你征程顺利:
成为领域专家的秘诀:
纵向深挖:通过具体项目实践"按需学习"(拒绝填鸭式横向学习)
知识反刍:用自己的语言总结/传授所学
自我超越:只与昨天的自己比较,永远不跟他人攀比
译者:boxi。