别再乱选AI课程了——这些书才是你的正解
2025-08-03 00:00:00  36氪   [查看原文]

编者按:四年AI实战者揭穿AI课程泡沫:Python核心+PyTorch手撸GPT+MLOps部署——这三本书构建的能力护城河,胜过87%速成课,文章来自编译。

在人工智能与机器学习领域深耕四年后,我想分享所有助我成长的资源。

由于内容较多,我将它们分为以下几类:

编程与软件工程

数学与统计学

机器学习

深度学习与大语言模型

人工智能工程

编程与软件工程

想进入AI领域,编程能力与软件工程技能是必备基础。

OpenAI首席技术官Greg Brockman也支持我的观点!

32

0

举报

神译局

资深作者

除少数特例外,AI领域最具影响力的人往往是软件与机器学习都精通的专家。

跟大众的认知相反,掌握机器学习其实比精通软件工程快得多。

因此优秀软件工程师在AI领域往往潜力非凡

由于AI领域较新,其主流语言尚未定型,但Python凭借易用性和完善生态仍是首选。

当前AI岗位多由机器学习领域衍生,而Python是该领域通用语言,短期不会改变。

但最热门的AI工程师岗位更接近软件工程而非机器学习工程,因此可能需要掌握Java/GO/Rust等后端语言。

建议从Python入门(更易掌握核心工程原理),但未来可能需要转向其他语言。

尽管课程书籍众多,持续实践才是最佳导师。资源仅能带你入门,真正掌握Python(或任何语言)必须通过创造与实践。

我的Python与软件工程基础推荐:

学习Python(Learn Python — Full Course for Beginners)——我的启蒙课,仅4小时,半天即可学完

面向所有人的Python专项课程(Python for Everybody Specialization)——全网最受推崇的体系课程,想系统学习选它准没错(其他正规入门课亦可)

Hacker Rank & Leetcode——用于Python面试刷题

NeetCode——通过实战练习学习数据结构、算法与系统设计,涵盖基础到高阶内容,是绝佳的面试备战平台

哈佛CS50计算机导论(Harvard CS50 Introduction to Computer Science)——科技圈无人不晓的神课,堪称最佳计算机科学与软件工程入门,强烈推荐给所有初学者

数学与统计学

虽然多数AI工作只需部署基础模型,但想成为顶尖从业者,至少要懂模型底层原理。

以下资源足以满足数学需求,无需另寻他处:

《数据科学实用统计学》(Practical Statistics for Data Science)——若只能选一本统计书,非它莫属。专为AI/ML从业者编写,含Python实战案例

《机器学习数学基础》(Mathematics for Machine Learning)——详解机器学习与AI背后的数学原理,涵盖微积分、线性代数等。内容较深,建议重点选读,可作工具书使用

《机器学习与数据科学数学基础》专项课(Mathematics for Machine Learning and Data Science Specialization)——DeepLearning.AI新出品(著名机器学习/深度学习专项课制作方),专为AI/ML设计的数学入门课,包含微积分、线性代数、统计概率等核心内容

机器学习

当前主流AI其实指的是生成式AI(GenAI),属于机器学习分支。顾名思义,GenAI指生成文本/图像/音频/代码的算法。

但AI概念早在上世纪50年代神经网络诞生时就已存在。

甚至可追溯至二战时期——艾伦·图灵在计算机与思维机器研究中提出了"图灵测试"。

总之我想强调:AI远比当今大众的认知更加广阔,要想成为优秀的AI从业者,机器学习与传统AI的扎实基础不可或缺。

下列资源覆盖了机器学习的核心知识(若需时间序列预测/强化学习/优化算法/计算机视觉等进阶内容,可另行推荐):

《Scikit-Learn、Keras与TensorFlow机器学习实战》(Hands-On ML with Scikit-Learn, Keras, and TensorFlow)——如果只能推荐一本书,必选此本。内容惊艳,覆盖全面,末尾还谈到了大语言模型、强化学习与计算机视觉

机器学习专项课(Machine Learning Specialization)——2020年我的机器学习启蒙课,堪称史上最佳的机器学习课程。当初我是用Octave学习的,现已升级为Python教学并新增推荐系统/强化学习等前沿内容

《百页机器学习宝典》(The Hundred-Page ML Book)——百页浓缩的机器学习精华!轻量级工具书,助你快速查阅核心概念,基础讲解尤为出色

《统计学习导论》(The Elements of Statistical Learning)——掌握机器学习(本质即统计学习)根基的绝佳教材,真正传授学科精髓

深度学习与大语言模型

如上图所示,深度学习是AI大类中的子集,属于机器学习分支。

当前所有生成式AI算法皆源于此,你会在这个领域深入理解大语言模型、扩散模型、Transformer等基础架构的运作原理。

PyTorch官方教程(PyTorch Tutorials)——深度学习框架必选其一,目前的行业双雄为PyTorch与TensorFlow。建议主攻PyTorch(近年势头更劲):2021年约77%研究论文采用这一框架,HuggingFace平台92%模型为其专属

深度学习专项课(Deep Learning Specialization)——机器学习专项课的进阶篇。学习卷积神经网络/循环神经网络的优质课程,含大语言模型导论,可谓深度学习最佳入门

Andrej Karpathy的(特斯拉前AI总监)《大语言模型入门》——1小时科普视频讲解LLM原理与应用。强烈推荐给所有人(包括非技术背景者),内容宏观易懂

《神经网络:从零进阶》(Neural Networks: Zero to Hero,作者也是Andrej Karpathy)——从零搭建神经网络,起步节奏平缓,但最终视频将带你亲手构建GPT模型!AI从业者必修课

《动手学大语言模型:语言理解与生成》(Hands-On Large Language Models: Language Understanding and Generation)——LLM教材稀缺(近年才成主流),但此书广受好评。合著者Jay Alammar曾撰Transformer最佳科普博文,获吴恩达背书

人工智能工程

至此你已全面掌握了AI(特别是LLM与GenAI)的理论与实践版图。

真正的价值在于将AI模型转化为产品,因此需学习算法产品化部署技能,让技术为企业与客户创造价值。

多数AI岗位其实是"AI工程师",其工作性质更接近传统软件工程而非机器学习工程。

核心工作是运用Llama/GPT-4/Claude等基础GenAI模型开发产品,极少涉及模型开发——主要是因为训练成本过高,且现有的基础模型已足够强大!

《实用MLOps指南》(Practical MLOps)——模型部署领域唯一的必备书。我主要用作工具书,内容覆盖容器化/脚本编写/云系统/模型监控等全流程

《人工智能工程实践》(AI Engineering)——当红教材。作者Chip Huyen是生产环境ML/AI系统权威专家,斯坦福课程主讲人,品质保证

学习资源浩如烟海,关键要化繁为简,即刻行动。核心知识体系大同小异,选任何资源都不会错。

谨以AI领域顶尖研究者Andrej Karpathy的推文祝你征程顺利:

成为领域专家的秘诀:

纵向深挖:通过具体项目实践"按需学习"(拒绝填鸭式横向学习)

知识反刍:用自己的语言总结/传授所学

自我超越:只与昨天的自己比较,永远不跟他人攀比

译者:boxi。

本栏目中的所有页面均系自动生成,自动分类排列,采用联索网络信息采集、网页信息提取、语义计算等智能搜索技术。内容源于公开的媒体报道,包括但不限于新闻网站、电子报刊、行业门户、客户网站等。使用本栏目前必读