本文由 简悦 SimpRead 转码, 原文地址 mp.weixin.qq.com
大家好,我是欧阳,又跟大家见面啦!
扫描文末的二维码加欧阳好友,拉你进欧阳的 AI 交流群
前言
很多同学说想学习 AI,但是不知道从哪里开始,学习路线是什么。我学习 AI 已经有一段时间了,这篇文章来聊聊我是如何学习 AI 的,欢迎各位大佬补充和指点。
我是怎么开始的
16 年的时候我是零基础自学前端,所以开始学习 AI 的时候我想将自学前端的那一套搬过来使用。
以前我是这样自学前端的:
知乎上面搜索前端学习路线和入门经典书
淘宝上面 9.9 元买培训班的前端视频
看视频、跟着视频敲代码、看书、跟着视频写项目、找工作
按照这个套路去学 AI,结果把我搞得很迷茫。
先去知乎上面去搜索 AI 学习路线,基本得到的都是这种回答:
学习 python
学习高数
学习机器学习
学习深度学习
大模型训练
大模型应用
看的我一脸蒙蔽,直接劝退。
【首先说明】不是这种路线不好,而是不适合我们这种工程师去学习(不管是前端工程师还是后端工程师)。
我们工程师擅长的是在技术更上层去做更贴近用户的产品,而不是去研究底层原理。当然你想要在技术上面有更大的突破,研究原理肯定是需要的。但是不应该在连 hello world 都还没写出来的情况下去学习底层原理。
刚刚接触 AI,上面的学习路径里面除了 python 之外,其他每个字我都认识,但是连起来我就不认识了(高数也早就还给老师了)。
知乎的学习路线图看来是行不通了(我没有在知乎找到适合工程师的 AI 学习路线图),然后我就想到了 B 站,毕竟 B 站号称 “B 站大学”。
B 站上面各种搜,最后找到看着播放量和评论都不错的系列视频。
bilibili
这个视频是培训机构发的,是往期的培训视频录播,看着播放量和评论都不错。
初看感觉干货挺多的,讲的内容我都能听懂。
现在回过头来看,里面主要就是在讲一些大模型概念和如何调用接口和框架 API。在前端深耕多年,我最擅长的就是调接口和使用框架 API 了。。。。。
所以现在回过头来看,这个算是踩坑了,浪费了不少时间。这个视频适合那种纯小白,不适合我们这种工程师。
油管学习
看完 B 站的视频后对 AI 的基础概念和 langchain 开发有了一定的了解,但是仅停留在表面。
之前关注了不少大厂的技术公众号:
我发现今年他们都只发 AI 相关的内容了,这也算是一个风向标,我也跟着这些公众号学习。但是有个问题,知识都太零散了,我现在需要的是一个有深度的成体系的小册或者系列视频。
日常学习,刷到一篇关于 Transformer 和大模型底层原理的文章:
说实话,那会儿看不懂这篇文章。于是去看这篇文章的参考资料,看到一篇很牛逼的参考文章:
从知乎的 1.5 万点赞量就可以看出来这篇文章不一般了,文章开头就推荐去看李宏毅老师的视频,作者还觉得李老师关于 Transformer 的讲解是史上最强的!
跳过文章,直接去油管上面看李宏毅老师的视频:
youtube
李宏毅老师是台湾大学的老师,油管上面每一年的系列视频都是他那一年在台大开设的课程,这刚好就是我苦苦寻找的,还是免费的。
他的讲课风格非常有趣,不会看着想睡觉。面向的是小白,但是内容很有深度。课程中的内容我基本都看懂了,之前那些大模型原理文章我看不懂可能真不是我的问题。
我看完了他的 2024 年和 2025 年的课程,基本对大模型的底层原理有了系统性的认知,还有一个 2021 年机器学习课程还没看,准备过段时间来看。
真的很推荐大家去油管看看李宏毅老师的课程!!!! 油管上面有很多免费课程比国内的那些付费课程甩了可能有几百个太阳系的距离吧。
从开源项目中学习
光看理论知识还是不够的,还是得做项目才行。要做项目肯定需要学习一个大模型的开发框架,我选择了 langchain 这个最流行的框架。
将 langchain 的文档全部看了一遍,并且也跟着文档中的例子写了一些 demo。
在看 langchain 文档的时候,发现他推荐 agent 开发使用 langgraph,所以又将 langgraph 也学了一遍。
学习完 langchain 和 langgraph 后,并且也写了一些代码。
但是总感觉自己很 “虚”,因为我一直都在研究理论和写 demo 级别的代码,不虚才有鬼了。
如何破局呢?
付费加入 AI 项目训练营?靠忽悠去找一份 agent 开发的工作?
这两个方案我觉得都不怎么靠谱。
回想一下自己入行前端的经历或许可以参考,那会儿行情不错,我入职第一家公司的时候其实和现在一样也很 “虚”。
那会儿入职后领导就给我加了一个代码仓库的权限,然后就安排开发新需求。
从没做过真实项目的我,迫于压力硬着头皮啃代码,看不懂就问隔壁的大佬,那段时间是我技术成长最快的时候。
那么如何找一个 AI 的真实项目呢?
今年国内死命卷开源大模型,那么开源 AI 项目是不是也应该有不少呢?
上 GitHub 上面一顿搜索,还真让我找到很多优秀的开源项目。
研究的第一个项目是字节开源的deer-flow,这是一个基于 langgraph 开发的深度研究 agent 项目。将项目搞懂,差不多能够达到初中级的程度。
这个项目是 python 开发的,在研究的过程中我复刻了一个 nodejs 版本,基本就将项目掌握的七七八八了。
还有一个这个月开源的清华大学教授团队的深度研究项目(我还没细看):
MiroMind
今天,经过一个季度的努力,MiroMind 正式亮相并发布我们重磅开源项目,MiroMind Open Deep Research (Miro ODR)。MiroODR 是当前开源最强 Deep Research 模型,真全开源且可复现,核心模型、数据、训练流程、AI Infra、DR Agent 框架统统开源,复现无压力。我们将以每月一次开源更新的速度,同社区一起创作最强 Deep Research 模型。
这个是真开源,基本将所有东西都开源了,很适合学习。
还有一个 vibe coding 的开源项目值得推荐去看:
这个项目中包含了前端和后端的所有代码,原名为 “OpenDevin”。从名字你应该就能看出来这个是 Devin 的开源版本,里面的项目代码复杂度很高,适合进阶学习。
总结
从现在的视角来看我之前的学习路线是有问题的,如果让我给学习路线的建议,我觉得应该是这样的:
注册大模型平台账号获取自己的 token
看 langchain 文档和 langgraph 文档,跟着文档写 demo,并且使用自己的 token 将 demo 跑起来
研究 GitHub 字节开源的 deer-flow 项目,复刻一个 js 版本
看油管上面李宏毅老师的大模型底层原理课程
研究 GitHub 上面企业级复杂度的 agent 项目
做一个自己的 AI agent 产品
期待各位大佬补充
长按图片加欧阳微信,拉你进欧阳的 AI 交流群。
因为微信公众号修改规则,如果不标星或点在看,你可能会收不到我公众号文章的推送,请大家将本公众号星标,看完文章后记得点下赞或者在看,谢谢各位!